如何解決網(wǎng)站內(nèi)容的重復性問題的方法(網(wǎng)頁出現(xiàn)重復問題怎么辦)
發(fā)布日期:2024-02-18 18:00瀏覽次數(shù):
如何解決網(wǎng)站內(nèi)容的重復性問題的方法(網(wǎng)頁出現(xiàn)重復問題怎么辦)網(wǎng)站重復內(nèi)容頁面過多會造成資源和精力的浪費、關(guān)鍵詞的內(nèi)部競爭,還會分散權(quán)重,得不償失。若是因為站內(nèi)重復內(nèi)容頁面過多被搜索引擎誤判為采集站就麻煩了。
SEO
從某種意義上來說,采集站實際上是摘取他人的勝利果實,觸碰了颶風算法,會直接被搜索引擎懲罰,網(wǎng)站被降權(quán)清零。
一、同站消除重復內(nèi)容的方法
1、因網(wǎng)址規(guī)范化造成的重復內(nèi)容
解決辦法:確保一篇文章只對應一個URL,不要出現(xiàn)多個版本,網(wǎng)站所有內(nèi)部鏈接統(tǒng)一鏈接到這個URL,某些時候可以使用301轉(zhuǎn)向。
2、非網(wǎng)址規(guī)范化造成的重復內(nèi)容
解決方法:選取一個版本允許收錄,其他版本禁止搜索引擎抓取或收錄。
1)使用robots文件禁止抓取。
2)使用noindex meta robots標簽禁止索引。
3)特殊情況可以使用Nofollow、JavaScript等阻止蜘蛛爬行,這個方法我們不建議使用。
4)使用canonical標簽對網(wǎng)址進行規(guī)范化,也可以用在其他情況下。比如:
?。?)電商網(wǎng)站同一款式,不同顏色型號的產(chǎn)品,可以使用canonical標簽把權(quán)重集中在其中一種型號上。
?。?)帶有Session ID的頁面也可以使用canonical標簽,如頁面http://網(wǎng)址/page-a.html放上如下代碼:
這樣,后面無論生成什么樣的Session ID:
http://網(wǎng)址/page-a.html?sessionid=86461
http://網(wǎng)址/page-a.html?sessionid=85427
上面的URL都會被搜索引擎把權(quán)重集中到http://網(wǎng)址/page-a.html頁面上。
二、不同網(wǎng)站重復內(nèi)容的解決方法
不同網(wǎng)站之間重復內(nèi)容解決起來比較麻煩,因為其他網(wǎng)站上的內(nèi)容是無法控制的,基于此,良家佐言,有兩點建議:
1、在頁面中加入版權(quán)聲明,要求轉(zhuǎn)載的網(wǎng)站保留版權(quán)聲明及指向原出處的鏈接。
注:有些聚合網(wǎng)站會抓取feed自動生成的內(nèi)容,所以在feed中加入版權(quán)聲明和鏈接很有必要。
一般來說,原創(chuàng)版本外部鏈接會比轉(zhuǎn)載多一些,這兩年中文網(wǎng)站也開始有意識地維護版權(quán)問題,很多站長轉(zhuǎn)載愿意保留鏈接和出處。
2、堅持原創(chuàng)內(nèi)容,假以時日必能夠增加網(wǎng)站權(quán)重,使網(wǎng)站上內(nèi)容被判為原創(chuàng)的機會增加。
注:若有其他網(wǎng)站大量抄襲獲得排名,可以聯(lián)系對方加上版權(quán)或刪除抄襲內(nèi)容,或者向搜索引擎投訴。
網(wǎng)站優(yōu)化的過程中,SEO人員都要經(jīng)歷給網(wǎng)站填充的內(nèi)容的階段,這個時候,如果我們不合理的規(guī)劃好內(nèi)容的更新,很容易導致網(wǎng)站內(nèi)容出現(xiàn)重復的問題。而網(wǎng)站內(nèi)容重復的問題,是SEO的大忌,SEOer都知道,當網(wǎng)站內(nèi)容重復度過高的時候,搜索引擎就會認為該網(wǎng)站的內(nèi)容質(zhì)量非常差,那么搜索引擎肯定就會針對性的打擊這類網(wǎng)站,所以我們SEO在給網(wǎng)站填充內(nèi)容的時候,一定要避免內(nèi)容重復的問題,要不然做了很長時間的網(wǎng)站,因為這個問題導致網(wǎng)站被搜索引擎懲罰,降權(quán)掉排名就得不償失了。然而很多SEO/站長不知道該如何判斷網(wǎng)站內(nèi)容的重復性,以及如何解決。針對此問題筆者今天就來講解下內(nèi)容重復的解決方法。
一、網(wǎng)站內(nèi)容重復的范疇
1、內(nèi)容重復 常見的就是文章,在網(wǎng)站內(nèi)同一文章出現(xiàn)多次的情況,即便文章是原創(chuàng),同樣會影響到網(wǎng)站的整體發(fā)展,所以我們在建設(shè)網(wǎng)站內(nèi)容的時候,一定要留意這個問題。
2、網(wǎng)站固定版塊重復性過高,目前很多網(wǎng)站都是采用開源的cms系統(tǒng),很多頁面都是采用固定的版塊,而這些版塊內(nèi)容都是長期不更新的,如此以來會出現(xiàn)千篇一律的內(nèi)容,造成網(wǎng)站內(nèi)容重復性過高,影響網(wǎng)站的整體質(zhì)量。
3、網(wǎng)站既有動態(tài)頁面又有靜態(tài)頁面存在,當搜索引擎蜘蛛來抓取時,就會發(fā)現(xiàn)這些頁面除了路徑不同,其他內(nèi)容都是一樣的,這樣的問題,我們應該在網(wǎng)站建設(shè)的時候就要規(guī)避。
4、網(wǎng)站各個頁面的圖片元素很多,文字內(nèi)容過少,大部分圖片的url地址都是大同小異的,這中情況也可能被搜索引擎認為是重復性的內(nèi)容,不利于網(wǎng)站的長久發(fā)展。所以我們在設(shè)置圖片地址的時候,就要避免這個問題
二、如何檢查網(wǎng)站內(nèi)容是否重復
1、檢查各個頁面是否存在很多樣板文字,如果樣板文字過多,重復性肯定很高 。
2、可以通過從文章首段復制一段文字,在搜索引擎的搜索框進行搜索,前提是該文章被收錄了。如果發(fā)現(xiàn)大量飄紅文字,則說明這篇文章重復性過高。
3、還可以在站內(nèi)搜索文章標題的關(guān)鍵詞查詢出相似度過高或重復的內(nèi)容。
4、利用頁面相似度檢測工具,判斷一些相鄰頁面的相似度,80%以上相似度就需要對一些固定欄目進行處理。
三、網(wǎng)站內(nèi)容的重復性解決方法
1、原創(chuàng)內(nèi)容
想要避免網(wǎng)站內(nèi)容重復性過高,原創(chuàng)內(nèi)容 容易做到,搜索引擎通常都喜歡原創(chuàng)、高質(zhì)量的內(nèi)容,對于用戶來說更是如此,如果能夠持續(xù)更新原創(chuàng)內(nèi)容,就可以從根本上避免文章重復度過高的問題。
2、網(wǎng)站各個頁面設(shè)置獨立meta屬性
每一個網(wǎng)頁都有獨一無二的meta屬性標簽,所以各個頁面 是設(shè)置獨立的關(guān)鍵詞和描述內(nèi)容,并且盡可能的手動編輯,才能有效降低meta標簽的重復性。
3、網(wǎng)站固定版塊內(nèi)容隨意展示
雖然有些頁面不能避免會出現(xiàn)固定的版塊,但是將這些版塊的內(nèi)容設(shè)置為隨意展示,也就可以減少網(wǎng)站內(nèi)容的重復性了。
4、網(wǎng)站圖片多樣化
各個網(wǎng)頁的圖片 不要用同樣的圖片,并且在給圖片設(shè)置地址的時候,也要做到避免用同樣的地址。雖然目前搜索引擎不能完全識別圖片內(nèi)容,但是對圖片大致的情況,還是能夠辨別出來的。
總結(jié):網(wǎng)站內(nèi)容是一個網(wǎng)站運營發(fā)展的基礎(chǔ),高質(zhì)量的內(nèi)容可以讓用戶以及搜索引擎的更加喜歡,但是重復、抄襲或采集內(nèi)容就會對網(wǎng)站產(chǎn)生負面的影響。因此,我們在網(wǎng)站建設(shè)初期就應該規(guī)劃好網(wǎng)站各個欄目分類應該發(fā)布什么樣的內(nèi)容,而不是想到什么內(nèi)容就隨意的發(fā)布在網(wǎng)站上。網(wǎng)站上線后應該優(yōu)化好網(wǎng)站內(nèi)容,降低網(wǎng)站內(nèi)容的重復性。