直播中
重復的內(nèi)容一般是指在不同域名間存在大量的相同或相似的內(nèi)容。很多時候,它并非故意或至少本無惡意。譬如說,有些論壇會生成一些專為手機屏幕的頁面;商店物品被顯示在(有時甚至是鏈接到)多種不同的URL上,等等。但有些時候,一些網(wǎng)站為了操縱搜索引擎排名,獲得更多流行或長尾查詢的訪問量,大量地從其他網(wǎng)站復制內(nèi)容。一般網(wǎng)站的重復內(nèi)容有3種情況,網(wǎng)站本身的內(nèi)容重復;網(wǎng)站因為URL的設置問題導致的內(nèi)容重復;網(wǎng)站內(nèi)容采集。
什么不是重復內(nèi)容?
雖然谷歌網(wǎng)站有方便易用的翻譯功能,我們的算法不會把有著相同內(nèi)容的英文版和西班牙文版看作內(nèi)容復制。同樣,你不用擔心我們把你文章中對其他文章小片段的引用認定為重復內(nèi)容。
為什么谷歌關心重復內(nèi)容?
谷歌用戶使用Google時通常希望看到多樣化的原創(chuàng)內(nèi)容。如果他們找到的都是內(nèi)容相同的一堆搜索結果,可以想見那是多么煩人。另外,網(wǎng)站管理員不愿意看到Google給出象example.com/contentredir?&#118alue=shorty-george〈=en一樣復雜的URL。他們往往更喜歡類似example.com/en/shorty-george.htm的URL,因為URL設置導致的重復內(nèi)容是非常冤的一件事情。
谷歌做了些什么?
Google在抓取網(wǎng)頁和獲得搜索結果時,總是力圖索引并顯示內(nèi)容不同的頁面。這種過濾意味著,譬如說,如果你的網(wǎng)站有文章的正常版和打印版,并且你沒有在robots.txt里設定noindex標記,谷歌就只會選擇一個版本顯示給谷歌用戶。對于企圖利用復制內(nèi)容來操控排名,欺騙谷歌用戶的少數(shù)情況,我們會在對相關頁面的索引和排名作出適當調(diào)整。當然,我們更愿意把重點放在過濾而不是排名調(diào)整上… 因此,在絕大多數(shù)情況下,最壞的結果就是原創(chuàng)者看到了不愿看到的版本出現(xiàn)在我們的索引里。(重點放在過濾而不是排名調(diào)整上)
網(wǎng)站管理員如何主動處理內(nèi)容復制問題?
1、適當阻止搜索引擎訪問:與其讓我們的算法來確定一個文件的“最佳”版本,你也許希望指引谷歌選取你的首選版本。譬如說,如果你不想我們索引你網(wǎng)站文章的打印版,你可以在你的robots.txt文件中寫上目錄名或正則表達式來禁止谷歌對那些打印版的抓取。
2、使用301重定向:如果你已經(jīng)重構你的網(wǎng)站,請在你的原網(wǎng)站的.htaccess中使用301重定向(永久性重定向)來重定向你的用戶、Google爬蟲、以及其他搜索引擎蜘蛛等。