2017年7月7日,百度正式推出“颶風算法”
從官方文檔中來看,颶風算法的命中對象是站點,而不是網頁;主要是針對以惡劣采集為內容主要來源的網站,而不是所有包含惡劣內容的站點。
惡劣采集內容,一般是指沒有花費時間,精力,專業(yè)能力,人工整合的內容,或者說對用戶沒有任何附加價值的內容。
這部分內容有以下幾種類型:
1、從其他站點采集的內容
包括整個頁面內容都是采集、主題內容是采集,或者多篇采集拼湊成的內容。這種類型內容很容易被識別。
2、采集之后輕度加工的內容
包括修改了部分詞語,修改了部分句子,或者使用單詞批量替換的形式(部分偽原創(chuàng)工具)。這種類型的識別難度稍微大一點。
3、從某些動態(tài)站點采集的內容
包括采集其他搜索引擎的搜索結果,采集新聞feed流。
注意幾個要點:主體內容、惡劣采集、附加價值。
也有朋友問,為什么有些網站也是采集的,但沒有受到影響,比如某doc、某浪。其實只要做到某個要點,就不算是惡劣采集,這個要點就是:給用戶帶來附加價值。
附加價值有站點增益和內容增益兩種。這個時候可以引用百度搜索技術博客《淺談互聯(lián)網頁面價值》的一段內容:
某人發(fā)表了一篇針對某新聞事件的原創(chuàng)博客,隨后被新浪轉載到了新聞頻道。從描述的內容上講,這是一種重復。但這種重復僅僅是主體內容上的重復,一方面它的轉載帶來了訪問速度、穩(wěn)定性等方面的增益,并且之后的檢索用戶還有可能用“新聞事件+新浪”來檢索此新聞。這可以被稱之為站點增益。另一方面,它在轉載過程中可能會改變頁面的標題,而且依托其受眾,在轉載頁面上,還有可能出現(xiàn)更多的有價值評論和回復等,還有可能存在指向其它相關事件的新聞鏈接。這些可以被稱之為內容增益。因此即使主題內容沒有任何變化,新浪的這次轉載也是有價值的,其稀缺度也是較高的。
同樣,反過來說,如果轉載的網站相當不知名,則其無法帶來站點名/穩(wěn)定性/速度的增益。更有甚者,轉載之后在頁面上加入大量廣告妨礙閱讀,或者只轉載了內容中不完整的一部分,這樣的轉載,或者說采集,就是純重復的,與采集源相比,就是沒有檢索價值的了。
綜上所述,對于主體內容重復的頁面,我們應該評價其是否存在站點增益和內容增益,只有對于大量完全無增益的重復頁面,我們才應該認為其稀缺度較低。
這里的要點是:頁面價值、增益
因此說,只要能夠帶來站點增益,內容增益,給用戶帶來附加價值,那就表明這個網頁有其獨特的價值,是不會被颶風算法命中的。
自百度推出“颶風算法”,首先中招的有這些大家熟悉的站。
7月7日中槍網站,大部分是范文類
7月6日中槍網站,大部分是范文類
躺槍案例:
t262。com
sanwen8。cn
牛bb文章網
針對颶風算法的影響,百度一朋友透露說:
颶風算法主要是針對沒有價值的采集,一旦中招沒有任何解法。而被誤傷的優(yōu)質原創(chuàng)可以通過反饋中心申訴。
因此,一旦被颶風算法命中,只要不是明顯誤傷,短期內都沒有辦法解決。(被搜素引擎算法命中,一般都是普遍存在的,不被搜素引擎接受的做法,一般沒辦法申訴,Google也是如此。只有人工處理的能申訴。)
采集會被算法懲罰,而內容完全原創(chuàng),成本又非常高。那如何生成內容,而又不被颶風算法懲罰呢。其實還是圍繞內容增益上去解決,有幾個解決方法:
1、增加用戶點評模塊
頁面增加用戶點評模塊,當有用戶點評之后,點評內容也會成為網頁內容的一部分,產生了額外價值。作為用戶,在閱讀完內容之后,也希望看一下真實用戶的意見,比如這個內容是否屬實,信息是否失效,有沒有額外的提醒等。
不過要注意的是,點評內容最好是在源碼中實現(xiàn),而不是在JS中(方便搜素引擎識別)。
推薦工具:友言,wumii(不保證內容出現(xiàn)在源碼中)
實現(xiàn)難度:★★★
安全程度:★★★★
示例:網易新聞跟帖
2、增加內容推薦模塊
根據網頁主題,添加相關的內容模塊,比如延伸閱讀,之前報道,相關閱讀等。作為用戶,可以更加詳細完整的了解事件的發(fā)展,比如關于“張藝興”的一篇新聞,可以了解他之前參加過什么活動,有什么緋聞,參與的極限挑戰(zhàn)的進展情況等。這些對用戶來講,都是非常有價值的。
實現(xiàn)思路:一種是人工編輯;一種是算法實現(xiàn),比如根據TF-IDF提取出主體關鍵詞,再拿關鍵詞去跟歷史內容匹配。
實現(xiàn)難度:★★★★
安全程度:★★★★
示例:網易新聞下的延伸閱讀
3、內容整合
根據主題,將多篇內容整合為一篇。跟之前內容相比,整合后的內容更加豐富,可以滿足用戶更多需求。比如一篇“夢見老虎”的內容,如果能夠添加“夢見老虎吃人”、“夢見被老虎追”等內容,將會更可能命中用戶的夢境。
另一種比較常見的就是專題頁,將相關主題的內容全部組織起來,按照重要程度安排內容布局。這種專題頁有運營小伙伴編輯的,也有程序生成的(使用開源搜索引擎,比如Lucene,Sphinx,Xapian)。
示例:網易 - 香港回歸20周年專題
4、申請百度原創(chuàng)
如果確實是優(yōu)質原創(chuàng)內容,還是推薦加入百度原創(chuàng)保護項目。目前這個項目在內側階段,需要百度邀請加入。
如果你的網站已經中了“颶風”,如何恢復網站排名呢?以上海seo看來,你只能照如此做,然后看百度的反應吧。
1、如果你采集了,請自行刪除采集內容,并用robots.txt進行處理,堅持原創(chuàng),坐等百度老太太給你伸出橄欖枝;
2、警告:如果你的內容都是抄襲的,而且每天發(fā)布數(shù)量較多(超過100條且沒多少原創(chuàng)),即便沒采集,估計將來也會中颶風,百度目前的思想是建立一個綠色生態(tài),他老人家并不希望互聯(lián)網上有大量重復的內容,因為沒有價值。
3、隨著數(shù)據的增加,百度也肯定惱火大量重復內容給搜索引擎帶來的困擾,因為你去做搜索引擎,也不希望遇到這種麻煩,成本問題、算法問題、大站建立群站騙取流量問題,都頭疼。
4、時代變了,將來能夠存活下來的站點,一定是有較多高質量原創(chuàng)內容的網站,內容為王的時代已經開啟革命,也只有這樣,百度才有玩內容推介的資本,才不會被大量自媒體分走流量和客戶,事關存亡,百度不會希望中國也出現(xiàn)一個facebook,微信自媒體、頭條等,一個是社交流量,一個是原創(chuàng)生態(tài),都越來越強大。
以上就是類似于SEO知識 HITS鏈接分析算法的內容,如果想要了解關于事件營銷是什么及app網頁設計,可直接點擊查看