6月22日和6月28日的百度反作弊大更新對于相當一部分站長來說是一個噩夢,許多網站都被K掉,從官方數據來看,說是5%的流量已經被調整,我想這個數字只多不少,我舉我自身的一個例子。本人的友情鏈接有33個,當初挑選時都是一些排名很好,pr為3或4的企業網站,經過28日之后,我再檢查自己的友情鏈接,已經有7個網站被K掉了。所幸的我比較懶,每天只更新一篇文章,而且這篇文章完全由我自己原創,所以在這次百度地震中,我的排名沒有太大影響。
昨天,百度站長平臺針對22號28號大量網站懲罰做出了說明,其中有兩句話特別引人注目,第一句是百度更新了部分反作弊策略和特征,這些策略在6月21日逐漸生效。第二句話是對低質量文章的定義:低質量站點是指無原創, 或者偽原創(很少原創內容, 大量采集的內容)。從這兩句話可以悲觀的看出,這只是一個開始,而且被K的網站也很難會被恢復了,以后只靠轉載文章也很難養活網站了。
那么百度是如何判斷文章是不是偽原創呢
百度蜘蛛在抓取文章之后,經過一定處理將一些多余沒有多大意義的字去掉,例如“因為”“的”“了”等等,把整個文章變成眾多關鍵字的集合。然后計算各個關鍵詞的密度,再和他數據庫里的其他文章進行對比,如果這些文章關鍵詞數量一樣,密度也一樣的話。那么百度就為認為這是一篇偽原創。當這些關鍵詞的數量和密度有百分之五十以上不一樣時,百度才會認為這篇文章是原創文章。
這個原理也是從搜索原理書上看到的,我想這個規則同樣適合百度作弊大更新之后的策略,不會發生太大變化。那么以后眾多個人站長如何去進行高質量的原創和偽原創呢?
首先是用戶體驗,最基本的就是用戶能讀通順這篇文章,有些工具偽原創的文章根本不能看,完全是為了百度制造。其次文章盡量用手打上去,減少復制加黏貼,對于發帖時間百度也能統計到,那些一分鐘發好幾篇文章很定有問題,只是百度以前沒有過多關注,這次百度更新之后還能不能允許站長這么瘋狂就不得而知了,可以肯定的是采集軟件群發這個做法已經過時了。
針對我以上的百度規則,我給大家介紹兩種偽原創方法:
1 文章改寫
將文章的首段和尾段刪掉,然后自己撰寫,搜索引擎是從上到下抓取的,第一段是百度蜘蛛最先看到的,而最后一段文字是帶蜘蛛離開的。更重要的是改寫的文字盡量多一些,如果原文字首段為20個字,那么你改寫的文字至少為40個字,這樣才會引起蜘蛛的興趣。
2 翻譯軟件的巧妙使用
選擇一篇文章,最好是比較老或者轉載次數較少的文章,用翻譯軟件翻譯成英文在翻譯成中文,不斷轉換,轉換幾次,原來的文章就面目全非了,然后你自己在通讀一遍,把語句不通順的地方改掉,滿足最基本的用戶體驗。
過多的方法我就不介紹了,這兩種方法想必大家都知道,用的人想必就很少了,畢竟還要自己去改寫,但經過這次百度反作弊大更新之后,那種一開軟件就坐著數錢的日子已經不在了,站長們也要跟著不斷的進化。文章原創于北京網站建設http://www.bygw.net ,轉載請附帶鏈接,謝謝。