每個站長都深知網站內容為王,內容至上的道理,可以毫不夸張的說一個網站的內容是網站的根基,是網站的靈魂,內容空洞、一無用處內容的網站在搜索引擎數據庫中沒有立足的位置。而現實是從一個網站上線開始信息填充到網站中、后期的逐漸壯大網站的羽翼逐漸豐滿,網站的信息增加成了每個站長必不可少,又很頭疼的事,采集軟件的出現可以說解決了很多站長苦惱,很多站長心里都知道原創好,但是現實的局限性往往還是或多或少的使用采集軟件進行文章的更新,百度6月風暴的動蕩出發點之一也就是打擊采集站,這也使得很多使用過采集的站遭到重創。今天天堂有路就網站的信息的采集感悟一二三。
我們都知道搜索引擎本身對網站的收錄就是一個網站采集的過程,搜素引擎采集網站內容的更好目的就是為了更好的服務于搜索用戶,它對一篇文章的被采集度并不是大家說的100%反對,就拿一篇新聞稿來說如果只有一個網站發表就談不上信息的傳播,只有新聞稿被另一個網站采集、復制、發表這樣才能形成一個新聞的傳播過程,這中間搜索引擎起著擊鼓傳花的作用,它把一篇文章在不同發表的網站信息收錄起來,形成一個新聞的傳播鏈,從而展示個搜搜用戶。但是搜索引擎對信息采集是有限制的,那就是傳播網站的數量和網站的重要性,也就是我們俗稱的權重,在這個我對網站的采集希望做到以下幾點:
1、新站上線,切忌采集,道理很簡單你的資格不夠,網站練最基本的權重都沒有,在搜索引擎的規格中沒有傳播服務信息的必要,所以這就造成了很多新站久久不收錄的原因。站長們還是苦練內容寫原創吧。
2、網站有個基本的權重后,站長還是原創為主,人工采集為主,采集的文章最好在搜索引擎框里面搜索一下,如果搜索結果有幾十個相同的文章,這種信息頁是沒有必要填充的文章。如果搜索結果只有10個左右,這種文章站長好好的進行偽原創還是可以填充到網站上的。
3、網站的權重到了一定比例的時候,隨著網站的話語權的進一步提高,每天的原創保持一篇,其他都采用人工采集,進行偽原創加工就足以應付網站每天的更新、收錄了。
4、網站牛氣沖天,到了騰訊、新浪、網易的話,這時候網站的話語權不是一般的高了,這時候簡直可以說你是搜索引擎的VIP客戶了,網站每天的信息的發布就是搜索引擎信息傳播鏈中一個不可或缺的環節了。這時候網站有成千上萬的頁面,每天信息的采集成為了一個必不可少的工作。
總之,網站的信息采集要根據網站的權重和信息在搜索引擎中的已傳播數量決定,新站的信息是個每個網站打基礎的時候,基礎務實是非常有必要的,只有基礎牢固了,才能才每天、每星期、每月的百度更新中占得先機。本文發表博客地址http://blog.sina.com.cn/1976xiaoyu