大家好,我是魏東東!對于很多站長來說,分析iss日志都知道很重要,但是卻很少去重視它。通常網站的基本數據都可以通過ga又或者百度統計、站長工具可以查到,但是有些東西想通過這些常用的 工具并不能全名鏈接網站的一些細節方面。比如說蜘蛛的爬去方式。通過iss日志我們可以很好的觀察到網站被搜索引擎蜘蛛爬去的方式。那么我們為何要進行網站日志分析呢。大 家可能發現自己網站的內頁,通常情況下,搜索引擎不都是能收錄你網站的內容頁。這在一方面其實跟我們的蜘蛛爬去的方式可能存在一定的關系。
iss日志我們可以做些什么呢?
1、可以間接的分析網站的外鏈效果
2、我們的空間的好壞
3、蜘蛛對我們的頁面哪些頁面比較喜歡哪些頁面不喜歡?
4、蜘蛛什么時候頻繁訪問我們的網站,我們究竟什么時候需要更新網站內容
通常我們看我們的iss日志的時候,通常情況下是看有多少的200狀態嗎,那么iss日志就那么點功能吧,其實不然,下面通過一些方面給大家介紹一下為什么seoer要養成看日志的習慣。
一、iss日志重要型表現在那些方面?
1.通過iss日志我們可以間接的發現蜘蛛在爬去你網站的時候的頻繁度,外鏈的數量其實可以間接的反應你網站的的外鏈做的成功度。蜘蛛通過外部鏈接來爬去你網站的的時 候的內容,可以通過iss日志發現蜘蛛的抓取方式與軌跡。
2.iss日志的更新頻率與網站的內容更新頻率有一定的關系,網站的更新同時與網站的微調也有一定的關系!這些我們同時可以通過網站的iss日志可以看見
3.我們可以通過iss日志去發現我們空間那些地方出現問題了。這些東西都可以提前做好預警。通過iss日志分析我們可以間接的分析出一個網站空間的穩定性,我們可以很好
的發現到底哪個空間商不錯!
4.通過蜘蛛我們可以發現到底哪些頁面蜘蛛頻繁抓取,這些頁面頻繁抓取對于我們的帶寬嚴重浪費。所以我們就要好好的分析這些頻繁的頁面到底是哪些頁面老是被頻繁抓取,而 這些頁面對你并沒有多大的作用,那么我們可以通過網站的robots,屏蔽這些頁面被頻繁抓取。
二、如何下載日志及日志設置注意事項?
1.首頁我們的空間log日志分析文件中會出現這個iss記錄文件通過ftp從下載到本地。然后我們通過一些常用的日志分析工具可以發現一些規律,推薦大家使用光年日志分析 工具
2.對于大型網站一個iss日志會很大,用工具打開的時候會造成死機,對于小型的網站我們會發現還可以,可是大網站的話,確實是一件難事,不過我們可以采用即時下載 iss日志。會很好的解決這些問題,不過目前很多情況下發部分日志分析工具都可以解決這些問題,具體問題具體分析吧
三、iss日志的具體分析。
1.日志的后綴名是log的我們用記事本打開,選擇格式里的自動換行這樣看起來方便,對于BaiduSpider和Googlebot
百度蜘蛛
2012-03-13 00:47:10 W3SVC177 116.255.169.37 GET / – 80 – 220.181.51.144 Baiduspider-favo+(+ baidu /search/spider ) 200 0 0 15256 197 265
谷歌機器人
2012-03-13 08:18:48 W3SVC177 116.255.169.37 GET /robots.txt – 80 – 222.186.24.26 Googlebot/2.1+(+ google /bot ) 200 0 0 985 200 31
我們分段來解釋
2012-03-13 00:47:10 蜘蛛什么時候訪問了你網站
W3SVC177 這個是機器碼這個是惟一的 我們不去管它
116.255.169.37 這個IP地址是服務器的IP地址
GET 代表事件
GET后面就是蜘蛛爬取的網站頁面,斜杠就代表首頁
80 是端口的意思
220.181.51.144 這個IP則是蜘蛛的IP,這里告訴大家一個鑒別真假百度蜘蛛的方法,我們電腦點擊開始運行輸入cmd打開命令提示符,輸入nslookup空格加蜘蛛IP點擊回車 ,一般真百度蜘蛛都有自己的服務器IP而假蜘蛛則沒有。
如果有時候你發現你的空間很多情況下又冒充百度蜘蛛的假蜘蛛來頻繁訪問你的網站,那么這個時候我們就要好好的去屏蔽這個ip,過度去采集我們網站的內容。
200 0 0 200反應蜘蛛抓取正常
197 265最后兩個數字則代表著訪問和下載的數據字節數。
2.我們分析的時候先看看狀態碼 200代表下載成功,304代表頁面未修改,500代表服務器超時,這些東西可以去搜索下,網上都有詳細的說明。
3.我們可以通過蜘蛛喜歡那些頁面,來預計估測蜘蛛到底喜歡什么內容,以后我們可以判斷我們到底該怎么寫我們網站內容。
4.有時候我們可以發現蜘蛛在爬去我們網站的時候到底出現了那些問題,對癥下藥!
5.我們通過蜘蛛抓取的頻率可以很好的分析出那些時間段,時間頻段蜘蛛常來,然后我們趕在這個時間對岸前把我們的網站更新,這樣可以讓搜索引擎知道咱們網站是最新 的
6.蜘蛛對于我們的頁面的抓取是分等級的,是根據權重依次遞減的,一般順序為首頁、目錄頁、內頁。
7.不同IP的蜘蛛他們的抓取頻率也是不相同的
作為一個合格的seoer人員要養成看日志的習慣,在日志中可以很清楚的看到我們網站的一切!
轉載請手下留情請保留http://www.weidongdong.com/seoer-kan-rizhi.html