您现在的位置是:刘宇博客 > SEO优化 > 内容SEO优化

网站IIS日志分析之看蜘蛛预知网站状态避免K站

站长刘宇2013-04-20 【SEO优化】人已围观

简介做SEO数据统计工作很重要,统计分析一直是搜索引擎优化的重头戏,今天先针对网站IIS日志分析,相信大多只要从事、了解过优化的站友们应该都看过IIS日志,利用相关网站日志分析工具都能知道爬行次数、页面、状态等信息。这些内容就不一一详述了,今天主要分享下近期数据

做SEO数据统计工作很重要,统计分析一直是搜索引擎优化的重头戏,今天先针对网站IIS日志分析,相信大多只要从事、了解过优化的站友们应该都看过IIS日志,利用相关网站日志分析工具都能知道爬行次数、页面、状态等信息。这些内容就不一一详述了,今天主要分享下近期数据统计心得,提前了解知悉网站动态,及早预防网站惩罚,减少损失。
 
百度蜘蛛爬行我们的网站有很多IP号段,都各自负责着其职责,透露给我们网站的状态信息。下面列出各IP号段的含义。
 
121.14.89.*
一般的新站正处于沙盒期,会是这个ip段的蜘蛛爬行,主要度过新站的考察期
 
123.125.68.*
这个IP段可能是最熟悉的了,经常爬行,如果别的来的少,可能要小心了,你的网站有点问题即将要进入沙盒期,或者被降权。近期注意安全。
 
123.125.71.*
这个IP段最常见的可能就是一下几个了:
123.125.71.106
123.125.71.95
123.125.71.97
123.125.71.117
123.125.71.111
主要是抓取内页收录的IP段,权重偏低,一般爬行过此段IP的文章被索引之后不会很快的放出来,大多不是原创或者是抄袭转载采集的文章。
123.125.71.19
这个ip最近一段时间很奇怪,爬行收录过的文章,爬行后快照更新。
 
125.90.88.*
这个是广东茂名市电信IP段,也属于百度蜘蛛的IP,主要是新上线的网站较多,或是使用SEO综合检测等站长工具造成的。
 
203.208.60.*
这是个大多出现在新上线网站,或者网站不正常现象之后的IP段。
 
210.72.225.*
这是个小喽啰,一直不简短的巡逻各站,勿理会。
 
220.181.108.91
如果你对此IP段熟悉,那么恭喜你了!这是个权重蜘蛛,基本上所爬行的页面24小时内就能放出来,杂食性蜘蛛,首页、内页等都爬行。
 
220.181.7.*
123.125.66.*
这也是个小巡逻兵,不过出现这个IP段的时候一般都代表着百度蜘蛛准备抓取你的东西了哦。
 
123.125.71.*
抓取内容的IP段,收录的权重偏低,可能因为文章为采集、拼凑抄袭,被收录但是暂时不会放出。
 
220.181.68.*
如果这个IP段成上升趋势,只增不减那么你的站很有可能马上就要进入沙盒期或者被K站拔毛。
 
220.181.108.*
这是个很让人兴奋的IP段,主要抓取首页占75%,部分会爬行内容占25%,这个段的IP爬行过的主页或者文章绝对24小时内放出来,最迟隔夜快照的。
爬行首页号段:
220.181.108.89
220.181.108.94
220.181.108.97
220.181.108.80
220.181.108.77
220.181.108.86
220.181.108.83
220.181.108.95
应该还有,暂时统计这几个,只爬行首页,高权重段,首页还未更新大多返回304 0 0。
220.181.108.144
我很喜欢这个IP,基本上即时放出!
220.181.108.92
这个IP很奇怪,基本完全是首页专用IP,但偶尔还会抓取其他页面(目前未发现文章内容页),本IP段的抓取内容权重高!更新快!
220.181.108.75
这是220.181.108.*段专用于抓取文章内容页的高权重IP,90%抓取的全是文章内容页,偶尔8%会抓取首页,2%会抓取其他页面,同样高权重!放出快!
百度蜘蛛的IP段还有很多,只是针对最近两天的网站IIS日志分析总结先列出这些,日后有时间再补充。
一般成功抓取返回代码都200 0 0,返回304代表网站没更新。另外针对与200 0 64、304 0 64等特殊代码我们日后再做详细分析。

相关文章

文章评论