既然为率,那么就是一个统计相关概念。我们不妨可以这样理解一个网站的连通率:百度蜘蛛在抓取网站页面的时候计算的一个概率,比如它抓取某网站中的N个页面,这N个页面都能打开并被蜘蛛成功抓取,这样的连通率就是N/N=100%,反之蜘蛛抓取N个页面有M个页面能成功抓取,连通率就是M/N;
这里先说明几个常识:
1、不是网站被某算法惩罚而导致连通率为0,也不是网站流量下降而导致连通率数值很低;
2、连通率代表着百度蜘蛛获取网站数据的情况,如果连通率数值很低或为0,那么可能连维持网站的正常收录等都成问题;
3、假如网站被判定连通不了,那么如果让一个连通不了的站点在百度中获取排名,就会大大影响搜索用户的体验,于是百度就会采取对该站点有效引流的索引清除操作,一些站长就会发现自己的网站索引量突然大幅度下降,甚至索引被短暂清0了,接着就是网站百度搜索流量大幅度下降,这种突发性的事件又会造成站长们的揣测,以为自己的网站被百度惩罚了,其实站长们先应该注意的是站点的连通情况。
上述概念中,我们需要注意在连通率很低或为0时,我们抓住'百度蜘蛛”; '在抓取”; 'N个页面”; 'M个页面”; '都能打开并被成功抓取”这5个提取出的核心词进行分析。
(一)百度蜘蛛
1、谨防百度蜘蛛访问被操控或禁止
2、预防措施
(1)完善联系方式获得百度站长工具消息提醒
(2)利用抓取异常和抓取频次工具观察抓取情况
(3)抓取诊断工具是重中之重
为了保证网站对百度蜘蛛的稳定访问性能,日常我们需要养成定期抓取诊断的习惯
(二)在抓取
这是反映百度蜘蛛在抓取时的状态,百度的工具显示的数值肯定都是抓取后计算出来的数据,因此任何工具的连通率数据必定存在延迟性,另外这个计算过程也存在一定可能的错误,所以我们看到任何工具中关于连通率的数据,不要说'我网站用抓取诊断等工具检查访问情况都好好的,为什么连通率还是0”,因此除了上述建议的多抓取诊断测试外,自己可以加些监控网站连接状态的措施,怒熊网本人就曾经接收了不少关于网站连接不通的提醒。这时我会及时跟网络商沟通,然后及时用抓取诊断检查蜘蛛的情况。
(三)N个页面与M个页面
这N、M个页面,可能百度蜘蛛很凑巧就赶上高峰的时候或者一些假死页面(执行时间较长,超过蜘蛛的耐心),那么M这个数值就会很低,统计概率的东西大家都懂的,那么这时网站的连通率依旧很低或为0。因此若连通率为0,我们还可以知道自己应该注意查看访问日志,及时清理死链,或者并发连接数增大,或者增加内存等等。
(四)都能打开并被成功抓取
这里主要注意DNS和空间的稳定性。
1、DNS的问题
2、空间的稳定性
连通率问题处理完毕后,如果你的网站索引由于连通率而非惩罚原因被清理了,处理完毕问题,可以在抓取频次工具中提交增加抓取频次的请求,将抓取频次增加到一定额度(怒熊网【重庆网站建设】建议自己查看工具中对抓取频次的说明后再根据网站实际情况调整),然后增加自己的网站数据更新频率与质量,加强与百度的数据沟通(如url提交、sitemap等等),很快就能恢复。