来源:本站日期:2013-4-9
现在很多人或许都听过“百度快照”这个名词,而且相信站长们都对这个名词非常熟悉,百度快照简单地说就是我们在搜索引擎结果页面看到的内容都是从百度快照里面调出来的。这跟收录其实关系十分密切,这就是为什么做优化有一个重要
现在很多人或许都听过“百度快照”这个名词,而且相信站长们都对这个名词非常熟悉,百度快照简单地说就是我们在搜索引擎结果页面看到的内容都是从百度快照里面调出来的。这跟收录其实关系十分密切,这就是为什么做优化有一个重要的目的就是要被收录的原因。每个被收录的网页,在百度上都存有一个纯文本的备份,称为“百度快照”。力洋网络负责人表示,现在很多互联网用户都是利用快照浏览网站网页的内容,但是,我们要知道百度只保留文本内容,所以,那些图片、音乐等非文本信息,快照页面还是直接从原网页调用。用户如果无法连接原网页,那么快照上的图片等非文本内容,会无法显示。这个是百度快照的基本含义,也是我们优化的时候最基本的着手点。
有时候优化的过程中,我们活着会发现一些很奇怪的现象,就是我们的网页被收录了,但是快照却迟迟不更新。其实这个问题我们都非常常见了,因为收录其实跟更新快照米有直接的关系,文章收录很快照不是同时进行的。我们要清楚一点就是快照是根据一个网站权重高低,来给予快照的节奏。可以说这两个是在不同的处理器进行处理的。收录文章是搜索引擎蜘蛛的工作,收录了之后被蜘蛛带回去,但是很多新站其实出现这个问题的最主要原因还是没有走出沙盒,百度蜘蛛对于新站的抓去速度还是挺快的,可能跟新站原创性比较强有关系。但是没有走出沙盒的新站一般需要经过这个考核期。而且一般新站百度是不会给于多少权重,所以,快照速度就比较慢。但是过了考核期就会没事的了。另外除了这个之外,我们还可以看一下是不是一下的几个问题导致的:外链突然大量下降;你的友链网站出问题,特别是给你带来比较大外链的网站;百度对你的网站进入2次考核期。比如有过度优化的嫌疑,这三个其实也是比较容易导致上述问题的,所以在检查的时候最好仔细留意。
还有就是有些我们优化的时候使用不同的关键词,百度快照的日期却是不一样的。在这个过程中,其实很大部分是因为搜索引擎的缘故。我们来看一看下搜索引擎的收录过程。它的收录大致分成两套系统,信息收集系统和信息索引系统,前者负责抓取所有的url以及从url中分析出标题,描述,http状态码的服务器信息,后者负责针对网站内容的索引工作,包括分词和排名。这样一来,两套相互独立的系统同时进行,而且分词工作是一项非常费事的工作,以及中文内容的各种敏感因素,从而就会导致了服务器更新之间的各种异常现象,简单来说就是搜索引擎信息收集系统和信息索引系统之间处理的时间差。这个其实没有什么大的影响,我们主要认识到他们的操作过程就可以了。
据力洋网络的负责人提到,SEO的过程中,最令人关注的问题其实是快照回档的问题。我们在优化的过程中,快照回档是由于一定原因致使百度在数据库中对比筛选后,提取了以前的数据,来定义你的快照。如果出现回档的现象,这是搜索引擎发出的警告,虽然还没有被K,但是我们还是需要思考下优化的站点之前是否过度的优化,服务器是否经常当机等不利因素,我们可以在去掉那些无谓的优化和保证服务器正常的情况下,以快照停留的时间为范本,适当增加网站栏目,充实原创性的内容。这样的话可以适当稳定一下这种情况。