Copyright © 2010-2012 All Rights Reserved. 备案号:蜀ICP备12021514号-1
2015-01-27 18:52:20[英文SEO]
对于搜索引擎,它最重要的是什么?不是搜索结果的准确性,也不是搜索内容的丰富性,而是对于一个搜索的东西反馈时间,如果要花很长时间才能反映,那么,我们很快就会不用它。
搜素引擎准确的来说,是为了满足广大人们快速苛刻的要求。但是,采取的方式是:支持缓存查询的方式。他并不是我们在搜索查询那一时刻的结果,是搜索引擎已经缓存好了的结果。
搜索引擎的流程会是什么呢?301seo英文网站优化团队认为可以分为三个阶段。
第一阶段:网页数据的采集
这里包括了蜘蛛去过,没去过,去了之后又有更改,或者页面已经删除,这些情况。
只要你的网站没有被受过严厉的惩罚,那么你通过后台,可以看到蜘蛛频繁的到你网站抓取信息。搜索引擎会通过你网站更新的频率,规律。然后通过它计算出你网站什么时候才是最佳的抓取时机,从而进行抓取。
而我们通过site的结果,并不是蜘蛛以抓取你页面的数量,也就是我们说的收录的数量。这些页面不是即时的收录页面,这个是搜索引擎前面已经缓存好的。所以是不准确的。站长通过一时的site来做策略,估计会被坑。
而新链接呢?搜索引擎是秉着深度优先,宽度优先的原则。重起始页开始不停的发现新页面,如果与起始页有重合的则剔除。
第二阶段:数据的处理
这个阶段是搜索引擎最核心也是最复杂的部分,基本上网站关键词的排名就是在这个阶段生成的。
搜索引擎抓取的页面跟我们在浏览器看到的页面源代码是一样的,很多网页的代码与页面主要内容是无关的。而搜索引擎就需要去噪,去除非正文关键词及停用词。然后得到页面关键词后储存到数据库中,并与此页面的url进行对应。收集了你网站的页面之后,就会分析此网页重要的信息,例如网页代码、关键词密度、内链锚文本等此网页的重要词组。然后再根据你网站的seo策略进行分析,从而确立网页关键词的排名系数,最后生成排名。
第三阶段:对于搜索结果的排序
文章前面说的,查询的搜索结果不是即时的,是在搜索引擎里已经排好的。但是搜索引擎并不知道你会搜索什么,所以他建立一个关键词词库,当你请求搜索的时候,就会给你呈现一个排名。这样就产生了排名,缩短了查询的时间。
综上所诉:搜索引擎就是一个大的数据集中处理中心,它把各个信息收集,分析进行储存,展示给大家一个由重及轻的搜索结果。
301seo英文网站优化团队为大家整理