1)预处理(确立建立索引)
爬虫蜘蛛(专业术语:索引程序)对抓取来的网页页面信息内容要进行关键词keyword提取、生成倒排索引、网站页面PageRank值及TrustRank值计算、网站页面关键词keyword同类相关性等处理,以备排名排序程序调用,这也是百度360Sogou能在极短时间内返回搜索内容结果的关键,其中我们最关心的是PR值和同类相关性。
2)输出结果
用户使用者输入关键词keyword后,排名排序程序调用索引库数值数据,程序自动匹配关键词keyword,然后按一定规则生成搜索内容结果展现展示网站页面,这是因为前面的预处理,百度360Sogou才能够在很短的时间内返回输出结果,这里特别要提醒一下,自然搜索排序排名和竞价营销推广排名排序是有区别的。以上精彩的信息文章由墙体彩绘机进行实时分享!
Copyright © 广州京杭网络科技有限公司 2005-2025 版权所有 粤ICP备16019765号
广州京杭网络科技有限公司 版权所有