解读搜索引擎工作原理及应对之策


一、了解搜索引擎的工作原理 通过2月16日晚聆听了简爱老师的精彩课程,大致掌握了搜索引擎的工作原理,主要分为以下四个步骤: 1、抓取网页:每个独立的搜索引擎都有自己的网页抓取程序爬虫(spider)。爬虫Spider顺着网页中的超链接,从这个网站爬到另一个网站,通过超链接分析连续访问抓取更多网页。被抓取的网页被称之为网页快照。由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页。 2、过滤网页:搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引库和索引。其他还包括去除重复网页、分词、判断网页类型、分析超链接、计算网页的重要度与丰富度等。 3、建立索引库:用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页;为了用户便于判断,除了网页标题和URL外,还会提供一段来自网页的摘要以及其他信息。 4、展现与排序:当用户在使用搜索引擎输入某个关键词时,搜索引擎会自动识别与判断用户的搜索意图,从已经建立的索引库中将最适合用户需要的内容按照综合得分,从高分到低分依次在搜索列表中展现与排序。 二、投搜索引擎所好,做好网站日常优化工作,主要从如下以方面入手:1、 提高网站关键词与文章相关性搜索引擎会检查网站关键地方是否含有关键词,如:(1) 更新的文章里:文章标题、段落开头或者结尾、文章的结尾处是否有关键词(2) 网站网址、导航里最好有关键词(3) 网页代码里的meta标签里添加关键词。2、 关键词要突出显示搜索引擎会看网站里关键词是否突出显示,平时我们更新文章时,关键词第一次出现时,加粗或斜体显示,同时在不影响用户阅读体验情况下,适当增加关键词的密度。假设你的网站里有100篇文章都和这个关键词相关,那么搜素引擎就会认为你这个网站和搜索词的相关度更高,是读者想看到的网站,排名也会随之提升。3、 网站爬行顺序和效率要高网站服务器响应时间要快,打开速度也要快,7秒钟打不开的网站就会认为用户体验度很差。同时网站结构要好,最好有网站地图,蜘蛛能跟着链接爬行到所有的网页。404页面要有返回首页的链接,否则就会把蜘蛛带进死胡同。经常检查死链或者无效链接,让蜘蛛在你网站里行走抓取的更顺畅。4、 提高用户体验搜索引擎最在意的是用户体验,站长投其所好自然会受到收索引擎的青睐,比如:经常更新高质量原创文章、网站跳出率、提高网站的停留时间、增加用户粘性等等。这些就要靠网站质量来支撑了。5、 增加网站的信任度、原创性首先做好网站外链的数量和质量,其次和权威网站做友链。这两点理论来讲就像是投票,投你的人多了就自然当选了。再就是多更新一些原创文章,目前的搜索引擎毫无二致地都对原创文章青睐有加,在站点内有规律地更新原创文章,为赢得搜索引擎为你站点额外加分。6、向搜索引擎主动提交链接面对当下浩如烟海、多如牛毛的站点,搜索引擎的蜘蛛们早已忙得不可开交,如果我们能把更新的内容主动向搜索引擎推送与提交,会大大提升我们网站被收录的机率。以百度搜索引擎为例,我们可以通过百度站长平台,主动向百度提交更新的文章。搜索引擎, 工作原理