《SEO艺术》第二章 搜索引擎基础(1)

在搜索营销领域,搜索引擎返回的满足查询要求的页面被称为搜索结果页面(SERP)。每个搜索引擎返回的结果页面格式稍有不同,并且包括垂直结果。

 

搜索结果页面布局,一般有以下几点:

  1. 垂直导航。

搜索引擎都提供不同垂直领域进行搜索的选项,如图片、新闻、视频或地图。

  1. 搜索框

所有搜索引擎都显示用户输入的查询词,并且允许在搜索结果页面上编辑或重新输入一个新的查询词。

  1. 结果信息

这部分是用户正在查看的结果的一些元信息,包括与查询词相关的页面数目估值(估值较粗略)。

  1. PPC(付费)广告

这里是公司通过各种搜索广告平台购买的文字广告。这些结果的排列顺序受很多因素影响,包括相关性和竞价金额。

  1. 自然结果(有机/算法结果)

这些结果来自于搜索引擎的主索引库,是按照复杂算法得出的相关性及受欢迎程度排序的。

  1. 查询调整建议

这是一个相对新的功能。目的是让用户使用更明确或更相关、更符合他们意图的词来搜索。

 

搜索引擎有几个重要目标和功能,包括:

  • 爬行和索引网上可以访问的亿万文件(网页和文件)。
  • 对用户查询做出反应,提供相关结果列表。

 

第一步:搜索引擎采用网页之间的链接进行爬行和索引。

第二部:搜索引擎按照最可能满足用户的顺序返回网上相关页面的列表。这个过程要求搜索引擎在它们的亿万个文件组成的资料库中寻找文件,并做两件事:第一,只返回与用户查询有关的结果;第二,按重要度对结果进行排名(考虑网站的信任度和权威性)。SEO就是影响查询结果相关度与重要度的过程。

相关度(relevance)就是返回的文件内容与用户查询意图相匹配的程度。一个文件的相关度在下面这些情况下会提高:用户查询的词或词组在文件中出现多次,在文件标题或重要的小标题中出现;页面有来自相关页面并使用相关锚文字的链接。

重要度是指相对重要性,通过引用次数来衡量。一个文件被其他文件参考引用的次数越多,它的受欢迎程度越高。

 

搜索引擎详细分析页面上出现的所有词和词组,然后用这些数据建成一个地图,当用户输入相关查询时,搜索引擎考虑页面是否应出现在搜索结果中。这个地图——经常被称为语义地图——尝试找出概念之间的相互关系,使搜索引擎可以更好理解页面是否与用户查询相匹配。如果页面内容与查询没有语义匹配关系,这个页面出现的可能性就很小,所以放在页面上的词以及页面的主题在排名中有很重要的作用。

网站上的导航元素起着重要作用,但是对于确定页面的独特内容并帮不上忙。搜索引擎的另一个任务是判断内容的价值。

 

搜索引擎能在页面上“看”到什么内容

搜索引擎蜘蛛所看到的内容就是网站服务器发送给浏览器的代码。可以通过查看源代码找到。

搜索引擎蜘蛛最感兴趣的信息是页面的文字部分。

如下图:

源代码里面搜索引擎蜘蛛感兴趣的内容

虽然图中还显示了一些HTML编码,但是从代码中可以清楚地看到普通文字,这就是蜘蛛在寻找的独特内容。

另外,搜索引擎也读取其他内容。其中之一就是页面标题。页面标题是影响排名最重要的因素之一。

搜索引擎的三个标签

第一个圆圈是页面标题标签。第二个圆圈是关键词标签。 第三个是说明标签

标题标签也经常(但不总是)用作搜索引擎排名列表中的标题。如果你的网站被雅虎或开放目录收录,就很可能出现例外。对于开放目录的内容可以查看百度百科:http://baike.baidu.com/link?url=OJ_SxG6692Ms-kG_DUXNJhtdTCN10AveQJu7-xK5ZZRCH4FcDKhhl4wrz4G3yTByaPv5TySjhdwgv6aohs-Hc4haEYJbEMCD7VrIKdBdHaY6FabP7DwGO7q6J39ugx1GVbUZA2J5TEYQWEg-RnrJs_

关键词标签的价值现在可以忽略,因此,不建议在关键词标签上花费太多时间。

搜索引擎也读取说明标签,但是说明标签完全不影响搜索引擎排名。但是说明标签有着重要意义,因为搜索引擎经常把它作为搜索结果中的页面说明,因此一个写的很好的说明标签对你从搜索结果列表中获得多少个点击有显著影响。所以花在说明标签上的时间是有价值的

搜索引擎读取的第四个元素是图片的alt属性

搜索引擎读取的最后一个元素时noscript标签。Noscript标签只应该用来代表Java Script脚本的内容(在这个标签里放上其他内容或链接可能会被搜索引擎认为是作弊行为)。

 

总结起来搜索引擎读取的内容如下:

搜索引擎读取的内容

确定搜索意图及返回相关、新鲜的内容

搜索功能的绝大部分是由两个重要因素决定的:相关度和重要度。为了衡量这些因素,搜索引擎进行文件分析(包括跨文件概念的语义分析)和链接(引用)分析。

文件分析和语义联系

在文件分析中,搜索引擎查看搜索词是否出现在文件的重要区域——标题、元标签、H标签和页面文字。搜索引擎也根据文件分析和其他因素尝试自动衡量文件的质量。

对如今的搜索引擎来说,仅仅依靠文件分析时不够的,所以它们也要考虑语义联系。语义联系(semantic connectivity)指的是通常相互关联的词或词组。

专业SEO人员不一定需要使用语义联系测量工具来优化网站,不过更高级的SEO人员会尽力充分利用每一个因素,语义联系测量队下面这些方面有帮助:

  • 衡量选择什么词组作为目标关键词
  • 衡量有关某个话题的页面上应该包括什么关键词组。
  • 衡量其他高排名网站或网页上的文字之间的关系。
  • 寻找能提供相关主题链接的页面。

 

常见搜索类型如下图:

IR(Information Retrieval)模型(搜索引擎)使用模糊集合理论来发现两个词之间的语义关系。

在此基础上有所扩展的相关概念是潜在语义分析(LSA Latent Semantic Analysis)。还有一种潜在语义索引(LSI Latent Semantic Indexing)将语义分析更进一步,可以分辨相关联的网页。

 

链接分析

通过链接分析,搜索引擎衡量谁链接向一个网站或网页,以及怎样评价这个网站和网页。

结合链接模式分析以及语义分析,可以确定一个网站或页面的重要性。

根据相关性聚合网站的概念被称为“链接令居”(link neighborhood)。你所在的社区说明了你的网站的主题,来自社区网站链接的数量和质量表明了你的网站在这个主题上的重要性。

 

另一个决定链接价值的因素是链接方式和位置。例如,链接本身所使用的文字(用户所点击的文字)对搜索引擎来说是个很强的信号,这被称为锚文字(anchor text)。如果锚文字包含关键词(与你的目标搜索词相关的关键词),这将比不含关键词的链接对你的搜索引擎排名更有帮助。

对链接价值的语义分析比锚文字更深入。

 

问题词,消除歧义及多样化

搜索引擎在处理有歧义的词语的时候会提供多样化的结果。或者根据用户前面的查询词提供的一些线索来返回结果。

 

新鲜度什么时候重要

QDF(query deserves freshness),QDF考虑几种因素:

  1. 搜索数量
  2. 新闻报道数量
  3. 博客报道数量
  4. 工具条数据(可能)

QDF应用于即时报道,也适用于其他情况,例如获得很多搜索次数及媒体报道的热门折扣或新产品发布。

 

分析排名因素

下面是排在最前面的9个因素:

  • 标题标签中使用关键词。(一般认为,搜索引擎给予标题最前面文字最高的权重。因此在标题标签的最前面放上重要关键词是好主意,但是要确保避免关键词堆积。)
  • 导入链接锚文字。(当一个页面链接向另一个,链接所使用的锚文字被搜索引擎当做一个很强的信号)
  • 网站整体链接权威度(这个因素指的是网站的全部链接权威度,而不是网站上一个特定页面的权威度。)
  • 网站年龄(年龄越长的网站越不可能是垃圾网站)
  • 网站内部链接结构形成的链接流行度(内部链接的相关性也是一个要考虑的因素,越相关越好。)
  • 导入链接的主题相关性(链接来源网站和页面的相关性对目标页面及目标关键词是一个很重要的因素。)
  • 网站在相关话题社区中的链接流行度(这个指标指的是网站所建立的权威度。如果你有来自相关主题社区成员的很多链接,这对你的网站来说是个强有力的支持)
  • 页面文字之中使用关键词(页面内容不要仅限于完整匹配的目标关键词,搜索引擎也会寻找同义词来进一步加强页面的主题相关性)
  • 链接来源文章的整体链接流行度(对方网站是不是一个应该被信任的权威网站?)

 

负面排名因素

五大负面因素:

  1. 蜘蛛经常无法访问的网站
  2. 与其他页面相似或相同的内容
  3. 链接向低质量或垃圾网站
  4. 参与链接计划或积极卖链接
  5. 很多页面有重复标题或元标签

 

其他排名因素

  1. 获得链接的速度
  2. 使用数据(例如,一个用户点击搜索结果页面来到你的网站,然后点击返回按钮,又点击了同一个搜索结果中的另外一个页面,这可能被视为负面排名信号。)
  3. 用户数据(个人化是被谈论最多的搜索前沿课题之一)
  4. Google沙盒(沙盒是一种过滤器,用来限制新域名PR值(或排名)的提升速度)
0 Comments
Leave a Reply