SEO实践
为了解释 “让页面足够健壮,可以被单独搜索到” 的含义,我将以 developerWorks Web 站点为例。因为 www.ibm.com/developerworks 的主页是所有 developerWorks 内容的入口,我们针对 “IBM resource [for] developers” 优化主页,使其具有一般化的特点,而且使用这个短语搜索时,在 Google SERP 中这个主页是排在第一位的结果。使用有机优化技术带来了回报。Google 知道这个页面与哪些内容相关,用户点击这个链接后不会失望,他们会进入一个拥有 IBM 提供的开发者资源的丰富页面。
但是,除了主页之外,在 developerWorks Web 站点中还有其他许多东西。一些潜在受众可能会使用我们的导航系统或内部搜索寻找更有针对性的开发者资源,但也有许多其他用户更倾向于使用外部搜索引擎搜索内容,并直接进入相关页面。
例如,如果某位搜索者要查找 “linux developer tutorials”,而 URL 为 www.ibm.com/developerworks/linux 的 developerWorks Linux 页面没有出现在 SERP 的前 10 个结果中,那么在 developerWorks 主页上所做的所有优化对于这位搜索者来说都是没用的。但是,我们在 developerWorks 站点上实践良好的有机 SEO 已经许多年了,developerWorks Linux 页面目前是 “linux developer tutorials” 的 Google SERP 中的第一个结果。良好的 SEO 意味着优化站点上的每个页面,让搜索引擎准确地了解您认为每个页面上最重要的内容。
由于要考虑优化 Web 站点上的每个页面,以提高在搜索引擎结果中的排名,SEO 看似烦琐。您或许想知道是否存在某种诀窍或者更简便的方法。但是,对于提高在搜索引擎结果中的排名来说,不存在诀窍。底线就是创建能让用户赞赏的优秀内容,这样搜索引擎会给予您很好的排名。
SEO和用户:
正确地实现了良好的 SEO 也就会创建出对搜索引擎友好、对用户有吸引力的站点。有机SEO 的收益之一是可访问性非常高的页面。搜索引擎爬行器查看页面的方式与有视力障碍的人所用的页面阅读器相同。可以使用 lynx 浏览器体会一下页面阅读器所看到的站点是什么样的(参见 参考资料 中提供的 lynx 浏览器的链接)。页面阅读器还会展示您的站点在小屏幕上的显示效果,比如手机或其他小型 Web 浏览工具(关于可访问性的更多信息,参见 参考资料)。如果能够使页面具有较好的可访问性,让页面阅读器能够轻松地理解它们,那么页面就是对搜索引擎友好的。
在 SEO 的历史中,大多数臭名昭著的搜索引擎垃圾技术都会创建出对用户不友好或可访问性差的 Web 页面。两种对用户友好性破坏最大的黑帽SEO技术是:
元标记垃圾技术:在早期,搜索引擎会读取元关键词、描述和其他标记。搜索引擎根据这些标记的内容判断页面的主题,并确定页面在 SERP 中的排名情况。遗憾的是,某些人利用了这一点,在他们的元标记中重复地加上许多相同的单词,让搜索引擎误认为页面包含某些实际上并不存在的内容。这种做法误导了用户和搜索引擎。
例如,如果我们希望将 Linux 用户引导到 developerWorks 主页上,但是这里并没有多少 Linux 内容,那么可能会这样做:“<meta name="keywords" content="linux, ibm, linux, developer, tutorials, ibm, developer, linux, tutorial, tutorial, tutorials, resources, linux, tutorials, developer" />。当用户点击 SERP 中列出的这个站点时,将显示 developerWorks 主页,他们会很失望,因为这里只有零星的几个 Linux 教程,而不是像 developerWorks Linux 部分那样专门提供 Linux 教程。正因为有许多人采用元标记垃圾技术实现黑帽 SEO,搜索引擎不再使用元标记中的信息来对页面进行排名了。
alt 标记欺骗:对 alt 属性的滥用也属于黑帽 SEO ,因为它向用户和搜索引擎提供关于图片的错误信息。例如,developerWorks Linux 页面上某幅图片的 alt 标记可能填充了下面这样的关键字:<img alt="linux, ibm, linux, developer, tutorials, ibm, developer, linux, tutorial, tutorial, tutorials, resources, linux, tutorials, developer" />。尽管 Linux 页面确实与 Linux 教程有关,但应保证这幅图片本身确实向页面阅读器传递了关于其内容的准确信息。否则就是对 alt 标记的滥用。
最重要的是要记住,合适的文字对于搜索引擎和用户都很重要。文字要向搜索引擎清楚且真实地表明页面的主题,对用户也是如此。(关于创建良好 Web 页面的更多信息,参见 参考资料。)
SEO 和搜索引擎
在想到搜索引擎时,大多数人会想到 Google(可在 参考资料 提供的论坛中进一步了解 Google),但是为了公平地对待所有搜索方法和搜索引擎,我将使用搜索引擎 这个术语。以 Google 为中心的,但也适用于其他大多数主流搜索引擎。根据目标受众的不同,您的目标搜索引擎可能有所不同。因为我只描述白帽 SEO 技术,所以这里提供的工具和知识会使您的 Web 站点对美国的所有主流搜索引擎更有吸引力。美国以外地区的搜索引擎流行情况可能有所不同,但是白帽 SEO 能帮助站点在大多数基于英语的搜索引擎和其他基于爬行器的搜索引擎中获得更好的排名。
搜索引擎的类型
目录和真正的搜索引擎之间的差异是,目录是人为编辑出来的,而搜索引擎是由爬行器通过跟踪链接漫游 Web 而建立的。白帽 SEO 的主要关注点在于提高站点在使用爬行器编辑的搜索引擎中的排名。
搜索引擎工作原理(简化版)
为了收集数据,搜索引擎让爬行器跟踪链接漫游、组织数据并判断每个页面上的文本与什么内容相关。当搜索者进行搜索时,搜索引擎利用爬行器收集的信息,通过专用排名算法建立与这次查询最相关的站点列表,并显示在 SERP 中。
目录工作原理(简化版)
纯粹的目录就像是图书馆中的分类卡,只不过是采用了电子形式。它包含编辑好的已提交到目录中的站点列表。它知道这个列表中有什么,而且知道对于搜索字段中输入的单词应该搜索哪些类别。这是因为最初的提交者常常会选择分类。另外,搜索者可能根据目录的类别进行浏览,寻找带有他所请求的单词的站点。
Google 是真正的搜索引擎。它提供一些来自 Open Directory 或 DMOZ 的目录结果,但是大多数结果来自爬行器的漫游和 PageRank 算法(参见 PageRank)。Yahoo是一种目录混合型搜索引擎,它首先搜索自己的目录,然后使用 Yahoo Bot Slurp! 进行搜索引擎搜索。