当前位置:首页 ->> 搜索引擎优化 ->> 文章

面向搜索引擎的网站设计:

目前中文网站在整个互联网中的影响还比较小,这主要是由于中文网站总体的水平(技术
上,内容上)都还相对落后造成的,最主要的表现有:

行业知识:

不知道搜索引擎对吸引的新用户的重要性,在搜索引擎排名服务中追求“傻瓜相关”,购
买一些其实没有太多实际意义的行业关键词。其实能够用户输入的关键词越多,针对性越强,
价值越高。用户能够直接定位到产品具体内容页比到网站首页有价值的多;

发布技术:

网站的网页进入Google的索引量非常小,动态网页仍是主要发布机制,缺乏将动态页面链
接表现成静态页面的机制;

页面设计:

页面标题重复,关键词不突出,过渡使用 JavaScript脚本/图片/Flash等不适合搜索引擎
索引的非文本形式;

无法量化的东西是不可管理的,以上根本的原因往往是网站自身缺乏日志统计分析造成。

其实大部分网站只要通过一些简单的策略还是可以让网站自身的水平在互联网中有一个真
实的体现,网站结构设计中面向搜索引擎的优化注意事项包括:

  1. 链接引用的重要性;
  2. 如何突出关键词:网页标题、主题的设计;
  3. 页面及站点结构设计注意事项;
  4. 站点访问统计的重要性等;
  5. Google的站点设计指南(注意:本网站设计本身就利用了其中一些方法)。

什么是PageRank:Google等新一带搜索引擎的优势之一在于不仅索引量很大,而且还将最
好的结果排在搜索结果的最前面,具体的原理可以参考Google の秘密 - PageRank徹底解説一
文,PageRank简单的说类似于科技论文中的引用机制:谁的论文被引用次数多,谁就是权威。
在互联网上PageRank就是基于网页中相互链接关系的分析得出的。

此外,从计算方法角度阐述PageRank机制还有这篇文章:http://pr.efactory.de/里面有
更详细的PageRank算法说明和各种清晰的小型个案分析。

链接就是一切:

在互联网的海洋中,最重要的就是互联互通,不被其他网站引用的网站就是“信息孤岛”。
“酒好也怕巷子深”,也许这话说起来有点像垃圾邮件广告,但事实就是这样。所以如果做
网站的目的不是孤芳自赏,就需要积极的推广自己的网站。

通过搜索引擎推广自己需要注意以下几个方面:

  1. 以量取胜:不一定加入大型网站的分类目录才是网站推广,来自其他网站的任何反相
    链接都是有用的网站推广比较经典的方式就是加入比较大型门户网站的分类目录,比
    如:Yahoo!,dmoz.org等。其实这里有一个误区:不一定非要加入大型网站的分类目
    录才是网站推广,因为现在搜索引擎已经不再只是网站目录的索引,而是更全面的网
    页索引,所以无论来自其他网站任何地方的反相链接都是非常有价值的,哪怕是出现
    在新闻报道,论坛,邮件列表归档中。Blogger(Weblog 的简称)们也许最深刻地理
    解了“链接就是一切”这句话的含义,由于Blog的内容之间有大量的相互链接,因此
    最经常被引用的Blog页面在搜索引擎中的排名往往比一些大型商业网站的页面还要高。
    而wiki这样的文档管理系统更加突出了良好引用的特征。
  2. 以质取胜:被PageRank高的网站引用能更快地提高PageRank数量只是关键因素之一,
    来自PageRank高的页面的链接还能更快的提高被链接目标的PageRank,我只是将一些
    文章投稿在了ZDNet中国上,由于页面上有文章出处链接,相应网页和网站整体的Page
    Rank过了一段时间后就有了很大的提升。有时候被什么样的网站引用有时候比引用次
    数多更重要。这里我要特别感谢的是,当时 ZDNet中国是唯一遵循了我的版权声明的
    要求表明了文章出处,并且有反相链接的网站。
    按照这个原则:能够名列Yahoo!和DMOZ这样的大型权威目录的头2层是非常有价值的。
  3. 了解搜索引擎的"价值观":Lucene简介这篇文章被Jakarta.apache.org的lucene项目
    引用以后,这篇文章就成为了所有页面中PageRank最高的页面,而Google支持的一些
    项目,比如:Folding@Home,让我一直怀疑他们对政府,教育和非盈利组织的站点有
    特别加分,毕竟.org .edu才代表了互联网的实质:分权和共享。
    但更合理的解释是:.org很多都是开放技术平台的开发者,他们会在首页这样的地方
    加入Powered By Apache, Power by FreeBSD之类的链接表示对其他开源平台的尊重,
    所以象Apache, PHP, FreeBSD这样的开源站点在Google中都有非常高的PageRank。而
    在.edu这些站点中,很多都是学术性比较强的文档,以超链接形式标明参考文献的出
    处已经成为一种习惯,而这也无疑正是 PageRank 最好的依据。注意,不要通过Link
    Farm提高自身的站点排名:Google 会惩罚那些主动链接到Link Farm站点以提高自身
    排名站点,相应站点的页面将不会被收入到索引中。但如果你的页面被别的Link Farm
    链接了也不必担心,因为这种被动的链接是不会被惩罚的。
  4. 不要吝啬给其他网站的链接:如果一个网页只有大量的进入链接,而缺乏导出链接,
    也会被搜索引擎认为是没有价值的站点。保证你的网站能够帮助搜索引擎更准确地判
    断哪些是对用户最有价值的信息,也就是说如果你的网站只有外部反向链接而没有导
    出链接的话,也会对你的网站在搜索结果中的表现带来负面影响。当然网站中连一个
    导出链接都没有的情况非常罕见,除非你是刻意这么做。正常情况下大家都会自然地
    在网页中加上一些其他网站的链接,带领访问者去到我们认为重要或能够提供更多有
    价值信息的地方,另外在推广自己网站之前也许首先需要了解自己网站目前在一些搜
    索引擎中的知名度,原理非常简单,可以参考如何评价网站的人气一文。

网站推广只是手段,如何突出内容、让需要相关信息的用户能够尽快的找到你的网站才是
目的,PageRank高并不代表像Yahoo!这样的门户站点就能在所有搜索结果中排名靠前,因为搜
索引擎的结果是搜索关键词在页面中的匹配度和页面的PageRank相结合的排名结果。因此第二
个要点:如何突出关键词。

如何突出关键词:面向主题(Theme)的关键词匹配

Theme Engine正在逐步超过PR,成为结果排序中更主要的因素,可以比较一下以下现象:
为什么查“新闻”,“汽车”之类的文字,各种门户网站的首页不在第一位?要知道他们的页
面中都有相应频道的链接文字的一篇新闻页面中,搜索引擎如何不通过模板匹配,自动将新闻
的主体和页面中的页头,栏目导航条,页尾等部分的内容区分开的?其实以上问题都可以归结
为网页内容摘要的提取策略和关键词在其中的命中。首先将能够描述一个页面内容的分成以下
几种类型:
链入文字描述:inbound link text
http://www.searchenginedictionary.com/terms-inbound-link.shtml

HTML页面标题:title 好标题一般会将页面中最重要的关键词放在最前面,比如:ABC-10
型吸尘器 - XX家电城,HTML内容主体:content text,链出文字:outbound link text

如果按照以下规则:

一个页面中关键词命中权重:链入文字 > HTML标题文字 > HTML页面主体内容 >> 出链文
字,以上现象就比较好解释了。

链入文字是页面上看不见的,但链入文字对被链接页面有巨大的作用:在现代搜索引擎在
关键词匹配的过程中,匹配的过程不只看当前页面的内容摘要:很大程度上,不只看这个网页
自己说自己有什么内容,还要看别人如何链接时,如何描述你的网站别人怎么称呼你,比你自
己说自己更重要。比如查:“世界卫生组织”,返回结果中有 http://www.who.int/而这个页
面中是没有中文的,之所以能匹配上,是因为很多链接它的中文网站使用了:世界卫生组织,
所以,这个页面中不存在的中文关键词也成为了页面摘要的一部分。这样一想,就可以知道链
出链接的文字其实是为被链接的子频道首页或者内容详情页服务的。对自身页面的关键词密度
只有负面的影响,这也是Google建议一个页面中链接不要超过100个的原因:他根本不索引100
个链接以后的内容。按照以上规则,搜索引擎将一篇新闻详情页中的新闻内容提取出来就是把
页面上所有带HTTP链接的文字都去掉,就是新闻的内容部分了,更精确一些可以通过取最长文
本段落等策略实现;而很多网站首页或频道首页中几乎全部都是链接,经过搜索引擎分析的结
果就是:什么内容也没有,能够被命中的关键词仅仅是别人链接你用的“网站首页”和频道标
题 Title中的站点名称等的几个关键词,而页面中其他的文字则远远不如相应子频道和具体内
容页面的匹配度高,而搜索引擎能够通过以上规则,让用户更快的直接定位到有具体内容的内
容详情页面。因此希望通过一个首页,尽可能多的命中所有希望推广的关键词是不可能的。让
网页尽可能多的进入搜索引擎的索引,然后把握好整个网站的主题风格是非常重要的,让网站
的主题关键词能够比较均匀的按照金字塔模式分布到网站中可以参考:

网站的主题金字塔设计

网站名称(用户通过1-2个抽象关键词)
/
子频道1 子频道2 (用户通过2-3个关键词命中)
//
产品1 产品2 文章1 文章2(用户通过3-4个关键词命中:这种用户最有价值)

不要空着标题:空着无异于浪费了最有价值的一块阵地;传统的页面中,HTML页面中会有
类似以下的隐含信息,用于说明当前网页的主要内容关键字:后来由于这种人工添加关键词的
方式被滥用,大量网页中为了提高被搜索引擎命中的概率,经常添加一些和实际网页内容无关
的热门关键比如:“music mp3 download”等,所以新一代的搜索引擎已经不再关心页面头文
件中的人工meta keyword声明,而页面标题在搜索引擎的关键词的命中命中过程中往往有着更
高的比重,如果一个关键词在标题中命中会比在页面中命中有更高的得分,从而在相应的搜索
结果排名中更靠前。

标题长度和内容:不要过长,一般在40个字符以内,并充分突出关键词的比重;如果更长
的标题搜索引擎一般会忽略掉,所以要尽可能将主要关键词放在标题靠前的位置。省略掉不必
要的形容词吧,毕竟用户主要通过名词来找到需要的内容。标题内容:尽量用一些别人可以通
过关键词找到的字眼(也别太过头,如果标题中的字眼超过一半内容中都没有,有可能被搜索
引擎排除出索引),因此基于 web日志中来自其他搜索引擎的关键词查询统计非常必要。如果
网页很多的话,尽量使用不同的网页标题,争取让自己网站的内容更多的进入搜索引擎索引范
围;因为搜索引擎会根据页面内容的相似度把一些内容当成重复页面排除出索引范围;

http://www.chedong.com/phpMan.php是我的网站上的一个小应用:一个web界面的unix命
令手册(man page),在以前的设计中所有动态页面使用的都是同样的标题:"phpMan: man
page /perldoc /info page web interface” ,Google索引了大约 3000多个页面,后来我将
页面标题改成了"phpMan: [命令名]"这样的格式,比如:"phpMan: ls",这样大部分动态页面
的标题就都不一样了,一个月后Google从这个页面入口索引了大约6000个页面。因此,如果网
站中很多网页都使用相同的标题,比如:“新闻频道”,“论坛”,这些页面中很大一部分就
会被排重机制忽略掉。

by http://www.chedong.com/tech/Google.html

 

 产品与服务

  搜索引擎登陆服务

  Google搜索引擎排名服务

  Yahoo搜索引擎排名服务

  搜索引擎竞价排名服务

  搜索引擎优化(SEO)服务

  搜索引擎营销(SEM)服务

  网络营销策划服务

  大型网站咨询服务

 搜索引擎优化专栏

提供最新搜索引擎优化知识
SEO 是“搜索引擎优化”的
缩写,国内在04年开始更关
注这项工作。

  新网站排名不稳定的原因

  面向搜索引擎的网站设计

  有利于网站优化的设计建议

  什么是搜索引擎优化

  搜索引擎优化策略

  网站优化之链接策略

  如何提高站点的链接流行度

  关键词选择技巧

  网络推广的效果评估标准

 网站登陆

提供国内外网站登录的信息
将网站登录到合适的搜索引
擎和目录,是网站推广的必
经之路。

  国外免费网站目录登陆

  世界顶级网站目录登录

  世界顶级搜索引擎登录

  快速登录20个搜索引擎

  66个TOP搜索引擎登录入口

DMOZ