Archive for September, 2006

Google Sitelinks分析- ZT

近来,许多人注意到,在Google中搜索某些关键词时,排在第一位的网站有可能以更详细的格式显示:即除了一般的标题、页面描述和网址之外,还以链接的方式列出一般为4个该网站其他页面的标题与链接(见下图),这对网站而言具有非常重要的意义:有助于引起用户的注意,最大限度地提高点击率。

根据Google在Webmaster Help Center中给出的定义,这被称为“Sitelinks”,其结果完全由程序自动生成。当然,它具体叫什么名字无关紧要,关键是如何实现,根据一般的猜测,当网站被Google提供Sitelinks后,其在SERP中的点击率将成倍地攀升,这对网站建设者而言无异是极为诱人的。

什么是Google Sitelinks

虽然Google 只是在9月7日才在其官方的Webmaster Central Blog中正式介绍Sitelinks,但类似的结果页面已经出现很长时间了,特别在英文搜索方面,大概在4月份左右已经见到不少讨论。从严格意义上,Google Sitelinks的雏形应该是Matt Cutts在一年多以前介绍的新UI(user interfaces),将其称为snippet link,虽然在具体的显示格式上与现在的形式稍有不同。

根据Google的说法,Sitelinks的主要目的在于帮助用户更快速、以更简单的方式找到所需的信息:

The links shown below some sites in our search results, called Sitelinks, are meant to help users navigate your site. Our systems analyze the link structure of your site to find shortcuts that will save users time and allow them to quickly find the information they’re looking for.

当然,Google只是对部分关键词排在首位的网站才提供Sitelinks,一般说来,这类关键词多为网站名称、品牌、商标。

Sitelinks是如何得出的?

Google在其帮助中是这样描述的:

We only show Sitelinks for results when we think they’ll be useful to the user. If the structure of your site doesn’t allow our algorithms to find good Sitelinks, or we don’t think that the Sitelinks for your site are relevant for the user’s query, we won’t show them.

At the moment, Sitelinks are completely automated. We’re always working to improve our Sitelinks algorithms, and we may incorporate webmaster input in the future.

一般认为,Google Sitelinks与网站的结构、多关键词间联系的“紧密”程度有关,但最主要的决定因素则可能是访问量,只有那些访问量较高的网站及网站内的分类页面,才说明对用户而言有价值,Google才会为该网站提供Sitelinks或将相应访问量较大的页面作为Sitelinks中4个链接的对象。

在之前对Sitelinks或称snippet link的分析中,Social Patterns的结论似乎被大多数人接受:

  • Google snippet links do not return links outside of the home domain.
  • Google snippet links do not have to be from a text link, it can be an image link or even a javascript link.
  • Google snippet link text can be determined from an image’s alt text.
  • Google snippet links can be subdomains of the home domain.
  • Google snippet links are not determined by PageRank.
  • Google snippet links are displayed for the top result for a “brand” search or “domain” search.

当然,这个结论本身并不严谨,甚至有自相矛盾之处。

如何获得Google Sitelinks?

既然Google Sitelinks是通过算法自动得出的,那么,肯定有些较重要的因素能够帮助网站获得Sitelinks,也许,这是下一步网站建设者努力的一个方向,毕竟,与单纯的所谓排名优化相比,让更多的用户点击访问网站才是实现SEO目标的真正保障。

  1. 首先要在特定的搜索项中排名第一,这是最根本的,因为Sitelinks只向在SERP中排名第一的网站提供。
  2. 使用网站名称或名称中的一部分作为主关键词,将是获得Sitelinks的决定性因素。
  3. 仔细撰写网页的描述与内容部分,对被DMOZ收录的网站,应考虑是否使用NOODP标签。据大多数人观察,Google Sitelinks与网页在SERP中的点击量有关,也即是说,单纯排名是不够的,必须能在SERP页中引起用户的注意并点击。
  4. 网站的内部链接也相当重要,并要保证Googlebot对网站深层页面的访问。此外,通过对大多数Sitelink页面的观察,内部链接与导航出现在网页HTML代码靠前位置具有一定优势。
  5. 很多人推测Google Sitelinks可能使用Google toolbar (工具条)数据来采集数据,包括用户对特定网页的访问情况、收藏情况等等,这就又回到了SEO的老问题上,即让用户感到有用,感到有价值而收藏并多次访问。

sitelinks的其他推测

当然,在现阶段,仍然没有太肯定的关于Sitelinks实现机制的结论,但一般说来,如果某个网站在Google的SERP中拥有Sitelinks,可以认为Google将该网站判定为该搜索项方面的权威网站。

此外,在Sitelinks中,链接采用的方式使得玩味:SERP中的其他链接均是直接指向目标地址,而4个Sitelinks则采取类似JavaScript实现的302跳转,联系到Google说明中的“and we may incorporate webmaster input in the future”,说明了什么?

作者: highdiy
原载: 点石互动搜索引擎优化博客

Comments

WORDPRESS SEO技巧:URL Rewrite

Wordpress做为最流行的开源Blog程序,已经成为架设独立Blog的首选软件。应该说,Wordpress本身的程序架构非常合理,加上主题Theme的设计一般都遵循了W3C标准,在SEO上已经具有先天的优势。  但是开源程序在细节上往往有一些不足,对于在搜索引擎优化上精益求精的Blogger来说,通过一些简单的技巧,增强其搜索引擎优化的效果,将能为Blog的推广带来很大的便利。WORDPRESS SEO技巧系列教程就是希望通过一些常规的技巧介绍,揭开SEO的神秘面纱,让使用Wordpress搭建个人Blog的用户能更好的实施搜索引擎优化。

  在介绍相关技巧之前,笔者想首先强调一下,原创的内容和坚持不断的更新,是最好的优化技巧,Blogger们可不能本末倒置了。

  本教程以汉化的WORDPRESS 2.04版本举例说明。

WORDPRESS SEO技巧(1):实现URL Rewrite

  因为搜索引擎对动态网页的收录存在技术上的不足,所以实现网页的静态化,是提高页面收录数量很重要的途径。这里说的静态化,并不是一定要通过生成.html文件来实现,通过网址的重写,就是常说的URL Rewrite,也能达到这个目的。

  Wordpress 2.04版本已经很好的内置了URL重写功能,虽然说较低的版本可以通过增加插件来实现,但是考虑系统的稳定性,升级到新版本才是更好的选择。

  登录到管理后台,进入“选项”-“永久链接”,英文版本称之为“Permalink”。

  在“常规选项”中有四种设置方式,下面一一介绍:

  1、默认(Default)。
  http://www.chinasearchwatch.com/?p=123
  这就是没有进行URL重写的URL格式,这种格式是搜索引擎不喜欢的。

  2、基于日期和名称(Date and name based)。
  http://www.chinasearchwatch.com/index.php/2006/09/14/url-rewrite/
  一般的主机空间都能支持这种格式,如果选择这个设置后不能正常打开网页,你就要质疑你的主机提供商了。其中url-rewrite是你在撰写Blog的时候为文章起的别名(Post slug),如果没有写别名,系统会默认成你的文章标题。但是对于中文Blog而言,一般文章标题是较长的中文,还会有各种各样的中文标点出现,这些字符系统并不一定能很好的支持,所以建议还是要写上一个由字母和数字组成的别名。
  在文章别名的选择上,有这样的争议:选择英文单词好,还是选择拼音好。
  这个问题就涉及到各大中文搜索引擎对拼音的支持程度。个人认为中文搜索引擎还没有能很好的进行拼音识别,建议使用有一定语义的英文单词或英文单词的组合。
  以百度为例,输入拼音“chaye”进行搜索时,搜索引擎并不能准确判断你是要搜索“茶叶”还是搜索“茶业”,所以在搜索结果上方会给出一个“您要找的是不是: 茶叶  茶业”的提示,而搜索结果更是混杂了“茶叶”、“茶业”、“chaye”相关的内容。
  如果你的文章别名是用的“chaye”,那么搜索引擎可能不能很好识别,不如直接用英文的“tea”来的直接了。
  文章别名不支持. /等特殊符号,但可以使用英文的-,而且如果你录入url rewrite,系统会直接转化成url-rewrite这样的。
  当然URL中的文字内容对SEO的影响不是具有决定意义的,所以不一定为此过于费神,搞得和“标题党”们想新闻想标题那么复杂。

  3、数字(Numeric)。
  http://www.chinasearchwatch.com/index.php/archives/123
  这种方式直接按照文章的ID来重写URL,简单快捷,适合懒人使用,SEO效果小有不足,无伤大雅。

  4、自定义(Custom structure)。
  这种方式需要服务器有相关的支持,比如本站的服务器就不支持这个功能。
  设置方法:输入预期的路径结构形式,比如 /%year%/%monthnum%/%day%/%postname%/,这里的%postname%也可以用增加别名的方式改成英文字母的,最终形成的URL将会是像 http://www.chinasearchwatch.com/2006/09/14/url-rewrite/
  有的SEO认为最好是写成http://www.chinasearchwatch.com/url-rewrite/这种超级短的URL,认为会有更好的收录效果。实际操作发现,这样的改变对收录数量的提升几乎没有多少影响,而且你将面临文章别名重复导致URL重复的问题,大可不必。
  官方公布的参数有:%year% 年 %monthnum% 月 %day% 日 %hour% 时 %minute% 分 %second% 秒 %postname% 文章名 %post_id% 文章编号 %category% 分类名 %author% 作者,可以根据自己的需要进行选择。
  设置时应该注意:不要加入Blog地址(如http://www.chinasearchwatch.com),那是多余的;以/开头,结尾方式可以是.htm .html .php .asp或者就是在参数后面加上/,你可以试试让别人捉摸不透你用的到底是什么Blog系统;建议不要为了简洁只填入/%postname%,那可能导致文件混乱。

  设置好之后,确认更新,再到前台刷新,鼠标移动到文章链接上看看,是不是都变过来了。搜索引擎下次来抓取的时候,一定爽多了。

  另外分类名称如果是中文的也要加个别名,具体步骤:管理Manage >> 分类Categories,逐个编辑分类,填写分类别名(Category slug),比如本站“搜索引擎优化”分类的URL就是http://www.chinasearchwatch.com/index.php/category/seo/
  还有页面(Page)也可以通过增加别名的方式进行修改。

  一些基于Windows系统的服务器不能很好支持URL Rewrite,你也不用因此神伤,选择方式2或3就是了,实在还不行就老老实实用默认形式。再强调一下,这些技巧的介绍是锦上添花的,不要看作是生死攸关的大事。

 文章来源: 中文搜索引擎观察    作者: 姚志国

Comments

55种用Google找乐子的方法- 挺有意思的,推荐阅读–ZT

Comments

PageRank行将过时 搜索引擎遭遇范式转移

曾被喻为创新机器的Google,连同盛极一时的古格尔教(Google宗教),正在全球范围内经历一个不可逆转的去魅过程。Google还在创新吗?面对诸多创意迭出的第三代搜索引擎的出现,PageRank 算法——Google所赖以成名的利器,似乎并没有给我们提供一个比其他搜索引擎更相关或者呈现方式更好的搜索结果。

  比如说,在Google搜索框输入关键字查询,搜索结果往往会是数目多到目不暇接的一个个网页,除了提供的网页数日甚一日的多之外,你很难发现所搜索的结果和一年前有何分别。并且,呈现在你面前的这些网页几乎是没有经过任何处理的,比如自动分类、聚类、关联、个性化呈现等等。此外,当PageRank算法用于决定由大量社区内容、个人主页、blog组成的网页的相关性时,也越来越显得捉襟见肘,因为这些微内容的相关性排序很难套用PageRank算法。

  第二代搜索的软肋

  作为Google排名运算法则(排名公式)的核心,PageRank算法假定:某个网页被链接得越多,则该网页的等级和重要性就越大,从而在相关性排序中也就越靠前。PageRank的等级以PR值计算,PR值越高说明该网页越重要。虽然Google的排名算法实际上要远为复杂,比如还揉合了Title标识、Keywords标识等上百个参数和变量,但囿于关键词搜索本身的局限,Google并没有在搜索结果的相关性等指标上与其竞争对手拉开距离,如果不是有所不如的话。

  事实上,第二代搜索引擎所具有的局限性,Google几乎无一幸免。

  大体而言,第二代搜索的局限见于如下四个方面:

  其一,提供的提问函数相当有限。例如,雅虎只提供与、或运算,并且一旦选用了一个逻辑运算符,即必须应用于所有的关键词;再如,百度搜索仅支持与、或、非布尔表达式,而不支持异或,也不支持关键词之间的位置检索或者勾选搜索结果;

  其二,仅支持单个关键词或者一组关键词及逻辑运算符组成提问,而并不支持自然语言搜索或语义搜索。以百度为例,百度搜索支持字串搜索,当用户输入一段话进行查询时,百度会将其切分成多个词,按照逻辑“与”的关系进行关键词搜索,但搜索结果充其量仅能做到差强人意。所以如此,是因为关键词搜索本身并不是基于对内容的理解,所以关键词与搜索结果之间的匹配很难做到精准,往往是搜到哪算哪。

  其三,不能利用历史信息进行搜索。用户的每次搜索都是从头开始,而不能从原有的查询结果中作进一步选择;

  其四,呈现方式单一、呆板。多数搜索引擎只返回一个长长的搜索结果列表,其中可能有数以万计的包含关键词的网页,但这些网页是否以及在多大程度上与用户的搜索意图相关,则不得而知。

  Google的颠覆者

  在看到pagerank的局限性以后,一些新兴的搜索公司开始尝试通过提供更精准、更个性化的搜索结果,从在呈现方式上数年一贯制、几无创新的Google那里抢夺市场份额。

  例如Clusty,该公司通过借鉴Autonomy的模式识别技术以及自动分类等功能,可基于对概念的理解提供搜索结果的自动分类等功能。此外,像Grokker、Snap、Dogpile这样的后起之秀,也纷纷以更个性化的搜索结果呈现方式为招徕,连连攻城掠地。

  最近在美国颇受用户赞誉的另一个搜索引擎swicki,也在个性化和精准搜索方面可圈可点。虽然swicki的大部分内容来自Google,但同样针是对关键词,swicki可以根据用户注册时的使用偏好、搜索习惯,提供出不同的搜索结果。通过对搜索结果的二次评判,swicki还可以逐步校正搜索结果列表。

  在国内,除了类似bbmao这样的社会化搜索引擎开始提供自动分类、聚类、用户收藏等功能而崭露头角外,老牌搜索厂商雅虎中国,也在搜索算法和呈现方式上进行了诸多改进,不仅强化了对社区内容、blog等微内容的数据抓取,而且在个性化呈现、模糊搜索等方面也有较大举措。

  一个例子是,此前一个月,雅虎中国、雅虎全球、阿里巴巴三方联合推出了一个具有智能模糊匹配功能的搜索引擎——雅虎Imatch。据称,该系统可以根据用户的搜索习惯和意图,智能匹配相关的搜索结果。

  呈现方式的革命

  Clusty、bbmao等元搜索引擎的自动分类、聚类功能一出,即大受用户追捧,专家也认为其提供了比之Google更精准、细分的呈现方式,殊不知Clusty、bbmao等所提供的自动分类、聚类功能本身一点都不新鲜。早在10年前,英国的企业搜索巨擘Autonomy已经提供了同类乃至更智能的呈现方式。

  例如,Autonomy基于某种专有的模式匹配和概念搜索的算法,可以自动根据文本中的概念进行分类,自动标引,并基于用户兴趣自动匹配出个性化、多侧面的直接或隐含的相关档案。当用户在搜索框中键入某个关键词,出现的结果可能被系统自动分为10类(或更多类),若其中9类与用户的查询期望距离较大,用户就可以将接近的那个结果作为查询条件,进行第二次查询,直到找到最需要的搜索结果。而Google、百度等第二代搜索引擎则主要使用SVM和KNN算法进行分类,因为算法的先天缺陷,分类准确率仅能达到80%到85%。并且,如果分类树有变更,如增加、修改或删除某个分类节点,整颗分类树就必须重新学习。

  同样因为基于概念的理解,Autonomy还可以通过抽取文档中包含的重要概念,把相似的文档聚类到一起(相关性算法),自动生成类别的标题,并支持二维岛图、二维趋势图以及三维立体图的图形化结果展示。前不久Google趋势搜索以及百度指数的推出,在某些方面可视为对这一功能的一种模仿。

  更值得一提的是,模式识别算法还可以分析信息间的主要关系,进而实现内容间的交叉索引对照和自动关联,并实时生成超链接。换句话说,该算法可以不仅可以做到精准定位用户的搜索意图,还可以提供用户可能压根想不到的搜索列表。当用户不知道用什么关键词去搜索的时候,这种对相关信息的引发就可以满足用户的一些“模糊需求”,而这是Google等第二代搜索所不具备的。

  浮现中的第三代搜索

  作为对第二代搜索的一种超越,第三代搜索的范式革命不光见于呈现方式,而是表现为参差多态的演化路径,例如个性化搜索、社会化搜索、本地化搜索、知识问答社区、社区内容搜索等等。而在核心搜索技术上,则大致包含人工智能、模式识别、语义分析、神经网络等发展方向。由于神经网络搜索和人工智能搜索耗资巨大,目前还没有出现成型的搜索引擎,不过,包括Google、微软、IBM、Roussinov等在内的搜索引擎均已将人工智能搜索的研发提上了议事日程。在国内,Aisou等公司也跃跃欲试,随时准备推出人工智能搜索产品。

  值得一提的是,Autonomy的模式识别技术本身也包含有语义分析技术和部分人工智能技术。虽然迄今为止,计算机还无法做到完全理解语言,但通过采用基于统计学、概率论和信息论的概念识别技术,Autonomy可以理解信息的意义和信息间的连接。用户搜索时可以直接以自然语言输入一句话或一段文字,甚至一篇文章,Autonomy会自动判断用户查询条件所描述的概念,从企业文档库中查找所有和用户搜索概念相关的文档。显然,语义搜索比传统关键词搜索更能精准定位用户的搜索意图。

  由于是基于对概念和概念之间关系的理解,Autonomy还可以利用精选内容中完整的上下文,实现概念提炼或基于例子的提炼,进而聚焦用户所感兴趣的概念结果,并提供自动建立档案、社区及协作、信息自动推送等个性化搜索功能。不光如此,该系统还可以自动判别使用者的身份,并通过不断学习更新系统的知识库。

  关于第三代搜索,众多的创新者已经为我们勾勒出一个大致的轮廓,但可以预言并且相信的是,

  浮现中第三代搜索引擎今后的进化之旅,还会有很多很多超出我们的想象。

Comments

Google新闻存档搜索的意义

Google新闻存档搜索的意义

Google在新闻频道推出了历史新闻搜索服务,用户可以在这里搜索到甚至18世纪的新闻。

在这些信息中,包括两部分其一是网上采集,应该比例较少,其二是与其他媒体或者数据公司合作,获得数据授权使用,目前与Google的合作公司包括,纽约时报公司(New York Times),华盛顿邮报公司(Washington Post),LexisNexis,《华尔街日报》,Factiva等,使用该服务的用户同时可以搜索到这些家公司提供的文章。

在新闻存档搜索的结果中,正常显示标题/摘要/时间等,“付费”“免费”信息混杂在一起,如果用户选择 阅读收费的信息可能就要支付一定的费用。在高级检索当中,可以只在“付费”或“免费”的信息中进行搜索。检索结果可以按照Search articles和Show timeline两中方式排序,分别体现了相关性和时间因素对用户的意义,你完全可以按照自己需要对搜索结果去重排,更详尽的请阅读东宝的解读那时间排序中的新闻的时间到底是什么呢,难道200年前真有报道?当然不是,目前来看,Google采用的是机器识别文章的时间,也就是说,一般的是新闻的发布时间,从合作机构很容易获得这些数据项,但是很多非结构化数据则是自动识别提取时间为主,这就不难明白央视国际会出现40年代的新闻,而且百度会有很多80年代的新闻

这个产品对于谷歌来讲他的意义在于Google用事实向世界宣布“我们的目标是,索引全世界!”,仅此而已。这种产品本身没有什么重要意义,只是个有价值的商务合作而已。这种合作模式重新定义了搜索引擎与内容供应商的之间关系,这种关系不再是一个robots.txt所能表达或约束的了,双方应该合作互利共赢的,这种模式其实在百度的产品很常见,比如早期的百度国学百度邮编,新近的百度法律等一样。

Comments

Google Click to talk in UK, cool, how about China? when?

Google’s Click To Call In UK

I reported yesterday that Google seems to have launched Click To Call in the UK. A search on jet2 should bring back an ad from Directline Holidays with a green phone, clicking on the phone will allow you to enter your phone number for a call back from that advertiser. Click to call was launched by Google in the US in February 2006. I have screen captures and more details at the Search Engine Roundtable.

Posted by Barry Schwartz on Sep. 5, 2006 | Permalink

Comments

想做搜索引擎优化专家的十大原因—还是转载,但深有同感的一篇小文–SEO-搜索引擎优化

想做搜索引擎优化专家的十大原因 2006年04月25日
想做搜索引擎优化专家的十大原因。  

10)你能把你自己的网站先做到前十名去。看着越来越多人来你的网站是一件很让人洋洋得意的事情。

9)你可以和别人说你非常了解Google,百度和雅虎。

8)绝大部分人永远搞不懂你到底是干什么的。有时候这是一件坏事,有时候这是一件非常大的好事。

7)差不多每个人都可以说,自己是一个专家。因为这个行业里,最有经验的人也超不过十年经验。

6)你得经常看一大堆博客和论坛。时间很快就过去了。

5)你参加过多次Google的舞会(Google的数据更新Google Dance,在英语里直译是Google之舞)。

4)搜索引擎优化,或者说宽泛一点网络营销不是泡沫。绝对不用担心这一点。

3)如果你成名了,会有人邀请你去演讲或者帮他们的网站诊断,你就可以打着工作的旗号四处转转。

2)懂得搜索引擎优化SEO,想一点钱都不赚那是很困难的。真的。

1)好玩。

作者: Zac
原载: 搜索引擎优化每天一贴
版权所有。转载时必须以链接形式注明作者和原始出处及本声明。

Comments

百度给站长的建站指南-官方版本

Google和百度的官方站长指南,推荐每一个对SEO有兴趣的朋友看一下,毕竟官方还是有官方的价值和意义的。—下文完全摘自百度给站长的建站指南

 
百度给站长的建站指南 网站登录问题 百度关于垃圾网站的处理

 百度给站长的建站指南
 

  1. 如何使您的站点被百度有效收录
    • 给每个网页加上与正文相关的标题。如果是网站首页,则标题建议使用站点名称或者站点代表的公司/机构名称;其余内容页面,标题建议做成正文内容的提炼和概括。这可以让您的潜在用户快速的访问到您的页面。
      请不要在标题中堆积与正文无关的关键词。
    • 确保每个页面都可以通过一个文本链接到达。百度无法识别Flash中的链接,这些单元上的链接所指向的网页,百度就无法收录了。
    • 页面间的链接,尽量使用平实的超链,而不是重定向跳转。使用自动跳转的页面,可能会被百度丢弃。
    • 尽量少使用frame和iframe框架结构。
    • 如果是动态网页,请控制一下参数的数量和URL的长度。百度更偏好收录静态网页。
    • 在同一个页面上,不要有过多链接。在那些站点地图类型的页面上,请把重要的内容给出链接,而不是所有细枝末节。链接太多,也可能会导致无法被百度收录。
  2. 什么样的站点会受到百度欢迎
    • 站点应该是面向用户的,而不是面向搜索引擎的。一个受到用户欢迎的站点,最终也会受到搜索引擎欢迎;反过来,如果您的站点做了很多针对百度的优化,但却给用户带来大量负面体验,那么,您的站点最终可能还是会受到百度的冷落。
    • 百度更喜欢有独特内容的网页,而不是简单抄袭和重复互联网上已有内容的网页。对于已经被重复了千百遍的内容,百度可能会不予收录。
    • 请谨慎使用您的站点链接。与一些垃圾站点做友情链接,很可能会使您的网站受到负面影响。因此,当有人很热情的要求您为他的站点提供友情链接时,请审视以下两点:
      一,对方的站点在他那个领域是否是高质量的?站长间所谓的流量以及排名,很多都是用欺骗手段获取的,无法保持长久。
      二,对方要求的链接名称是否和对方网站地位相称?用一个涵盖范围广泛的关键词来做一个内容非常局限的网站的链接名称,很可能会使您的网站受到负面影响。
    • 经常保持内容更新。经常有新内容产生的站点,百度是会注意到,并且大力欢迎,而且会频繁造访。

 网站登录问题
 

  1. 我的网站更新了,可是百度收录的内容还没更新怎么办?
    答:百度会定期自动更新所有网页(包括去掉死链接,更新域名变化,更新内容变化)。因此请耐心等一段时间,您的网站上的变化就会被百度察觉并修正。
  2. 怎样使我的网站被百度收录?
    答:百度免费自动收录您的站点。如果您希望百度尽快收录,请到网站登录提交您的网址;只需提交网站首页,内部页面百度会自动抓取。
  3. 从提交到被收录,大约需要多久?
    答:通常需要1-4周时间。
  4. 我不想让百度收录我的站点,该怎么办?
    答:百度尊重和遵守robots协议,您可以写一个robots文件限制您的网站全部或部分不被百度收录。详情参见禁止搜索引擎收录的办法
  5. 我的站点为什么在百度中搜不到?
    答:可能的原因如下: 

    • 您可能还没向百度提交您的网站;
    • 您已经登录了网站,但由于时间短,百度还未收录;
    • 如果百度检测到您的网站无法访问,您的站点就有可能被百度暂时删除;
    • 如果您的网站内容有不符合中国法律的地方,则无法被百度收录;
    • 如果您的站点页面结构复杂,则可能无法被百度收录(详见如何使您的站点被百度有效收录);
    • 如果您的网站被百度判别为垃圾站点,则可能被百度拒绝收录或者随时删除(详见百度关于垃圾网站的处理)。
    • 如果您的网站的首页在百度搜索不到,则可能是由于您的网站不稳定使首页被判别为死链接导致丢失。您的网站稳定后,首页会重新在百度中被搜索到。百度并不允诺能收录所有站点。如果有上述回答无法说明的问题,请发信到webmaster@baidu.com询问。
  6. 我的站点在百度搜索结果中排名下降了,该怎么办?
    答:排序变动很正常。一般情况下,只要您不断提高网站内容质量,让更多的用户喜欢您的网站,成为您的忠实用户,您的网站在百度的排名一般就不会很差。

 百度关于垃圾网站的处理
 

  1. 如果您的站点中的网页,做了很多针对搜索引擎而非用户的处理,使得:用户从搜索结果中看到的内容与页面实际内容完全不同,或者站点质量与站点在搜索结果中的排名极不相称,从而导致用户产生受欺骗感觉,那么,您的网站就有可能被百度丢弃。
  2. 如果您的站点上的网页,大量都是复制自互联网上的高度重复性的内容,那么,您的站点也有可能被百度丢弃。

所以,当您的网站从百度消失,请先审视一下自己的站点有无问题。有任何意见,请反馈到webmaster@baidu.com

您也可以向百度投诉搜索中遇到的垃圾网站或者网页,帮助百度保持搜索结果的质量。

Comments

Google 网站管理员指南-官方版本

Google和百度的官方站长指南,推荐每一个对SEO有兴趣的朋友看一下,毕竟官方还是有官方的价值和意义的。—下文完全摘自Google给出的网站管理员指南 

什么是 Google 网站管理员指南?

网站管理员指南遵循这些指南将有助于 Google 查找、索引并对您的网站进行排名。即使您选择不采纳这些建议,我们也强烈建议您对”质量指南”多加留意,其中简要说明了一些可能造成网站从 Google 索引中彻底删除的违禁行为。网站被删除之后,Google.com 或 Google 所有合作伙伴网站的搜索结果中都不会再显示该网站。   

网站准备就绪后:

  • 将其他相关网站链接到您的网站上。
  • 将其提交给 Google,网址为:http://www.google.com/addurl.html
  • 将 Sitemap 作为我们 Google Sitemaps(测试版)项目的一部分进行提交。Google Sitemaps 使用您的 Sitemap 了解您网站的结构并提高我们对您网页的利用率。
  • 确保应了解您网页的所有网站都知道您的网站已处于在线状态。
  • 将您的网站提交给相关的目录,例如,Open Directory Project 和 Yahoo!,以及其他特定行业的专业网站。

设计与内容指南

  • 网站应具有清晰的层次结构和文本链接。每个网页应至少可以通过一个静态文本链接打开。
  • 为用户提供一个网站地图,列出指向网站重要位置的链接。如果网站地图上的链接超过或大约为 100 个,则需要将网站地图拆分为多个网页。
  • 网站应具有实用性且信息丰富,网页文字应清晰、准确地表述要传达的内容。
  • 要考虑到用户会使用哪些字词来查找您的网页,确保网站上确实包含了这些文字。
  • 尽量使用文字而不是图像来显示重要的名称、内容或链接,因为 Google 抓取工具无法识别图像中所含的文字。
  • 确保 TITLE 和 ALT 标记具有说明性且表达精准无误。
  • 检查链接是否损坏,并确保 HTML 格式正确。
  • 如果采用动态网页(即网址中包含”?”字符),请注意并非每一个搜索引擎 Spider 都能像抓取静态网页一样抓取动态网页。动态网页有助于缩短参数长度并减少参数数目。
  • 将给定网页上的链接限制在合理的数量内(少于 100)。

技术指南

  • 由于大部分搜索引擎 Spider 查看网站的方式与 Lynx 一样,所以可使用 Lynx 一类文本浏览器来检查您的网站。如果因应用了 Javascript、Cookie、工作阶段 ID、框架、DHTML 或 Flash 等复杂技术,而导致在文本浏览器中无法看到网站的所有网页,则搜索引擎 Spider 在抓取您的网站时可能会遇到麻烦。
  • 允许搜索漫游器抓取您的网站,同时不采用工作阶段 ID 或参数跟踪其在网站上的浏览路径。这些技术对跟踪单个用户的行为非常有用,但漫游器的访问模式却完全不同。如果采用这些技术,则可能会导致对网站的检索不完整,因为漫游器可能无法排除那些看上去不同,但实际却指向同一个网页的网址。
  • 确保您的网络服务器支持 If-Modified-Since HTTP 标头。通过该功能,您的网络服务器可以告诉 Google 自上次抓取您的网站以来,内容是否已发生变化。该功能可以节省您的带宽和开销。
  • 利用网络服务器上的 robots.txt 文件。该文件会告诉抓取工具可以抓取哪些目录。 确保该文件是网站的最新版本,以免意外拦截 Googlebot 抓取工具。 请访问 http://www.robotstxt.org/wc/faq.html,了解如何在漫游器浏览您的网站时对其进行指示。您可使用 Google Sitemaps 中的 robots.txt 分析工具测试 robots.txt 文件以确保正确使用该文件。
  • 如果贵公司购买了内容管理系统,请确保该系统能导出您的内容,以便搜索引擎 Spider 可以抓取您的网站。
  • 请勿使用”&id=”作为您网址的参数,因为我们不会在索引中包含这些网页。

质量指南

上述质量指南涵盖了最常见的作弊形式或操纵行为,对于此处未列出的其他误导行为(例如,通过注册知名网站的错拼形式来欺骗用户),Google 仍可予以拒绝。不要抱有侥幸心理,认为某种欺骗手段未在本页中列出,Google 就会认可该手段。作为网站管理员,与其花费大量时间寻找漏洞加以利用,不如尽其所能维护基本原则,以便为用户带来更好的体验,从而使网站获得更高的排名。如果您认为其他网站正在滥用 Google 质量指南,请通过 http://www.google.com/contact/spamreport.html 举报该网站。Google 希望能开发出灵活的自动解决方案来解决上述问题,因而尽量避免一一处理违禁行为。我们收到的垃圾邮件报告将用于创建灵活的算法以识别并阻止以后的垃圾邮件。质量指南 - 基本原则

  • 设计网页时该考虑的是用户,而不是搜索引擎。不要欺骗用户,或提交给搜索引擎一种内容,而显示给用户另一种。这种做法通常称为”隐藏”。
  • 请不要为了提高搜索引擎排名而弄虚作假。一个简单分辨是非的方法是:您是否可以坦然地跟竞争对手网站解释您对网站所做的事情。另一个有用的测试即扪心自问:”这能否给我的用户带来帮助?如果不存在搜索引擎,我是否还会这样做?”
  • 请不要参与旨在提高您的网站排名或 PageRank 的链接方案。尤其要避免链接到违禁的网站或”恶邻”,因为您自身的排名可受到这些链接的负面影响。
  • 请不要使用未授权的计算机程序提交网页、检查排名等。这些程序会耗用计算机资源并违反我们的服务条款。 Google 不建议使用 WebPosition Gold™ 这类产品向 Google 发送自动查询或用程序编写的查询。

质量指南 - 具体指南

  • 请不要使用隐藏文本或隐藏链接。
  • 请不要采用隐藏真实内容或欺骗性重定向手段。
  • 请不要向 Google 发送自动查询。
  • 请不要使用无关用语加载网页。
  • 请不要创建包含大量重复内容的多个网页、子域或域。
  • 请不要创建安装病毒(如,特洛伊木马)或其他有害软件的网页。
  • 请不要采用专门针对搜索引擎制作的”桥页”,也不要采用如联属计划这类原创内容很少或几乎没有原创内容的”俗套”(cookie cutter) 方式。
  • 如果您的网站参加联属计划,请确保您的网站可为其增添价值。请提供独特而相关的内容,使用户有理由首先访问您的网站。

如果网站不符合我们的质量指南,则可能会将其排除在索引之外。如果认为您的网站不符合这些指南,可进行修改使其满足要求,然后请求重新加入

Comments

网站登陆-搜索引擎之友-searchenginefans.com

今天完成了对搜索引擎之友-searchenginefans这个新网站SEO的第一课-向各大搜索引擎提交了网站域名。

对于一个新成立的网站来说,这是你SEO自己网站的第一步,让Spider来得更猛烈些吧~

下面列明今天我提交的一些搜索引擎的网站登陆窗口:

Google谷歌中国:http://www.google.com/intl/zh-CN/add_url.html

百度Baidu:http://www.baidu.com/search/url_submit.html

Yahoo雅虎搜索中国:http://search.help.cn.yahoo.com/h4_4.html

MSN搜索中国: http://search.msn.com.cn/docs/submit.aspx?FORM=WSDD2

中搜zhongsou: http://d.zhongsou.com/NetSearch/pageurlrecord/frontpageurl.jsp

一般来说蜘蛛Spider理想的话会在1-3个月内对登录的网站进行抓取,如何检查你的网站有否被搜索引擎收录,可以通过在搜索引擎的搜索框中键入site:domainname命令来查询,例如:

在Google谷歌的搜索框中键入 site:searchenginefans.com 可查询到搜索引擎之友-searchenginefans在Google的收录情况。

作者:cpikachu

原载:搜索引擎之友-searchenginefans.com

版权所有。转载时必须以链接形式注明作者和原始出处及本声明。

Comments

« Previous entries