Archive for 搜索引擎友好设计-SEO

[ZT]巧妙地处理内容重复

用户经常问我们关于重复内容的问题。以下文章翻译自谷歌网站管理员中心英文官方博客。作者是Adam Lasnik, 谷歌搜索布道者。发表于2006年12月18日。

原文 Deftly dealing with duplicate content

最近,搜索引擎战略会议在寒冷的芝加哥举行。许多谷歌参加者总是被问及关于重复内容的问题。对于这个话题,我们发现有许多破碎的并且有些混乱的理解。我们想在此予以澄清。

什么是内容重复?

重复的内容一般是指在不同域名间存在大量的相同或相似的内容。很多时候,它并非故意或至少本无恶意。譬如说,有些论坛会生成一些专为手机屏幕的页面;商店物品被显示在(有时甚至是链接到)多种不同的URL上,等等。但有些时候,一些网站为了操纵搜索引擎排名,获得更多流行或长尾查询的访问量,大量地从其他网站复制内容。

什么不是重复内容?

虽然谷歌网站有方便易用的翻译功能,我们的算法不会把有着相同内容的英文版和西班牙文版看作内容复制。同样,你不用担心我们把你文章中对其他文章小片段的引用认定为重复内容。

为什么谷歌关心重复内容?

谷歌用户使用Google时通常希望看到多样化的原创内容。如果他们找到的都是内容相同的一堆搜索结果,可以想见那是多么烦人。另外,网站管理员不愿意看到 Google给出象example.com/contentredir?value=shorty-george〈=en一样复杂的URL。他们往往更喜欢类似example.com/en/shorty-george.htm的URL。

谷歌做了些什么?

Google 在抓取网页和获得搜索结果时,总是力图索引并显示内容不同的页面。这种过滤意味着,譬如说,如果你的网站有文章的正常版和打印版,并且你没有在 robots.txt里设定noindex标记,谷歌就只会选择一个版本显示给谷歌用户。对于企图利用复制内容来操控排名,欺骗谷歌用户的少数情况,我们会在对相关页面的索引和排名作出适当调整。当然,我们更愿意把重点放在过滤而不是排名调整上… 因此,在绝大多数情况下,最坏的结果就是原创者看到了不愿看到的版本出现在我们的索引里。

网站管理员如何主动处理内容复制问题?

* 适当阻止搜索引擎访问:与其让我们的算法来确定一个文件的”最佳”版本,你也许希望指引谷歌选取你的首选版本。譬如说,如果你不想我们索引你网站文章的打印版,你可以在你的robots.txt文件中写上目录名或正则表达式来禁止谷歌对那些打印版的抓取。
* 使用301重定向:如果你已经重构你的网站,请在你的原网站的.htaccess中使用301重定向(永久性重定向)来重定向你的用户、Google爬虫、以及其他搜索引擎蜘蛛等。
* 链接要一致:努力使你的内部链接保持一致; 不要既有/page/,又有/page和/page/index.htm 的内部链接.
* 使用顶级域名:为了让我们总是使用最合适的文件版本, 请尽可能使用国家特定的顶级域名。与诸如example.com/de或de.example.com的URL相比,谷歌肯定更清楚地知道example.de是以德文为核心的内容。
* 小心辛迪加式的联合供文:如果你为其他网站上也提供你的内容,请在每一个其他网站的文章中包括连回原文章的链接。注意:即使是这样,对一个查询,谷歌总是显示我们认为是最适合的(没被网站禁止的)版本, 它可能是,也有可能不是你所想要的版本。
* 使用谷歌网站管理员工具的首选域功能: 如果其他网站链接你的URL时既使用www版本又使用无www的版本,你可以用谷歌网站管理员工具让我们知道你想要哪种索引方式。
* 减少模板网页上的重复内容:拿版权声明来说,你有两种选择,一种是在你的每一个页面底部都有一个冗长的版权声明。另一种是设立一个专门的版权详细声明页,然后在每页底部写一个非常简短的总结,并链接到版权声明页。
* 避免发布无内容页: 用户不喜欢看到无实际内容的页面。要尽量避免空架页。以房地产网页为例,不要发布(或至少要阻止)没有点评的点评网页,或者没有房地产列表的房地产罗列网站等。只有这样,网站用户(以及Google爬虫)才不会看到无穷多的写着“以下是在【某城市名】中不可错失的待租房列表…”但其实根本没有什么列表的网页。
* 了解你的内容管理系统:确保你熟悉你的网站是怎样显示内容的,尤其是当它包括了博客,论坛,或相关的系统。往往在这些系统中同一内容会以多种形式出现。
* 不要担心,保持快乐:不要过分受搜刮(挪用和转载)你内容站点的干扰。虽然很恼人, 它们几乎不可能对你在谷歌中的存在产生负面影响。如果你实在忍无可忍, 欢迎你提出千禧年著作权法案申请来声明对你的内容的所有权。我们会处理那些无赖网站。

总之, 如果你对内容复制问题有一个大体的认识,又能花上几分钟有见地地预防性维护一下你的网站,这将既帮助你们,也帮助我们为用户提供独特而相关的内容。

Comments

google技巧、推广、方法、教程、使用指南、大全

google技巧、google教程、google方法、google功能介绍、google使用指南、google推广、google使用大全Google(www.Google.com)是一个搜索引 擎,由两个斯坦福大学博士生Larry Page与Sergey Brin于1998年9月发明,Google Inc. 于1999年创立。2000年7月份,Google替代Inktomi成为Yahoo公司的搜索引擎,同年9月份,Google成为中国网易公司的搜索引 擎,98年至今,Google已经获得30多项业界大奖。

搜索入门

第一次进入Google,它会根据你的操作系统,确定语言界面。需要提醒的是,Google是通过cookie来存储页面设定的,所以,如果你的系统禁用cookie,就无法对Google界面进行个人设定了。

Google的首页很清爽,LOGO下面,排列了四大功能模块:网站、图像、新闻组和目录服务。默认是网站搜索。现在进行第一次搜索实践,假定 你是个搜索新手,想要了解一下搜索引擎的来龙去脉和搜索技巧。在搜索框内输入一个关键字“搜索引擎”, 选中“搜索中文(简体)网页”选项,然后点击下面的“Google搜索”按钮(或者直接回车),结果就出来了。

注意:文章中搜索语法外面的引号仅起引用作用,不能带入搜索栏内。

初阶搜索

上例中,单个关键字“搜索引擎”,搜索得的信息浩如烟海,而且绝大部分并不符合自己的要求,怎么办呢?我们需要进一步缩小搜索范围和结果。

1,搜索结果要求包含两个及两个以上关键字

一般搜索引擎需要在多个关键字之间加上“ ”,而Google无需用明文的“ ”来表示逻辑“与”操作,只要空格就可以了。现在,我们需要了解一下搜索引擎的历史,因此期望搜得的网页上有“搜索引擎”和“历史”两个关键字。

示例:搜索所有包含关键词“搜索引擎”和“历史”的中文网页

搜索:“搜索引擎 历史”

结果:已搜索有关搜索引擎 历史的中文(简体)网页。 共约有78,600项查询结果,这是第1-10项 。 搜索用时0.36秒。

用了两个关键字,查询结果已经从70多万项减少到7万多项。但查看一下搜索结果,发现前列的绝大部分结果还是不符合要求,大部分网页涉及的“历 史”,并不是我们所需要的“搜索引擎的历史”。 怎么办呢?删除与搜索引擎不相关的“历史”。我们发现,这部分无用的资讯,总是和“文化”这个词相关的,另外一些常见词是“中国历史”、“世界历史”、 “历史书籍”等。

2,搜索结果要求不包含某些特定信息

2.1,Google用减号“-”表示逻辑“非”操作。“A –B”表示搜索包含A但没有B的网页。

示例:搜索所有包含“搜索引擎”和“历史”但不含“文化”、“中国历史”和“世界历史”的中文网页

搜索:“搜索引擎 历史 -文化 -中国历史 -世界历史”

结果:已搜索有关搜索引擎 历史 -文化 -中国历史 -世界历史的中文(简体)网页。

示例:搜索所有包含“易筋经”而不含“吸星大法”的中文网页
搜索:“易筋经 -吸星大法”
结果:已搜索有关易筋经 -吸星大法的中文(简体)网页。共约有5,440项查询结果,这是第1-10项。搜索用时0.13秒。
注意:这里的“+”和“-”号,是英文字符,而不是中文字符的“+”和“-”。此外,操作符与作用的关键字之间,不能有空格。比如“易筋经 - 吸星大法”,搜索引擎将视为逻辑“与”操作,中间的“-”被忽略。

2.2,GOOGLE无需用明文的“+”来表示逻辑“与”操作,只要空格就可以了。
示例:搜索所有包含关键词“易筋经”和“吸星大法”的中文网页
搜索:“易筋经 吸星大法”
结果:已搜索有关易筋经 吸星大法的中文(简体)网页。共约有726项查询结果,这是第1-10项。搜索用时0.13秒。
注意:文章中搜索语法外面的引号仅起引用作用,不能带入搜索栏内。
注意:小写的“or”,在查询的时候将被忽略;这样上述的操作实际上变成了一次“与”查询。
“+”和“-”的作用有的时候是相同的,都是为了缩小搜索结果的范围,提高查询结果命中率。
例:查阅天龙八部具体是哪八部。
分析:如果光用“天龙八部”做关键字,搜索结果有26,500项,而且排前列的主要与金庸的小说《天龙八部》相关,很难找到所需要的资讯。可以用两个方法减少无关结果。
1,如果你知道八部中的某一部,比如阿修罗,增加“阿修罗”关键字,搜索结果就只有995项,可以直接找到全部八部,“天龙八部 阿修罗”。
2,如果你不知道八部中的任何一部,但知道这与佛教相关,可以排除与金庸小说相关的记录,查询结果为1,010项,可以迅速找到需要的资料,“天龙八部 佛教 -金庸”。
注意:这里的“ ”和“-”号,是英文字符,而不是中文字符的“+”和“-”。此外,操作符与作用的关键字之间,不能有空格。比如“搜索引擎 - 文化”,搜索引擎将视为关键字为“搜索引擎”和“文化”的逻辑“与”操作,中间的“-”被忽略。

3,搜索结果至少包含多个关键字中的任意一个。

3.1,Google用大写的“OR”表示逻辑“或”操作。搜 索“A OR B”,意思就是说,搜索的网页中,要么有A,要么有B,要么同时有A和B。在上例中,我们希望搜索结果中最好含有“archie”、“lycos”、“蜘 蛛”等关键字中的一个或者几个,这样可以进一步的精简搜索结果。

示例:搜索如下网页,要求必须含有“搜索引擎”和“历史”,没有“文化”,可以含有以下关键字中人任何一个或者多个:“Archie”、“蜘蛛”、“Lycos”、“Yahoo”。

搜索:“搜索引擎 历史 archie OR 蜘蛛 OR lycos OR yahoo -文化”

结果:已搜索有关搜索引擎 历史 archie OR 蜘蛛 OR lycos OR yahoo -文化的中文(简体)网页。 共约有8,400项查询结果,这是第1-10项 。 搜索用时0.16秒。

我们看到,搜索结果缩小到8千多项,前20项结果中,大部分都符合搜索要求。如果你想了解一下解搜索引擎的历史发展,就不妨研究一下现在搜索到的结果吧。

注意:“与”操作必须用大写的“OR”,而不是小写的“or”。

在上面的例子中,我介绍了搜索引擎最基本的语法“与”“非”和“或”,这三种搜索语法Google分别用“ ”(空格)、“-”和“OR”表示。顺着上例的思路,你也可以了解到如何缩小搜索范围,迅速找到目的资讯的一般方法:目标信息一定含有的关键字(用“ ”连起来),目标信息不能含有的关键字(用“-”去掉),目标信息可能含有的关键字(用“OR”连起来)。
3.2,关键词的选择在搜索中起到决定性的作用,所有搜索技巧中,关键词选择是最基本也是最有效的。

例一:查找《镜花缘》一书中淑士国酒保的酸话原文。

分析:如果按照一般的思路,找某部小说中的具体段落,就需要用搜索引擎先找到这本书,然后再翻到该段落。这样做当然可以,但是效率很低。如果了解目标信息 的构成,用一些目标信息所特有的字词,可以非常迅速的查到所需要的资料。也就是说,高效率的搜索关键字不一定就是目标信息的主题。在上面的例子中,酒保谈 到酒的浓淡与贵贱的关系时,之乎者也横飞。因此,可以用特定的词语一下子找到目标资料。
搜索:“酒 贵 贱 之”,OK,找到的第一条信息就是镜花缘的这一段落:“先生听者:今以酒醋论之,酒价贱之,醋价贵之。因何贱之?为甚贵之?真所分之,在其味之。酒昧淡之,故而贱之;醋味厚之,所以贵之。…”
以上的关键字选择技巧可以谓之“特定词法”。

例二:“黄花闺女”一词中“黄花”是什么意思。
分析:“黄花闺女”是一个约定的俗语,如果只用“黄花闺女 黄花”做关键词,搜索结果将浩如烟海,没什么价值,因此必须要加更多的关键词,约束搜索结果。选择什么关键词好呢?备选的有“意思”、“含义”、“来 历”、“由来”、“典故”、“出典”、“渊源”等,可以猜到的是,类似的资料,应该包含在一些民俗介绍性的文字里,所以用诸如“来历”、“由来”、“出 典”等词汇的概率更高一些。
搜索:“黄花闺女 黄花 由来”,查到“黄花”原来出典于《太平御览》,与南朝的寿阳公主相关。如果想获得第一手资料,那就可以用“太平御览 寿阳公主”做搜索了。
以上的关键字选择技巧可以谓之“近义词法”。

例三:刘德华同志的胸围是多少。
分析:首先声明,这是某个MM要我做的搜索,我把它作为搜索案例而已,没其他的意思。非常直接的搜索是,“刘德华 胸围”,但事实上,这么搜索出来的结果,尽是一些诸如“刘德华取笑莫文蔚胸围太小”之类的八卦新闻,无法快速得到所需要的资料。可以想到的是,需要的资料 应该包含在刘德华的全面介绍性文字中,除了胸围,应该还包括他的身高,体重,生日等一系列相关信息。OK,这样就可以进一步的增加其他约束性关键词以缩小 搜索范围。
搜索:“刘德华 胸围 身高”,没有料到的情况发生了,网上炙手可热的痞子蔡《第一次亲密接触》里居然含有这样关键字,阿泰“改编自刘德华《忘情水》的变态歪歌”、“用身高体重 三围和生日来加以编号”。好办,把这部小说去掉,“刘德华 胸围 身高 -阿泰”,OK,结果出来了,华仔胸围84cm。说明一下,为什么用“阿泰”而不用“第一次亲密接触”呢?这是因为小说的名字被转载的时候可能有变动,但 里面角色的名字是不会变的。
以上的关键字选择技巧可以谓之“相关词法”。

3.3,其他常用搜索个案
例一:找人
分析:一个人在网上揭示的资料通常有:姓名,网名,性别,年龄,毕业学校,工作单位,外号,住址,电话,信箱,BP,手机号码,ICQ号,OICQ号等等。所以,如果你要了解一下你多年没见过的同学,那不妨用上述信息做关键字进行查询,也许会有大的收获。

例二:找软件
分析一:最简单的搜索当然就是直接以软件名称以及版本号为关键字查询。但是,仅仅有软件名称和目标网站,显然还不行,因为搜索到的可能是软件的相关新闻。 应该再增加一个关键字。考虑到下载页面上常有“点击此处下载”或者“download”的提示语,因此,可以增加“下载”或者“download”为关键 字。
搜索:“winzip 8.0 下载”
结果:已搜索有关winzip 8.0 下载的中文(简体)网页。共约有6,670项查询结果,这是第1-10项。搜索用时0.22秒。
分析二:很多网站设有专门的下载目录,而且就命名为“download”,因此,可以用INURL语法直接搜索这些下载目录。
搜索:“winzip 8.0 inurl:download”
结果:已搜索有关winzip 8.0 inurl:download的中文(简体)网页。共约有358项查询结果,这是第1-10项。搜索用时0.44秒。
在互联网上随意的下载软件是不安全的,因为供下载的软件有可能带有病毒或者捆绑了木马,所以,对下载网站作一个限定,是一个稳妥的思路。可以用SITE语法达到这个目的。
共享软件下载完之后,使用的时候,软件总跳出警示框,或者软件的功能受到一定限制。由于中国的网民多是穷棒子,所以应该再找一个注册码。找注册码,除了软 件的名称和版本号外,还需要有诸如“serial number”、“sn”、“序列号”等关键字。现在,来搜索一下winzip8.0的注册码。
搜索:“winzip 8.0 sn”
结果:已向英特网搜索winzip 8.0 sn. 共约有777项查询结果,这是第1-10项。搜索用时0.30秒。

例三:找图片
除了GOOGLE提供的专门图片搜索功能,还可以组合使用一些搜索语法,达到图片搜索之目的。
分析一:专门的图片集合,提供图片的网站通常会把图片放在某个专门目录下,如“gallary”、“album”、“photo”、“image”等。这样就可以使用INURL语法迅速找到这类目录。现在,试着找找小甜甜布兰妮的照片集。
搜索:“”britney spears” inurl:photo”
结果:已向英特网搜索”britney spears” inurl:photo. 共约有2,720项查询结果,这是第1-10项。搜索用时0.23秒。
分析二:提供图片集合的网页,在标题栏内通常会注明,这是谁谁的图片集合。于是就可以用INTITLE语法找到这类网页。
搜索:“intitle:”britney spears” picture”
结果:已向英特网搜索intitle:”britney spears” picture. 共约有317项查询结果,这是第1-10项。搜索用时0.40秒。
分析三:明星的FANS通常会申请免费个人主页来存放他们偶像的靓照。于是用SITE语法指定某免费主页提供站点,是个迅速找到图片的好办法。
搜索:“”britney spears” site:geocities.com”
结果:已在geocities.com内搜索有关”britney spears”的网页。共约有5,020项查询结果,这是第1-10项。搜索用时0.47秒。

例四:找MP3
分析一:提供MP3的网站,通常会建立一个叫做MP3的目录,目录底下分门别类的存放各种MP3乐曲。所以,可以用INURL语法迅速找到这类目录。现在用这个办法找找老歌“say you say me”。
搜索:“”say you say me” inurl:mp3”
结果:已向英特网搜索inurl:mp3 “say you say me”. 共约有155项查询结果,这是第1-10项。搜索用时0.17秒。
分析二:也可以通过网页标题,找到这类提供MP3的网页。
搜索:“”say you say me” intitle:mp3”
结果:已向英特网搜索”say you say me” intitle:mp3. 共约有178项查询结果,这是第1-10项。搜索用时0.73秒。
当然,如果你知道某个网站的下载速度快,而且乐曲全,就可以用SITE语法先到该网站上看看有没有目标乐曲。

例五:找书
分析一:对我而言,常访问的电子图书馆类网站就那么几个,比如文艺类的“www.shuku.net”。于是可以用SITE语法很简单的找到某本书(如果 该网站上有的话)。比如,“旧唐书 site:shuku.net”,就可以马上找到该书。如果没有,通常别的网站上也很难找到。因此,找书的关键,是你了解一大批著名的图书馆网站。
分析二:我上面介绍的第一项关键字选择技巧特定词法,对于迅速找到某书或者文章也是极其有用的,当然,这得建立在你已经读过该书,对书的内容有印象的基础上。比如如果了解堂吉诃德一书战风车的大致内容,就可以用“吉诃德 风车 桑乔”迅速找到该书。
4,杂项语法

4.1,通配符问题

很多搜索引擎支持通配符号,如“*”代表一连串字符,“?”代表单个字符等。Google对通配符支持有限。它目前只可以用“*”来替代单个字 符,而且包含“*”必须用”"引起来。比如,“”以*治国””,表示搜索第一个为“以”,末两个为“治国”的四字短语,中间的“*”可以为任何字符。

4.2,关键字的字母大小写

Google对英文字符大小写不敏感,“GOD”和“god”搜索的结果是一样的。

4.3,搜索整个短语或者句子

Google的关键字可以是单词(中间没有空格),也可以是短语(中间有空格)。但是,用短语做关键字,必须加英文引号,否则空格会被当作“与”操作符。

示例:搜索关于第一次世界大战的英文信息。

搜索:“”world war I””

结果:已向英特网搜索”world war i”. 共约有937,000项查询结果,这是第1-10项 。 搜索用时0.06秒。

4.4,搜索引擎忽略的字符以及强制搜索

Google对一些网路上出现频率极高的英文单词,如“i”、“com”、“www”等,以及一些符号如“*”、“.”等,作忽略处理。

示例:搜索关于www起源的一些历史资料。

搜索:“www的历史 internet”

结果:以下的字词因为使用过于频繁,没有被列入搜索范围: www 的. 已搜索有关www的历史 internet的中文(简体)网页。 共约有75,100项查询结果,这是第1-10项 。 搜索用时0.22秒。

我们看到,搜索“www的历史 internet”,但搜索引擎把“www”和“的”都省略了。于是上述搜索只搜索了“历史”和“internet”。这显然不符合要求。这里我顺便说一 点搜索引擎分词的知识。当我们在搜索“www的历史”的时候,搜索引擎实际上把这个短语分成三部分,“www”、“的”和“历史”分别来检索,这就是搜索 引擎的分词。所以尽管你输入了连续的“www的历史”,但搜索引擎还是把这个短语当成三个关键字分别检索。

如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的“+”号。

搜索:“+www +的历史 internet”

结果:已搜索有关+www +的历史 internet的中文(简体)网页。 共约有25,000项查询结果,这是第1-10项 。 搜索用时0.05秒。

另一个强制搜索的方法是把上述的关键字用英文双引号引起来。在上例“”world war I””中,“I”其实也是忽略词,但因为被英文双引号引起来,搜索引擎就强制搜索这一特定短语。

搜索:“”www的历史” internet”
结果:已搜索有关”www的历史” internet的中文(简体)网页。 共约有7项查询结果,这是第1-6项 。 搜索用时0.26秒。

我们看到,这一搜索事实上把“www的历史”作为完整的一个关键字。显然,包含这样一个特定短语的网页并不是很多,不过,每一项都很符合要求。

注意:大部分常用英文符号(如问号,句号,逗号等)无法成为搜索关键字,加强制也不行。
5,Google的高级搜索查询语法

上面已经探讨了Google的一些最基础搜索语法。通常而言,这些简单的搜索语法已经能解决绝大部分问题了。不过,如果想更迅速更贴切找到需要的信息,你还需要了解更多的东西。

[intitle:]
“intitle:”帮助Google将搜索结果限制在那些标题中含有检索单词的页面。例如,“intitle:login password”(不包括引号)将返回标题中有单词“login”,页面中任何地方有单词“password”的那些页面的链接。

类似的,如果想在网页的标题中检索多个单词,可以用“allintitle”来代替“intitle”得到标题中包含所有这些单词的网页列表。例如使用 “intitle:login intitle:password”跟使用“allintitle:login password”是一样的。

[inurl:]
“inurl:” 将搜索结果限制在那些URL中含有检索单词的页面。例如:“inurl:passwd”(不包括引号)将返回URL中有“passwd”的那些页面的链接。
类似的,如果想在URL中检索多个单词,可以用“allinurl”来代替“inurl”得到URL中包含所有检索单词的网页列表。例如 “allinurl:etc/passwd”会查找URL中包含“etc”和“passwd”的页面。单词之间的“/”会被Google忽略掉。

[site:]
“site:” 将限制Google只在特定的站点或域中检索关键词。例如:“exploits site:hackingspirits.com”(不包括引号)将在所有“hackingspirits.com”域的链接页面中查找关键词 “exploits”。“site:”和“hackingspirits.com”之间不应有空格。

[filetype:]
“filetype:” 将限制Google只在internet上搜索特定扩展名的文件(就是doc,pdf或者ppt等等)。例如:“filetype:doc site:gov confidential”(不包括引号)将在所有政府域相关的网站中查找页面中或“.doc”文件中包含关键词“confidential”的扩展名为 “.doc”的文件。也就是结果会包含到所有政府网站中有confidential关键词的文档的链接。

[link:]
“link:” 将显示有到指定网页的链接的网页。例如:“link:www.securityfocus.com”会列出有到SecurityFocus的链接的网页。注意“link:”和网页url之间不应有空格。

[related:]
“related:” 将显示跟指定网页类似的网页。例如:“related:www.securityfocus.com”会列出跟SecurityFocus主页类似的网页。注意“related:”和网页url之间不应有空格。

[cache:]
“cache:” 将显示在Google cache中的网页。例如:“cache:www.hackingspirits.com”会列出Google cache中hackingspirits的主页。注意“cache:”和网页url之间不应有空格。

如果查询串中包含其它词,Google会在cache的文档中高亮显示这些词。例如: “cache:www.hackingspirits.com guest”会显示在cache中的网页内容,并高亮显示“guest”。

[intext:]
“intext:” 会在特定的网站中搜索单词。它忽略links或URL和页面标题。例如:“intext:exploits”(不包括引号)将只返回页面中含有搜索关键词“exploits”的网页链接。

[phonebook:]
“phonebook:” 会搜索美国街道地址和电话号码信息。例如:“phonebook:Lisa+CA”会列出所有名字中有“Lisa”并且住在“加利福尼亚(CA)”的人的名字。这对那些想要挖掘个人信息的黑客来说是再好不过的工具了。
6,其他重要功能

目录服务
如果不想搜索网页,而是想寻找某些专题网站,可以访问GOOGLE的分类目录 “http://directory.google.com/”,中文目录是 “http://directory.google.com/Top/World/Chinese_Simplified/”。不过由于GOOGLE的目 录由志愿者服务,而GOOGLE在国内名气相对比较小,因此中文目录下收录站点很少。

工具条
为了方便搜索者,GOOGLE提供了工具条,集成于浏览器中,用户无需打开GOOGLE主页就可以在工具条内输入关键字进行搜索。此外,工具条还提供了其 他许多功能,如显示页面PageRank等。最方便的一点在于用户可以快捷的在GOOGLE主页、目录服务、新闻组搜索、高级搜索和搜索设定之间切换。欲 安装GOOGLE的工具条,可以访问“http://toolbar.google.com/”,按页面提示可以自动下载并安装。

新闻组(USENET)搜索
新闻组中有大量的有价值信息,DEJA一直是新闻组搜索引擎中的佼佼者。2001年2月份,GOOGLE将DEJA收购并提供了所有DEJA的功能。现在,除了搜索之外,GOOGLE还支持新闻组的WEB方式浏览和张贴功能。
输入“http://groups.google.com/”后,便进入GOOGLE新闻组界面。可惜现在还没有中文界面。因为新闻组中的帖子实在是多,所以我点击“Advaced Groups Search”进入高级搜索界面http://groups.google.com/advanced_group_search。 新闻组高级搜索界面提供对关键字、新闻组、主题、作者、帖子序号、语言和发布日期的条件搜索。其中作者项指作者发帖所用的唯一识别号电子信箱。比如要在 alt.chinese.text内搜索著名老牌网络写手图雅的帖子,可以用下列指令“group:alt.chinese.text author:tuya@ccmail.uoregon.edu”。不过一般而言,我更推荐使用图形搜索界面,方便而且直观。

搜索结果翻译
曾经为那些你不懂的法文、西班牙文页面烦恼么?现在,GOOGLE支持一项搜索结果翻译功能,可以把非英文的搜索结果翻译成英文!!虽然目前只支持有限的拉丁语、法语、西班牙语、德语和葡萄牙文,但是我不得不承认,这是个伟大的改进。
不过,目前只能在英文状态GOOGLE下实现这个功能。进入GOOGLE的设置页面, http://www.google.com/preferences,有一个“BETA: Enable translation of search results into your interface language. ”的选项,把它选中,就OK了。

搜索结果过滤
网络上的成人内容浩如烟海,而且很多站点具有欺骗或者其他不良企图,浏览者很容易掉入其中的陷阱。为此,GOOGLE新设立了成人内容过滤功能,见GOOGLE的设置页面,http://www.google.com/preferences,最底下有一个选项SafeSearch Filtering。不过,中文状态下的GOOGLE尚没有这个功能。

PDF文档搜索
我对GOOGLE尤其欣赏的一点就是它提供对PDF文档内文的检索。目前GOOGLE检索的PDF文档大约有2500万左右。这真是太美妙了。PDF是 ADOBE公司开发的电子文档格式,现在已经成为互联网的电子化出版标准。PDF文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中全面。
示例:搜索关于电子商务(ECOMMERCE)的PDF文档。
搜索:“inurl:pdf ecommerce”
结果:已向英特网搜索inurl:pdf ecommerce. 共约有19,200项查询结果,这是第1-10项。搜索用时0.11秒。
下面是某项搜索结果:
[PDF] www.usi.net/pdf/outsoucing-ecommerce.pdf
Outsourcing Electronic Commerce Business Case White Paper By: John P. Sahlin, Product
Marketing Professonial (PMP) Implementation Manager, Web Engineering …
一般文字档 - 类似网页
可以看到,GOOGLE在PDF档前加上了[PDF]的标记,而且,GOOGLE把PDF文件转换成了文字档,点击“一般文字档”,可以粗略的查看该PDF文档的大致内容。当然,PDF原有的图片以及格式是没有了。

图像文档搜索
GOOGLE提供了Internet上图像文件的搜索功能!!目前该功能尚在B测试阶段,但已经非常好用。访问地址是 “images.google.com”。你可以在关键字栏位内输入描述图像内容的关键字,如“britney spears”,也可以输入描述图像质量或者其他属性的关键字,如“high quality”。
GOOGLE给出的搜索结果具有一个直观的缩略图(THUMBNAIL),以及对该缩略图的简单描述,如图像文件名称,以及大小等。点击缩略图,页面分成 两祯,上祯是图像之缩略图,以及页面链接,而下祯,则是该图像所处的页面。屏幕右上角有一个“Remove Frame”的按钮,可以把框架页面迅速切换到单祯的结果页面,非常方便。GOOGLE还提供了对成人内容图像的限制功能,可以让搜索者免受不必要的骚 扰。
不过,非常遗憾的是,图像搜索功能还不支持中文。
7.Google黑客揭秘

上面所说的Google查询语法能真正帮助人们来精确他们的搜索结果,得到他们真正想要的。

现在Google如此智能,黑客们当然不会介意利用它从互联网上来挖掘更多本来不应该让他们知道的保密和隐私的信息。现在我将要详细讨论这些技术,展示黑客们是如何利用Google从网上挖掘信息的,以及如何利用这些信息来入侵远程服务器。

利用“index of”与发来查找开放目录浏览的站点

一个开放了目录浏览的WEB服务器意味着任何人都可以像浏览通常的本地目录一样浏览它上面的目录。这里我将讨论如何利用“index of”语法来得到开放目录浏览的WEB服务器列表。这对黑客来说是一种非常简单的信息搜集方法。试想如果得到了本不应该在internet上可见的密码文 件或其它敏感文件,结果会怎样。下面给出了一些能轻松得到敏感信息的例子。

Index of /admin
Index of /passwd
Index of /password
Index of /mail

“Index of /” +passwd
“Index of /” +password.txt
“Index of /” +.htaccess

“Index of /secret”
“Index of /confidential”
“Index of /root”
“Index of /cgi-bin”
“Index of /credit-card”
“Index of /logs”
“Index of /config”

利用“inurl”或“allinurl”寻找缺陷站点或服务器

a.利用“allinurl:winnt/system32/”(不包括引号)会列出所有通过web可以访问限制目录如“system32”的服务器的链 接。如果你很幸运你就可以访问到“system32”目录中的cmd.exe。一旦你能够访问“cmd.exe”,就可以执行它,瞧!服务器归你所有了。
b.利用“allinurl:wwwboard/passwd.txt”(不包括引号)会列出所有存在“WWWBoard 密码缺陷”的服务器的链接。想了解更多关于这个缺陷的知识,你可以参看下面的链接:http://www.securiteam.com/exploits/2BUQ4S0SAW.html
c.利用“inurl:bash_history”(不包括引号)会列出所有通过web可以访问“.bash_history”文件的服务器的链接。这是 一个历史命令文件。这个文件包含了管理员执行的命令列表,有时还包含敏感信息例如管理员输入的密码。如果这个文件被泄漏并且包含加密的unix密码,就可 以用“John The Ripper”来破解它。
d.利用“inurl:config.txt”(不包括引号)会列出所有通过web可以访问 “config.txt”文件的服务器的链接。这个文件包含敏感信息,包括管理员密码的哈希值和数据库认证凭证。例如:Ingenium Learning Management System是一个由Click2learn,Inc开发的基于Web的Windows应用程序。Ingenium Learning Management System5.1和6.1版本以非安全的方式在config.txt文件中存储了敏感信息。更多相关内容请参看:http://www.securiteam.com/securitynews/6M00H2K5PG.html

其它类似的组合其它语法的“inurl:”或“allinurl:”用法:
inurl:admin filetype:txt
inurl:admin filetype:db
inurl:admin filetype:cfg
inurl:mysql filetype:cfg
inurl:passwd filetype:txt
inurl:iisadmin
inurl:auth_user_file.txt
inurl:orders.txt
inurl:”wwwroot/*.”
inurl:adpassword.txt
inurl:webeditor.php
inurl:file_upload.php

inurl:gov filetype:xls “restricted”
index of ftp +.mdb allinurl:/cgi-bin/ +mailto

利用“intitle”或“allintitle”寻找缺陷站点或服务器

a. 利用[allintitle:“index of /root”](不包括括号)会列出所有通过web可以访问限制目录如“root”的服务器的链接。这个目录有时包含可通过简单Web查询得到的敏感信息。
b. 利用[allintitle:“index of /admin”](不包括括号)会列出所有开放如“admin”目录浏览权限的WEB站点列表链接。大多数Web应用程序通常使用“admin”来存储管 理凭证。这个目录有时包含可通过简单Web查询得到的敏感信息。

其它类似的组合其它语法的“intitle:”或“allintitle:”用法:
intitle:”Index of” .sh_history
intitle:”Index of” .bash_history
intitle:”index of” passwd
intitle:”index of” people.lst
intitle:”index of” pwd.db
intitle:”index of” etc/shadow
intitle:”index of” spwd
intitle:”index of” master.passwd
intitle:”index of” htpasswd
intitle:”index of” members OR accounts
intitle:”index of” user_carts OR user_cart

allintitle: sensitive filetype:doc
allintitle: restricted filetype :mail
allintitle: restricted filetype:doc site:gov

其它搜索串

? 查找有跨站脚本漏洞(XSS)的站点:
allinurl:/script_s/cart32.exe
allinurl:/CuteNews/show_archives.php
allinurl:/phpinfo.php

? 查找有SQL注入漏洞的站点:
allinurl:/privmsg.php

Comments

转贴- Zac访谈Matt Cutts

下面是访谈的中文翻译。英文原文在这里Zac: 首先谢谢你们接受这个访问,我相信对中国的SEO和网络营销者们会很有帮助。

目前在中国对SEO有不少误解。有的人听到SEO的第一个念头是“垃圾”。有的说SEO是短视的,是自寻死路。从搜索引擎的观点看,这是真的吗?对Google来说,SEO是被讨厌的,允许的,还是鼓励的?我指的是白帽SEO。

Matt: 认为搜索引擎不喜欢SEO是常见的误会。事实是,遵循Google质量指南(quality guidelines)的SEO是OK的。这包括像确保你的站点能被爬行,想出人们在搜索时会用的词并把这些词自然地包含在网站内容中,让网页标题和URL具有描述性等。

Google和其他搜索引擎不喜欢的是,有些人尝试欺骗或走捷径获得比他们本应有的更高的排名。当站点违反我们的质量指南时,Google称为垃圾(spam)。

Zac: Google在2006年4月正式启用中文名“谷歌” ,不过大部分中国用户好像不喜欢这个新名字。

根据中国互联网信息中心的调查,Google的市场份额从05年的33%降到了06年的25.3%。你们怎么看调查中市场份额的降低?

Jianfei (朱健飞): 就这个市场份额,让我们参考李开复的说明,“这些调研数量可能会有一定的误差。不同的用户,使用搜索引擎的频率会不同,有人可能一天用10次搜索引擎,有人可能一天只用一次,简单的采样结果也许并不能真实反映流量。”

Zac: 我注意到Google总部有中国员工。知不知道Googleplex里有多少中国人?他们做的怎么样?对想加入Google的粉丝有什么建议?

Jianfei: 我们在Googleplex确实有很多中国工程师。他们做得都很出色。你可以浏览 http://www.googlechinablog.com/ 上一些中国工程师关于他们在Google生活的文章。

想加入Google的粉丝可以在 http://www.google.cn/jobs/ 查招聘的职位。不能加入Google也欢迎给我么建议和想法。他们的支持对我们很重要。举报垃圾站可以到 http://www.google.cn/contact/spamreport.html

Matt: 实际上,如果你注册了Google Webmaster Central
http://www.google.com/webmasters/

你也可以用这两个表格报告垃圾
https://www.google.com/webmasters/tools/spamreport?hl=zh-cn
https://www.google.com/webmasters/tools/spamreport?hl=zh-tw

另外,如果你不想注册Google账户,也可以在这里举报spam:
http://www.google.cn/contact/spamreport.html
http://www.google.com.tw/contact/spamreport.html

不过我还是建议用前两个。我们对Webmaster Central的垃圾报告给于更多权重。

Zac: 我们谈谈复制内容,最近很热的话题。

我在中文网站看到更多的内容复制。很多中文站长喜欢从其他网站“采集”内容,有的用软件,有的人工,然后放在自己的网站上。Google是否惩罚这种放满了四处可见的内容的网站?是否有个百分百或门槛,超过了会导致惩罚?

原创者应该怎么做才能确保原创版本被正确辨认?

Jianfei: 我们注意到了一些中文网站有很多复制内容。用户喜欢看到不同的搜索结果,所以Google尽力提供多样的结果。我们的算法已经有了一些清除复制内容的办法,我们会继续寻找改进的方法。

Zac: 有的网站使用多个域名,内容完全一样,比如说domain.com和domain.com.cn 。这样危险吗?最好的处理方法是什么?

Matt: 如果内容真的一样,我会选一个域名,另一个域名做转向到选定域名。比如,google.com 做永久转向 (301) 到 www.google.com,我们会看到并通常会选择转向指向的那个。如果内容是不同的语言(比如中文和英文),那么在两个不同的域名的内容没什么危 险,但是如果内容完全一样,最好从复制域名做永久转向到一个选定域名。

没有转向的镜像网页可以产生问题。最好使用301/永久转向,因为Google也许选择删除或不显示你最喜欢的版本。

Zac: 我一直在我的博客强调好的原创内容,这个观念也被中国的SEOers很好地接受。问题是,正像很多读者问的,比如说,如果我的公司是卖“玻璃磨边机”的,这东西根本就太乏味了,我能写些什么有意思的内容呢?能不能给些这种高度专业化产品内容发展的窍门?

Matt: 别忘了创造性真的会帮很大忙。比如,有个做工业混合机的站,听起来是挺乏味的题目。但是去看看这段视频: http://www.youtube.com/watch?v=aM94aorYVS4 你会看到奇妙的东西。他们把各种物品扔进混合机来证明他们的机器有多厉害。

确实,一些重型机械或工业站点初听之下是比较无聊乏味,但从创造性的角度看的话,你经常能提高对你公司的兴趣。即使像newsletters,博客,行业信息,或其他资源也可以是别人对你的站感兴趣并连向你的原因。

Zac: 我们能找到的PR最高的中文站是PR8。就PR来说对中文站有歧视吗?如果没有,为什么没有PR9甚至PR10的站点?PR对排名还有用吗?

Matt: PageRank确实取决于互联网的链接结构,但我不会因为看不见PR9或PR10的站而灰心。 其一,中文站通常是跟其他中文站比较排名,所以比赛还是公平的。同样很重要的是Google的PageRank有更细的量度(并不是简单的1到10),所 以都显示工具条PR6的两个站可能有不同的PageRank。

Google对非英文站点的权威声望度的测量有特殊处理来帮助。

Zac: 英文网站SEO和中文网站SEO有什么显著区别吗?你们的算法对不同语言处理有不同吗?

Matt: 我觉得不同国家在怎么做SEO方面确实有不同。比如,在德国,人们更可能在域名里用连词符(-)。有的国家更倾向于通过联署计划(affiliate programs)赚钱,有的国家通过手机比信用卡赚的多,因为信用卡不是在每个国家都同样常见。 但是在SEO的操作上也有很多相同点。

Jianfei: 英文网站SEO和中文网站SEO的一个主要区别是要做的搜索词。比如“viagra”是英文里垃圾最多的搜索词之一,“手机铃声”在中文里垃圾更多。另一个区别是差不多所有大中型中文站都有博客,其他语言就不是。

Zac: 其他国家的AdWords用户一般直接在Google注册。不过Google在中国采取了另一种方式,与AdWords代理合作,在某种意义上是本地化的方式,因为中国的所有其他关键词竞价(PPC)提供商都这么做。

与广告商保持直接关系已经在世界范围被证明是成功的,为什么Google在中国采取了本地化的方式?你觉得AdWords在中国成功吗?

Matt: 我不是专家,但我知道Google尝试适应每个市场,以那个国家最有效的方式呈现产品。我为AdWords组感到自豪,我认为他们在中国干的非常好。

Zac: 一些SEO相信新鲜度(freshness)在Google排名中起到很重要作用。很多人认为博客容易得到好的排名,部分得益于新鲜度。但是有的SEO认为经常修改网页不是个好主意。

你的建议是什么?经常更新还是不?

Matt: 这取决于你所在的行业。我会做对用户有益的所有事。为更新网页而更新网页可能效率不会高。但如果你有个博客,经常更新可能吸引更多用户。所以对有些人来说,不太常更新可能更适合(比如生产制造公司),对另一些人经常更新更好(比如你是个博客的话)。

Zac: SEO服务是个可靠的商业模式并值得向中国的SEOers推荐吗?我这么问是因为在中国有规模有声望的SEO公司非常非常少。很多公司声称他们提供SEO服务但实际上他们做的就是在论坛和博客发垃圾。

遵守规则的单独的SEO们正在为生存奋斗。

我相信你们知道很多成功的SEO公司。在中国,SEO行业有前途吗?我们怎么从个人成长为有信誉的SEO公司呢?

Jianfei: 我认为如果SEO按照Google的质量指南的话,他可以有很好的未来。搜索引擎结果对行业很重要,所以对守规矩的公司的市场需求会很多。

Matt: 如果你在考虑用SEO,眼光放长远非常重要。用户突然增加然后Google或其他搜索引擎发现spam并删除网站,这对网站没什么用。可以问问是否有参考客户,或者是否能有SEO提供稳定长期流量的成功故事。

http://www.google.com/support/webmasters/bin/answer.py?answer=35291&hl=cn 是个很好的帮助调查SEO的文件。不幸的是,有些SEO服务,你雇用他们的话,他们会发垃圾,应该从一开始就避免他们。

Zac: 最近很多关于被信任的域名和权威网站的讨论。如果一个站被认为是权威,它会在Google排名高,更多人找到这个站所以带来更多链接,然后它变得就更强。

普通默默无闻的站怎么克服这个情况和权威站竞争呢?除了建一个有很多有用原创内容的好的站点,有什么捷径吗?

Matt: 如果是刚建的普通小站,我不会去尝试热门关键词。把精力集中在一个小的你能被当作专家的利基市场。当你被更多人知道了,你可以从小利基市场往越来越大的领域发展。很多成功的站都是从小站开始,往大发展。而且,你越有创意,越有趣,越有帮助,这常会有助于人们注意到你。

Jianfei: 比如,你的站 http://www.chinamyhosting.com/seoblog/ ,就是这样的站。一年前,这个站没人知道,但通过你的勤劳工作和创造性努力,现在它在搜索[搜索引擎优化排名]时排名很好,这令人印象深刻。

Zac: 你去过中国吗?如果你计划访问中国,这里有成千上万的粉丝想亲眼见到你。 :-)

Jianfei: 我在中国出生,去年去了中国两次。我很喜欢与Google中国的同事工作。

Matt: 很遗憾,我没去过中国。我妈妈去过中国几次,包括阳朔(桂林),我太太去过一次,并且虽然他们都是美国人,他们都会说点中文。我得努力争取去那里。我听说中国是个奇妙的国家,我很乐意有一天去访问。

我去不了今年的SES中国大会,但我很高兴Jianfei或另一个Google代表将出席SES中国大会。Jianfei是反垃圾组的顶级成员,在中文反垃圾方面比我要更专家。 :-)

Zac: 我每天都在我的博客里看见大量链接垃圾。论坛或博客里的链接垃圾会导致惩罚吗?还是被Google直接忽略因此对排名没影响?

Jianfei: 实际上,发链接垃圾可以变得危险。如果Google发现一个公司在发链接垃圾,这个公司的站可能从索引删除。除非我们再也看不到垃圾链接,Google不 一定会重新收录。在大部分情况下,删除链接比加入链接还难(比如用垃圾软件发在博客和论坛的垃圾),所以还是离链接垃圾远点好。

Matt: 通常,Google会忽略链接垃圾。当我们知道一个公司确实发链接垃圾,我们可能采取适当的行动。

Zac: 另一个在SEO论坛和博客的话题是补充材料。如果一个域名有越来越多的页面进了补充材料,这是否意味着这个域名正在丧失信任?如果你是SEOer而不是Googler,你会担心补充材料吗?

Matt: 我不会担心补充材料。如果你的域名PageRank低,它可能就会进补充材料索引,但这不意味着站点被惩罚或丧失信任。通常只是意味着,如果你能因为你的站点好而得到一些高质量链接,我们会把你的站点的更多页放进主索引。

另外,补充材料更新已经更快,显示给用户的也更多了,所以站长经常看到更多到补充材料页的流量。

Zac: 百度是你们在中国市场的最大竞争者。据说百度在某些搜索技术比如中文分词上比Google更好。

另一方面,Google已经在中国招聘顶级人才。我从一些材料读到Google中国的工程师对核心排名算法还没有很多贡献。你们计划将算法本地化以更适合中文语言吗?与百度相比,你们的技术优势在什么地方?

Jianfei: 不对特定竞争对手置评是我们的政策。我们欢迎有助于向用户提供更多有用信息和选择的竞争。对我们和搜索领域的所有人来说,良好的竞争都是有益的,能使我们更努力,最终结果是,用户获得好处。

Matt: 我们不大谈论我们的排名,因为是机密,但中国分部从几方面对Google怎样排名做了贡献。实际上热榜 http://www.google.cn/rebang/home 这样的出色应用就是在中国首先出现的。这是在中国开发的全新产品。

Zac: 如果你不介意的话,Matt,你是不是如暗示的,是站长世界的GoogleGuy?Google与站长的沟通非常出色,我们很感谢。有没有可能某位Google中国的工程师能起到类似的作用,与中文站长社区积极沟通?

Matt: 我们没有确认过GoogleGuy的正式身份,这没关系,因为如果GoogleGuy需要休息一下,其他人可以进来帮助沟通。事实上我得到了比我应该得到的更多的名誉。英文的沟通其实通过很多人,Vanessa Fox,Adam Lasnik,还有很多很多其他人。

在中文,我很幸运与一组像Jianfei这样的出色团队,还有在Mountain View(美国加州)及北京的其他出色的人一起工作。我想Google将开始与中国站长更多沟通。这个联合访谈就是好的开始。

Zac: 在中国有些争论,SEO在网站总体中起到什么作用?SEO是不是网络营销和电子商务的重要部分?有的网络营销人认为SEO是小菜一碟,写写标题标签,这里那里加些关键词,诸如此类。

你觉不觉得现在的SEO已经深入一步,充当某种网站营销顾问的角色?换句话说,SEOers应该帮助客户优化线上销售流程,目标市场定位,内容发展,用户体验,病毒式营销等。 这是我在尝试推广的观念。最终,用户需要好的网站,不是好的代码。

Matt: 我同意很多时候SEO是创造一个好的网站,不仅仅是把网页设计和代码弄对。SEO包括把标签和代码写对,但那只是第一步。如果你能计划一个出色的病毒式营销活动,或者通过口碑传播让人们谈论你的站点,这也是SEO,而且是比使用垃圾软件好得多的获得链接的方式。

在很多方面,SEO是确保用户有良好体验,因为一个出色的网站会有助于在搜索引擎自然地得到好的排名。

Zac: 你预见SEO在接下来的几年会有大的变化吗?

Matt: 我认为个人化和本地化是大的趋势。如果Google对用户了解多些从而返回不同的搜索结果,那可能对用户来说是搜索质量上很大的改进。那将使SEO更困 难,但关心长久价值的SEO们会对个人化很高兴,因为他们将得到更多对他们的网站感兴趣的流量,这些流量可能会转化为客户。

Jianfei: 当然,Google也将继续关注质量和SEO。假以时日,中国SEO们会发现做符合我们的质量指南的好的网站变得容易了,因为Google会继续努力扫除垃圾。

Zac: 喜欢中国食物吗?

Matt: 我爱中国食物。不过我听说美国的中国食物跟中国味道不太一样,可能以后得找机会试试真正的中国食物。比如,想试试北京烤鸭。

谢谢问这些有趣的问题。

Zac: 谢谢Matt和Jianfei。

Matt: 谢谢。我们希望大家在 https://www.google.com/webmasters/tools/spamreport?hl=zh-cn
https://www.google.com/webmasters/tools/spamreport?hl=zh-tw
举报中文垃圾并使用我们的站长工具。中国站长也可以在这里看到很多有用信息 http://www.google.cn/support/webmasters/ 。我们会继续听取中国站长的意见并试着回复。

Comments

转帖- 下载类网站TITLE写法对比实验结果

最近看到的一篇比较务实的自己测试的好文章,特此分享

下载类网站内页TITLE写法主要分3种:

  1. XXXXXX迅雷下载,XXXXXXBT下载,XXXXXX电驴下载
  2. XXXXXX迅雷下载,BT下载,电驴下载
  3. XXXXXX迅雷BT电驴下载

以上三种写法,哪种可以得到更好的综合排名呢?       搜索引擎对TITLE是如何分析?      做个SEO实验,看看会是怎样的结果。

实验思路:

建立3个相似页面,分别用以上3种标题。等收录后看排名顺序。

实验注意事项:

  1. 需要使用没有干扰的“关键字”,搜索结果内无其他页面:
    这里我创造了一个词“波测卡”,在百度和GOOGLE中都没有结果。
  2. 保证测试页面内容有所不同,但又不能影响到排名,这是防止Google类似页面的出现:
    我对3个测试页的内容做了稍稍的改动,有些胡乱打的字,并且下载链接地址页不一样。应该不会影响到排名。
  3. 保证有公平的外部环境:都没有外部链接(除本页面);
  4. 保证同时被SE收录,收录时间也是排名因素之一:这应该不是问题。

实验页面:

  1. 波测卡迅雷下载,波测卡BT下载,波测卡电驴下载 http://www.seotest.cn/testpage/tp002.html
  2. 波测卡迅雷下载,BT下载,电驴下载 http://www.seotest.cn/testpage/tp004.html
  3. 波测卡迅雷BT电驴下载 http://www.seotest.cn/testpage/tp003.html

实验目的:

从排名中可以直接知道哪种写法综合排名比较好。并且可以从结果中,推测一些搜索引擎对TITLE的分析方式。

实验结果:

现在这3个实验页面已经被百度和GOOGLE收录(YAHOO还没完全收录),我们来看看具体关键词的排名情况:

表中代号分别表示

2 波测卡迅雷下载,波测卡BT下载,波测卡电驴下载

3 波测卡迅雷BT电驴下载

4 波测卡迅雷下载,BT下载,电驴下载

关键词

Google 排名靠前标题号

百度排名靠前标题号

波测卡 2 3
波测卡下载 2 2
波测卡 下载 2 2
下载波测卡 2 2
波测卡迅雷 2 3
波测卡 迅雷 2 3
波测卡迅雷下载 2 2
波测卡 迅雷下载 2 2
波测卡BT 2 2
波测卡 BT 3 3
波测卡BT下载 2 2
波测卡 BT下载 2 4
波测卡电驴 2 2
波测卡 电驴 2 3
波测卡电驴下载 2 2
波测卡 电驴下载 2 3

从上面的测试结果中可以看出,目前对于百度和GOOGLE,下载类网站最好的TITLE写法是:

XXX迅雷下载,XXXBT下载,XXX电驴下载

注意,这种写法有堆砌关键词嫌疑,放在具体内页使用,首页别这么用,小心被K。

Comments

不得不看–搜索引擎优化的基本要素

作者:Philipp Lenssen
文章:The Basics of Search Engine Optimization
翻译:wkcow

搜索引擎优化的基本要素

 

 

 

我在科隆的阿姨和叔叔电话问我,如何让他们的新站获取google上的成功,我就将自己的一些秘诀告诉他们-如果你已经了解了SEO(搜索引擎优化),那 么你可以不看;如果没有,有3个步骤会让你在搜索引擎获得好的排名。第一,创建好的内容。第二,让内容更方便阅读。第三,将你的内容告诉给别人。

Read the rest of this entry »

Comments

很有用的文章– Flash视频的SEO优化

依我看来,Flash总是备受斥责、不受欢迎而且对于搜索引擎的可视性有害的。什么是搜索引擎从业者关注Flash的原因?如何优化Flash内容 呢?对于Flash来讲,搜索引擎无法读取是最关键的问题,而且近期也不会改善。 Flash具有逻辑性、虽然用户可视,但搜索引擎天生就被设计为读取静态内容的工具;另外,确切说Flash是一个动态的程序,所以对于静态的HTML编 码来说它太难分析了。

网络工具的龙头,Adobe Dreamweaver,在网页中嵌入了Flash代码,但没有提供用户或者搜索引擎处理Flash的快捷通道。除了使用缺省的代码,我更推荐使用基本的 HTML组件来手动处理Flash网页、采用在导入电影控件前自动监测其是否支持Flash的方法。当Flash内容不能在进而优化基本的HTML代码, 虽然Flash对于具有播放器的用户来说带来了更强的用户体验。 Read the rest of this entry »

Comments

简单的搜索引擎友好设计–8个方面

网站内容作者们辛辛苦苦做出来的内容,却由于页面设计不够优化、对搜索引擎不够友好而在搜索结果中“名落孙山”,确实有些遗憾。今天,我们来看看会影响到搜索引擎优化(SEO)的八大方面,让我们的页面更加优化,获得更多来自搜索引擎的流量。1、将css与javascript全部用下边的方法分离到外部文件中去。