Posts Tagged ‘ robots.txt

网站链接添加的七种简单方法

有的SEO在网站优化过程中碰到最大的障碍莫过于链接建设了,天鼋总结了一些初级的添加网站链接的方法,希望对一些新手有帮助。

一、热门关键词排名较好的反向链接。
一般情况下,超级热门关键词排名较好的网站除了熟悉的门户外都有专门的SEO进行链接建设,通过查找他们的反向链接会有不错的收获。当然,竞争对手的反向链接更值得关注。
例子:“wow gold”在Google排名前三的网站,到yahoo上观察其反向链接。除了其自身的站群链接外,很大一部分还是都可以共享的。当然这里面的垃圾链接也相当多,要进行筛选!

二、善于综合应用Goo­gle Hack命令进行查找。
要熟知 intitle,inurl,intext,site,双引号“”,减号-,filetype等用法。
例子:1)博客 inti­tle:注册 ;2) “robots.txt” “Disa­llow:” filetype:txt (后台禁止抓取的目录或地址)

三、根据特征名词进行搜索。
博客建设是很多SEO公认的最简单最有效的链接建设方式之一,有的人用博客群建,有的人手工注册添加。这个过程中可以跟踪某些特征词进行搜索挖掘,如:某个人惯用的注册用户名;某些特定的程序标签。
例子:1)博客 inurl:williamlong ;2)注册 intitle:“powered by”

四、dofo­llow博客留言搜索。
详情见前一篇讲到的dofo­llow链接查询。

五、站点地图提交到社区化RSS阅读器中。
曾经我讲过网摘推广是主要的网站推广方式之一,其实Feed提交更实用。只要将你的站点内容做一个可更新的sitemap.xml并提交到主要Feed中,就会有大量的反向链接。
例子:将 http://blog.ejoygo.com.cn/的sitemap.xml 文件提交到Bloglines中。(注:Google Reader通过Ajax技术暂不能分享链接)

六、某些免费的分享平台。
很久以前的免费主页空间很珍贵也很流行,现在可以应用更先进的免费自主建站系统及内容分享。
例子:Goo­gle Pages;Google Note­book分享等。

七、论坛签名。
这种方法很古老,很仍然有很多人在做,效果应该也不错。
例子:阿里巴巴的商人论坛就有很多人通过论坛签名在进行推广及添加网站链接。

最后忠告,链接建设不要走火入魔,要善于挖掘自己的潜能,吸引别人主动链接你的网站才是关键。

作者:天鼋@SEO培训  SEO修订3.4  2010-​​01-​​11
天鼋SEO,
本文天鼋SEO版权所有,未经批准转载必究。

你可以到SEO博客上学习更多,或者对此问题发表评论

Robots.txt 文件应放在哪里?

Robots.txt 文件必须放在网站的根目录。放在子目录的 Robots.txt 文件搜索引擎不能爬取到,所以不会起任何作用。 例子: http://​www​.ejo​ygo​.com​.cn/​r​o​b​o​t​s​.​txt 有效 http://​www​.ejo​ygo​.com​.cn/​b​b​s​/​r​o​b​o​t​s​.​txt 无效 如果你不能控制根目录的 robots.txt,则你可以通过在子目录网页中使用标签阻止网页被收录。 阅读本文的人还阅读 robots.txt文件有什么必要? robots.txt

作者:天鼋@SEO培训  SEO修订1.4  2010-​​01-​​01
天鼋SEO,
本文天鼋SEO版权所有,未经批准转载必究。

你可以到SEO博客上学习更多,或者对此问题发表评论

robots.txt文件有什么必要?

什么是robots.txt文件?

搜索引擎机器人通过链接抵达互联网上的每个网页,并抓取网页信息。搜索引擎机器人在访问一个网站时,会首先检查该网站的根目录下是否有一个叫做robots.txt的纯文本文件。当我们的网站有一些内容不想被搜索引擎收录,我们可以通过设置robots.txt文件告知搜索引擎机器人。

如果网站上没有禁止搜索引擎收录的内容,则不用设置robots.txt文件,或设置为空。

SEO的角度,robots.txt文件是一定要设置的,原因:

  1. 网站上经常存在这种情况:不同的链接指向相似的网页内容。这不符合SEO上讲的“网页内容互异性原则”。采用robots.txt文件可以屏蔽掉次要的链接。
  2. 网站改版或URL重写优化时原来不符合搜索引擎友好的链接需要全部屏蔽掉。采用robots.txt文件删除旧的链接符合搜索引擎友好。
  3. 一些没有关键词的页面,比如本站的这个页面http://​blog​.ejo​ygo​.com​.cn/,屏蔽掉更好。
  4. 一般情况下,站内的搜索结果页面屏蔽掉更好。

作者:天鼋@SEO培训  SEO修订1.4  2010-​​01-​​01
天鼋SEO,
本文天鼋SEO版权所有,未经批准转载必究。

你可以到SEO博客上学习更多,或者对此问题发表评论

robots.txt

robots.txt是什么?

有没有想过,如果我们某个站点不让百度和goo­gle收录,那怎么办?

搜索引擎已经和我们达成一个约定,如果我们按约定那样做了,它们就不要收录。

这个写约定的的文件命名为:robots.txt。

robots.txt是一个最简单的.txt文件,用以告诉搜索引擎哪些网页可以收录,哪些不允许收录。

关于robots.txt一般站长需要注意以下几点:

  1. 如果你的站点对所有搜索引擎公开,则不用做这个文件或者robots.txt为空就行。
  2. 必须命名为:robots.txt,都是小写robot后面加“s”。
  3. robots.txt必须放置在一个站点的根目录下。如:通过http://​blog​.ejo​ygo​.com​.cn/​r​o​b​o​t​s​.​txt 可以成功访问到,则说明本站的放置正确。
  4. 一般情况下,robots.txt里只写着两个函数:User-agent和 Disa­llow。
  5. 有几个禁止,就得有几个Disa­llow函数,并分行描述。
  6. 至少要有一个Disa­llow函数,如果都允许收录,则写: Disa­llow: ,如果都不允许收录,则写:Disa­llow: /​ (注:只是差一个斜杆)。

补充说明:

User-​​agent: * 星号说明允许所有搜索引擎收录

Disa­llow: /search.html 说明 http://​ejo​ygo​.com​.cn/​s​e​a​r​c​h​.​h​tml 这个页面禁止搜索引擎抓取。

Disa­llow: /index.php? 说明类似这样的页面http://​blog​.ejo​ygo​.com​.cn/ 禁止搜索引擎抓取。

相关文章:

如何使用标签阻止网页被收录?

作者:天鼋@SEO培训  SEO修订1.4  2010-​​01-​​01
天鼋SEO,
本文天鼋SEO版权所有,未经批准转载必究。

你可以到SEO博客上学习更多,或者对此问题发表评论

如何使用标签阻止网页被收录?

使用<META>标签拦截或删除网页:在网页的 <HEAD> 部分添加适当的 <META> 标签。

拦截所有搜索引擎把网页收录:

<META NAME=“ROBOTSCONTENT=“NOINDEX, NOFOLLOW”>

只是拦截百度蜘蛛爬取网页,而允许其他搜索引擎收录:

<META NAME=“baiduspider” CONTENT=“NOINDEX, NOFOLLOW”>

允许搜索引擎收录你的网页,但禁止其追踪外部链接(如:zh​.wiki​pe​dia​.org 为了防止链接泛滥采用了此例):

<META NAME=“ROBOTSCONTENT=“NOFOLLOW”>

允许搜索引擎收录你的网页,但禁止其收录网页上的图片:

<META NAME=“ROBOTSCONTENT=“NOIMAGEINDEX”>

注:哪一个网页需要拦截或删除,则在那个网页添加<META> 标签,其他页面不会受影响。<META> 标签针对的是具体的某个网页,而不是整个网站。

你或许还想了解:robots.txt

作者:天鼋@SEO培训  SEO修订1.4  2010-​​01-​​01
天鼋SEO,
本文天鼋SEO版权所有,未经批准转载必究。

你可以到SEO博客上学习更多,或者对此问题发表评论

 
SEO Powered by Platinum SEO from Techblissonline