none
如何禁止搜索引擎显示ICP备案信息? RRS feed

  • 问题

  • 如何禁止搜索引擎显示ICP备案信息?


    我只想让搜索引擎收集首页上的重要信息,不想让它在搜索结果里显示网站ICP的信息。这个如何做?

    不受2008的广告诱惑, 本人坚持使用VS 2005和SQL Server 2000.
    2009年2月14日 14:09

答案

  • 针对搜索引擎可以在网站根目录设置一个robots.txt的文件,可以对网站的目录或文件进行爬虫的限制。
    一般格式是:
    User-agent: *
    Allow: /searchhistory/
    Disallow: /search
    Disallow: /groups
    Disallow: /images
    Disallow: /catalogs

    你说的ICP备案信息被检索这个,如果你把ICP信息去掉,一般就不会显示了。


    Facing problems, think first, then search, finally ask.
    • 已标记为答案 dvdvip 2009年2月15日 7:06
    2009年2月15日 3:18
    版主
  • 不是很清楚不想让它在搜索结果里显示网站ICP的信息这个是什么意思,你是说页面里面的  ICP证合字B2-20070004号  这些文字信息吗?这些文字是页面内容的一部分,这个做不到吧。 除非整个页面都不让搜索。或者在你的页面使用脚本输出这些文字
    孟宪会
    • 已标记为答案 dvdvip 2009年2月15日 7:06
    2009年2月15日 7:04
    版主
  • 你可以使用JavaScript來輸出這些信息,這樣搜索引擎就不會抓取了。
    2009年2月16日 3:35
    版主

全部回复

  • 针对搜索引擎可以在网站根目录设置一个robots.txt的文件,可以对网站的目录或文件进行爬虫的限制。
    一般格式是:
    User-agent: *
    Allow: /searchhistory/
    Disallow: /search
    Disallow: /groups
    Disallow: /images
    Disallow: /catalogs

    你说的ICP备案信息被检索这个,如果你把ICP信息去掉,一般就不会显示了。


    Facing problems, think first, then search, finally ask.
    • 已标记为答案 dvdvip 2009年2月15日 7:06
    2009年2月15日 3:18
    版主
  • 不是很清楚不想让它在搜索结果里显示网站ICP的信息这个是什么意思,你是说页面里面的  ICP证合字B2-20070004号  这些文字信息吗?这些文字是页面内容的一部分,这个做不到吧。 除非整个页面都不让搜索。或者在你的页面使用脚本输出这些文字
    孟宪会
    • 已标记为答案 dvdvip 2009年2月15日 7:06
    2009年2月15日 7:04
    版主
  • 这只是限制网页。网站首页当然不能用robots.txt限制了。我说的是能不能限制网页上的部分内容。
    不受2008的广告诱惑, 本人坚持使用VS 2005和SQL Server 2000.
    2009年2月15日 7:05
  • 以后有机会,我就直接用美国的虚拟主机了,不用中国的。这样就不用ICP备案了,网页上也不用显示这些恶心的ICP信息了。
    不受2008的广告诱惑, 本人坚持使用VS 2005和SQL Server 2000.
    2009年2月15日 7:07
  • 无法限制部分,再说了。即使限制了,某些忽略robots.txt的爬虫也可能干坏事的。
    Facing problems, think first, then search, finally ask.
    2009年2月15日 7:26
    版主
  • 你可以使用JavaScript來輸出這些信息,這樣搜索引擎就不會抓取了。
    2009年2月16日 3:35
    版主
  • 我估计政府是不允许写在这JavaScript里的。因为它也有自己的ICP蜘蛛。
    不受2008的广告诱惑, 本人坚持使用VS 2005和SQL Server 2000.
    2009年2月16日 5:56