none
Sharepoint 2010 文档库 有没有文档数限制?对爬网性能的影响? RRS feed

  • 问题

  • 现基于sharepoint 2010开发知识管理系统,其中比较大的一块是文档管理,

    请问各位专家,

    1、Sharepoint 2010 文档库中有没有没有文档数限制,限制是多少?

    2、当文档数目到多少数量级的时候,会对爬网等产生比较明显的影响,各位有过经验的,请不吝赐教。

     

    谢谢。

    • 已编辑 吴文杰 2010年12月28日 8:54 拼写错误
    2010年12月28日 8:53

答案

  • 如果说数量限制的话,几千万的量级是没有问题的 但是需要你做好规划,比如划分文件夹、设定视图,指定合适的查询条件,指定适当的索引栏,这部分内容可以参考SharePoint自己的设置或者technet文档 到什么时候会对爬网有影响,这个无法一概而论 和你爬网的架构、爬网机器的性能、爬网的时间、文档的数量、文档的类型、文档的大小都有关系 所以最好在一个没什么人用网站的时间进行爬网,比如半夜或者周末
    2010年12月28日 13:36

全部回复

  • 如果说数量限制的话,几千万的量级是没有问题的 但是需要你做好规划,比如划分文件夹、设定视图,指定合适的查询条件,指定适当的索引栏,这部分内容可以参考SharePoint自己的设置或者technet文档 到什么时候会对爬网有影响,这个无法一概而论 和你爬网的架构、爬网机器的性能、爬网的时间、文档的数量、文档的类型、文档的大小都有关系 所以最好在一个没什么人用网站的时间进行爬网,比如半夜或者周末
    2010年12月28日 13:36
  • Sharepoint2010 列表和库中的数量限制是5000万。

    单个文件项目或者项目附件的大小是2GB。

     

    谢谢Erucy的回答。 关于性能问题,我其实是想知道有经验的朋友,多少数量级别的时候 有比较明显的影响,比如需要增加内存,增加硬盘或者使用多个爬网数据库等。

     

    我们目前使用的机器环境是:

     浪潮英信NF5220  

    CPU25620 4核

    内存:16G 4*4G

    硬盘:8*600G

    Raid卡 :1

     

     

    2011年1月6日 9:13
  • 在我看来,影响爬网性能的因素基本和文档库的大小,数量是无关的。

    影响因素主要有,爬网的间隔时间,并发,网络带宽,磁盘性能等等。

    无论你文件数量有多少,都是要一个一个爬的,数量越多,也就是一次完整爬网时间越长。

    相对的,我在做爬网性能规划的时候,更多考虑的是网络带宽的影响,磁盘IO的消耗,Index文件的大小。

    根据可用网络带宽,磁盘IO去调整爬网的时间。

    Index大小主要决定需要多少磁盘大小。

    以上建议,仅供参考。


    上善若水
    Lambert Qin | 博客(Blog): SharePoint in My Eyes 中文 / 英文 | LinkedIn
    2011年1月11日 14:31