none
如何从html格式的字符串中循环地提取的一组数据?然后把这些提取到的多组数据放进更大的list集合中?。 RRS feed

  • 问题

  • <ul id='list'>
    
       <li class='item' id='1'><div class="name">fghfg</div><div class="content">fghfg</div></li>
    
     <li  class='item' id='2'><div class="name">fghfg</div><div class="content">fghfg</div></li>
    
     <li class='item' id='3'><div class="name">fghfg</div><div class="content">fghfg</div></li>
    
     <li class='item' id='4'><div class="name">fghfg</div><div class="content">fghfg</div></li>
    
     <li class='item' id='5'><div class="name">fghfg</div><div class="content">fghfg</div></li>
    
    <ul>

    从上述例子中,我想获取ul每行it标签指定的内容,包括li标签中的id的值,class名为name的div的内容,class为content的div的内容,每个li获取这三个数据,然后放进List<string>或string[]或者实体对象中,然后用更大的List集合来装这些多组数据。如何完成?

    如果是用正则表达式,那么一次性从一个li标签获取指定的几个内容的正则要怎么写,这个过程循环执行多次,直到匹配结束。除了正则还有其他方法?





    2018年4月12日 5:10

答案

  • 你好,

    你可以使用三方的类库,把HTML load 三方的对象,然后使用LINQ 来过滤你想要的List 或者数组。可以使用Nuget 下载三方类库

    https://www.nuget.org/packages/HtmlAgilityPack/

    下面的链接提供了一些例子,你可以参考一下。

    http://html-agility-pack.net/?z=codeplex

    注意:这个回复中包含对第三方万维网站点的引用。 微软提供这些信息是为了方便您。
    微软不控制这些网站,也没有测试任何在这些网站上发现的软件或信息; 因此,Microsoft不能就任何软件或信息的质量,安全性或适用性作出任何陈述。
    使用互联网上的任何软件都存在固有的危险,Microsoft警告您在从Internet上检索任何软件之前确保您完全理解风险

    Best regards,

    Zhanglong


    MSDN Community Support
    Please remember to click "Mark as Answer" the responses that resolved your issue, and to click "Unmark as Answer" if not. This can be beneficial to other community members reading this thread. If you have any compliments or complaints to MSDN Support, feel free to contact MSDNFSF@microsoft.com.

    2018年4月13日 7:42
    版主