none
阿里巴巴html处理原理?请帮忙解决。 RRS feed

  • 问题

  • 在需要从外部拷贝一些资料到网站时候,经常出现html太乱,无法编辑的情况。苦苦找寻没有良策。

    但发现阿里巴巴的处理非常好。

     

    处理前的文字效果:

    格式很乱,在FCKEditor下面没有办法编辑

    但通过阿里巴巴预览后,自动修复了,修复后的效果

    将数据post到这个页面后:http://china.alibaba.com/offer/html_detail_preview.htm?detail_name=desc,进行了处理。

    处理后的效果很好:

    我的问题:这样处理的思路以及实现的方法是什么?

    2009年5月16日 1:58

答案

  • 阿里巴巴只是过滤了所有它人为不合法的HTML标签和CSS样式。原本第一个圆圈所在的div有text-indent:9pt的属性,所以它就有前导空白。
    Microsoft ASP.NET MVP
    2009年5月17日 12:19
    版主

全部回复

  • 没看明白你的需求是什么

    你拷贝别人的东西,要想得到规范的格式,需要自己处理的,去掉格式化的东西。
    【孟子E章】
    2009年5月16日 2:48
    版主
  • 楼主,过滤了, 你可以自己去按需求写一个 , 比如上面的的: <div>标签的style属性去掉了 , 无效的<img >也过滤掉, 最后去html不全 ,

    以前用sina的blog ,他们的编辑器是自己写的 ,也加了过滤 , 比如说可以过滤掉 从word 复制来的文本样式 , 同样用FCKEditor会生成大量的重复的无用代码。

    FCKEditor只提供了过滤所有html的选项FCKConfig.ForcePasteAsPlainText 。
    2009年5月16日 5:22
    版主
  • 楼主,过滤了, 你可以自己去按需求写一个 , 比如上面的的: <div>标签的style属性去掉了 , 无效的<img >也过滤掉, 最后去html不全 ,

    以前用sina的blog ,他们的编辑器是自己写的 ,也加了过滤 , 比如说可以过滤掉 从word 复制来的文本样式 , 同样用FCKEditor会生成大量的重复的无用代码。

    FCKEditor只提供了过滤所有html的选项FCKConfig.ForcePasteAsPlainText 。

    谢谢你的答复。
    按需求写,我当然知道。我发这个帖子的目的就是看有没有这样的工具或方法,省掉自己写的麻烦。
    2009年5月16日 6:00
  • 没看明白你的需求是什么

    你拷贝别人的东西,要想得到规范的格式,需要自己处理的,去掉格式化的东西。
    【孟子E章】

    我就是想找这样的工具或方法
    2009年5月16日 6:01
  • 你的图中的出现方框2个不同效果,是因为css样式设置问题text-indent造成的,跟格式没有太大的关系,就是现成的工具,也不可能去修改样式或者属性的定义。
    其实,vs已经有格式化的功能了,在vs里,点编辑-格式-设置文档的格式。另外,还可以自己定义代码显示的方法,如是否换行等。

    FCKEditor也可以进行格式化成xhtml格式的。

    但,任何工具都不会去修改你的设置的属性的,除非是去掉格式,也就是无格式显示。
    【孟子E章】
    2009年5月16日 9:44
    版主
  • 阿里巴巴只是过滤了所有它人为不合法的HTML标签和CSS样式。原本第一个圆圈所在的div有text-indent:9pt的属性,所以它就有前导空白。
    Microsoft ASP.NET MVP
    2009年5月17日 12:19
    版主