none
阿里巴巴html处理原理?请帮忙解决。 RRS feed

 • 问题

 • 在需要从外部拷贝一些资料到网站时候,经常出现html太乱,无法编辑的情况。苦苦找寻没有良策。

  但发现阿里巴巴的处理非常好。

   

  处理前的文字效果:

  格式很乱,在FCKEditor下面没有办法编辑

  但通过阿里巴巴预览后,自动修复了,修复后的效果

  将数据post到这个页面后:http://china.alibaba.com/offer/html_detail_preview.htm?detail_name=desc,进行了处理。

  处理后的效果很好:

  我的问题:这样处理的思路以及实现的方法是什么?

  2009年5月16日 1:58

答案

 • 阿里巴巴只是过滤了所有它人为不合法的HTML标签和CSS样式。原本第一个圆圈所在的div有text-indent:9pt的属性,所以它就有前导空白。
  Microsoft ASP.NET MVP
  2009年5月17日 12:19
  版主

全部回复

 • 没看明白你的需求是什么

  你拷贝别人的东西,要想得到规范的格式,需要自己处理的,去掉格式化的东西。
  【孟子E章】
  2009年5月16日 2:48
  版主
 • 楼主,过滤了, 你可以自己去按需求写一个 , 比如上面的的: <div>标签的style属性去掉了 , 无效的<img >也过滤掉, 最后去html不全 ,

  以前用sina的blog ,他们的编辑器是自己写的 ,也加了过滤 , 比如说可以过滤掉 从word 复制来的文本样式 , 同样用FCKEditor会生成大量的重复的无用代码。

  FCKEditor只提供了过滤所有html的选项FCKConfig.ForcePasteAsPlainText 。
  2009年5月16日 5:22
  版主
 • 楼主,过滤了, 你可以自己去按需求写一个 , 比如上面的的: <div>标签的style属性去掉了 , 无效的<img >也过滤掉, 最后去html不全 ,

  以前用sina的blog ,他们的编辑器是自己写的 ,也加了过滤 , 比如说可以过滤掉 从word 复制来的文本样式 , 同样用FCKEditor会生成大量的重复的无用代码。

  FCKEditor只提供了过滤所有html的选项FCKConfig.ForcePasteAsPlainText 。

  谢谢你的答复。
  按需求写,我当然知道。我发这个帖子的目的就是看有没有这样的工具或方法,省掉自己写的麻烦。
  2009年5月16日 6:00
 • 没看明白你的需求是什么

  你拷贝别人的东西,要想得到规范的格式,需要自己处理的,去掉格式化的东西。
  【孟子E章】

  我就是想找这样的工具或方法
  2009年5月16日 6:01
 • 你的图中的出现方框2个不同效果,是因为css样式设置问题text-indent造成的,跟格式没有太大的关系,就是现成的工具,也不可能去修改样式或者属性的定义。
  其实,vs已经有格式化的功能了,在vs里,点编辑-格式-设置文档的格式。另外,还可以自己定义代码显示的方法,如是否换行等。

  FCKEditor也可以进行格式化成xhtml格式的。

  但,任何工具都不会去修改你的设置的属性的,除非是去掉格式,也就是无格式显示。
  【孟子E章】
  2009年5月16日 9:44
  版主
 • 阿里巴巴只是过滤了所有它人为不合法的HTML标签和CSS样式。原本第一个圆圈所在的div有text-indent:9pt的属性,所以它就有前导空白。
  Microsoft ASP.NET MVP
  2009年5月17日 12:19
  版主