我要做一个程序,功能是读取doc文件的内容,然后编辑。如果内容发生变化,只改变所该的部分并保存。我遇到的问题是doc文件的包含很多,我不知道怎么翻别他们。
比如:一个文件的内容,开始处有一段文本,然后又一个表,表里的内容也有文本。我怎么知道,一段文本的开始和结束位置,如果存在表的话,怎么判断存在个表并怎么知道读取的内容是来自表或者普通的文本段?
我读取doc的时候,它返回了整个文档中的内容,包含一般的文本段,又包含表的内容,我怎么能分开地处理各个段?
大家帮忙,指教!
谢谢!
1。如果您确定必须采用Doc 格式进行相关文本的管理的话, 可以参考这个链接操作ms-word进行实现:
2。如果您对doc文件只是可选项,也可以考虑其他技术实现的话。 我建议你采用公开格式的rich text 标准进行操作。