none
如何判断UTF8编码中的中文字? RRS feed

  • 问题

  • 一段UTF8任意字符串如: "我按北京天安门!!" , 如何判断每一个字到底是种文字,还是其它符号?

    GB2312 很好做, 类似于ACSII, 只需要判断编码范围即可. 但是我不知道UTP8怎么做到? 谢谢


    信奎爷,无所畏惧!!
    2011年5月17日 3:11

答案

  • dear

    我猜你是要問code page,參考以下討論串是否對你有益

    http://social.msdn.microsoft.com/Forums/zh-CN/233/thread/d9879f8b-ab96-466e-a7bd-94167c52d0d1

     


    秘訣無它,唯勤而已 http://www.dotblogs.com.tw/yc421206/
    2011年5月17日 5:40
  • thank you so much!! I'll try it and have a report later.
    信奎爷,无所畏惧!!
    2011年5月18日 1:56

全部回复

  • 一个简单的方法:

     

    吧 UTF8 的字符串转 Unicode,然后再判断。

     

    如果韩式不行,就转成 GB2312,那样总没有问题了吧。


    学习学习....
    2011年5月17日 5:07
  • dear

    我猜你是要問code page,參考以下討論串是否對你有益

    http://social.msdn.microsoft.com/Forums/zh-CN/233/thread/d9879f8b-ab96-466e-a7bd-94167c52d0d1

     


    秘訣無它,唯勤而已 http://www.dotblogs.com.tw/yc421206/
    2011年5月17日 5:40
  • thank you so much!! I'll try it and have a report later.
    信奎爷,无所畏惧!!
    2011年5月18日 1:56
  • thank you so much!! I'll try it and have a report later.
    信奎爷,无所畏惧!!


    dear

    建議不要亂標答案,有利其他人參考


    秘訣無它,唯勤而已 http://www.dotblogs.com.tw/yc421206/
    2011年5月18日 5:37