locked
WP7可用的语音识别接口有么? RRS feed

  • 问题

  • 我看了讯飞语音云,但不确定能不能用,而且那个还得签一份协议。其他的还有么?在CSDN上有说google有一个语音的测试接口,也有效果,还有就是anddroid的API。有做过的这方面的能不能给个指导,谢谢啦。
    2012年1月18日 15:19

答案

  • Well.针对语音识别微软的Tellme技术并在提供任何接口.不过这个可能会在阿波罗版本会更新出来.

    关于语音识别技术现在主流主要有三家.微软现在产品线中主要采用的是08年收购Tellme技术.TellMe技术不仅在Windows phone 也在下一版本PC Win8和其他产品线逐渐加入融合.

    Google上提供的几口也是采用自己的技术.至于苹果公司的类似IPhone 4S 其实后端并没有自己的语音识别技术.而是采用语音识别巨头Nuance技术.Nuance就不多说了.在语音识别领

    域做得最早最为成熟也就是IBM公司后来Nuance收购IBM关于语音识别一分部业务和专利. IPhone 4S所体现并非真正学术意义上的人工智能.它只是一个半成品.未来人工智能道路还有很多路要走..

    说了这么多 那么有哪些做语音识别有哪些平台支持?. 目前关于中文语音识别的平台国内有科大讯飞 已经比较成熟 很多大型厂商也加入.类似联想乐Phone语音小助手就是很好的例子

    [youku有视频].国外关于中文语音识别支持的平台很少 基本没有. 不过Nuance 还在其列. 中文语音识别在Native Language 自然语义识别上完全不同.英文的完全可以拆分成不同词.

    而中文固定词在不同语境语义也是千变万化.关于中文和英文在语音识别上其实自然语言处理有很大不同.中文NLP理论上就很难超越英文NLP.根本的问题就在于中文

    的语义单元是“字”,而英文的语义单元是“词”.中文中每个字在不同语境和组合情况语意都不同.这也是照成计算机更难处理中文一个瓶颈之一.其实siri能够识别

    中文.但后台云端语意理解是难点。

    .语音识别是涉及到多学科的并在行业中是存在技术壁垒的独立领域. MS Google 很多具有代表性公司都在做.目前它实现的难度要远远高于实际需求.那Siri形

    式来说.首先要对语音识别. 在场景对话中要理解不同语言用户语意. 语意转换成可执行指令. 最简单三条..

     

    目前科大讯飞关于Windows 平台支持很弱 也开发SDK 不过是C++的 版本. 免费想开发人员开放.

    希望这些能对你有所帮助. 有时间针对Windows phone语音识别我会写一篇博文.

     



    专注Windows phone 开发. 微博:http://weibo.com/chenkaihome 博客:http://chenkai.cnblogs.com/
    • 已建议为答案 XuesongGao 2012年1月19日 6:50
    • 已标记为答案 Otomii Lu 2012年1月26日 23:54
    2012年1月19日 5:43

全部回复

  • Well.针对语音识别微软的Tellme技术并在提供任何接口.不过这个可能会在阿波罗版本会更新出来.

    关于语音识别技术现在主流主要有三家.微软现在产品线中主要采用的是08年收购Tellme技术.TellMe技术不仅在Windows phone 也在下一版本PC Win8和其他产品线逐渐加入融合.

    Google上提供的几口也是采用自己的技术.至于苹果公司的类似IPhone 4S 其实后端并没有自己的语音识别技术.而是采用语音识别巨头Nuance技术.Nuance就不多说了.在语音识别领

    域做得最早最为成熟也就是IBM公司后来Nuance收购IBM关于语音识别一分部业务和专利. IPhone 4S所体现并非真正学术意义上的人工智能.它只是一个半成品.未来人工智能道路还有很多路要走..

    说了这么多 那么有哪些做语音识别有哪些平台支持?. 目前关于中文语音识别的平台国内有科大讯飞 已经比较成熟 很多大型厂商也加入.类似联想乐Phone语音小助手就是很好的例子

    [youku有视频].国外关于中文语音识别支持的平台很少 基本没有. 不过Nuance 还在其列. 中文语音识别在Native Language 自然语义识别上完全不同.英文的完全可以拆分成不同词.

    而中文固定词在不同语境语义也是千变万化.关于中文和英文在语音识别上其实自然语言处理有很大不同.中文NLP理论上就很难超越英文NLP.根本的问题就在于中文

    的语义单元是“字”,而英文的语义单元是“词”.中文中每个字在不同语境和组合情况语意都不同.这也是照成计算机更难处理中文一个瓶颈之一.其实siri能够识别

    中文.但后台云端语意理解是难点。

    .语音识别是涉及到多学科的并在行业中是存在技术壁垒的独立领域. MS Google 很多具有代表性公司都在做.目前它实现的难度要远远高于实际需求.那Siri形

    式来说.首先要对语音识别. 在场景对话中要理解不同语言用户语意. 语意转换成可执行指令. 最简单三条..

     

    目前科大讯飞关于Windows 平台支持很弱 也开发SDK 不过是C++的 版本. 免费想开发人员开放.

    希望这些能对你有所帮助. 有时间针对Windows phone语音识别我会写一篇博文.

     



    专注Windows phone 开发. 微博:http://weibo.com/chenkaihome 博客:http://chenkai.cnblogs.com/
    • 已建议为答案 XuesongGao 2012年1月19日 6:50
    • 已标记为答案 Otomii Lu 2012年1月26日 23:54
    2012年1月19日 5:43
  • 请关注我的微博吧.

    我微博中已经多次提到关于Windows phone语音的一些核心原理和处理技术 目前支持开发第三方平台等等.

    :)


    专注Windows phone 开发. 微博:http://weibo.com/chenkaihome 博客:http://chenkai.cnblogs.com/
    2012年1月19日 5:55
  • 恩,回答的真详细,谢谢。因为自己现在在做语音识别方面的研究(主要借助HTK),想利用WP7这个平台了解下云语音识别方面,同时自己对WP7上的开发也比较感兴趣。我想知道截止到WP7上可用的第三方接口有没有?
    2012年1月20日 12:48