none
如何在正在进行的语音识别过程中更改识别配置文件(识别用户)? RRS feed

  • 问题

  • 正在进行一个识别,因为识别过程中有突然出现的第二种声音,所以要正确识别,需要马上转换识别器的识别用户,但又不能停顿太长时间而影响正常的识别,求助。
    2015年3月18日 17:13

全部回复

  • 正在进行一个识别,因为识别过程中有突然出现的第二种声音,所以要正确识别,需要马上转换识别器的识别用户,但又不能停顿太长时间而影响正常的识别,求助。

    事实上, 它是无法判断是不是其他用户的声音的,因此它依旧是执行之前的识别。

    对于识别配置,我们只能在提供的事件中做处理,因此修改配置所引发的停顿, 其实是很难控制的。

    SpeechRecognitionEngine 事件

    比如 SpeechRecognitionEngine.RecognizeAsync 方法 所提到的

    若要修改识别器如何处理它或沈默计时) 标识,请使用 BabbleTimeoutInitialSilenceTimeoutEndSilenceTimeoutEndSilenceTimeoutAmbiguous 属性。


    We are trying to better understand customer views on social support experience, so your participation in this interview project would be greatly appreciated if you have time. Thanks for helping make community forums a great place.
    Click HERE to participate the survey.



    2015年3月19日 7:47
    版主
  • 不是字典识别,是对固定的声音进行识别,所识别的文字很少,第一个声音只是说固定的文字,第二个声音才有一些变化,所以第一个声音识别成功后,在它的识别成功事件中,就可以开始转换为第二个声音。

    只是这个转换必须要求识别器停下来,转换完成后再重新开始,这样会少2-3秒的时间,这个丢失的时间是不可接受的。

    所以我想应该从转入的声音流对象中想办法。(我是指想办法改变识别的音量)

    对于转换声音,就是识别用户,也只能朝这个方向寻找办法。

    谢谢你的回答,我再看看你的建议。

    2015年3月20日 8:31
  • 后来经过大量的研究,无法在实时识别过程中更换识别用户,(profile),也无法更改识别音量,因为识别引擎一开始,这些都是固定的,任何改动都会引起不可预测的错误.

    要实现分段式的识别,只能通过识别WAVE文件,即识别录音来完成.

    但是录音识别中,对引擎的训练成了一个非常困难的事情,因为找不到使用WAVE文件训练引擎的方法.

    有人说,只要提供了这种方法,那么我们自己就可以新建一个语音识别产品了.就是又出一个象讯飞之类的产品出来.

    事实上真的如此吗?继续查找通过WAVE训练引擎的方法.

    2015年11月30日 7:56