none
电脑的人脸识别、手机的语音识别、输入法的手写识别,都是怎么实现的? RRS feed

全部回复

  • 这个不是简单一句话能够说明的。论文都有几车子了。

    比较简单的理解 就是样本相似度比较。当相似到一定程度就认为是识别到了。这个也是很多识别系统经常识别错误的原因(只要是在容许范围内,还是可以商用的)。

     


    family as water
    2011年3月14日 14:30
  • 原理听别人说过,第一步计算是把图片变成简单的线条,第二步再处理这些线条!
    2011年3月15日 0:48
  • 人脸识别系统主要是根据眼睛和嘴的相对位置以及脸部的大概形状来判断,两只眼睛和嘴是人脸上最突出的3个元素,而它们的三角形布局关系更是判断的核心。如果这3个点中少一个,相机都无法识别人脸。例如,对于侧面的人脸,目前的技术无法识别;你如果戴着口罩,相机无法识别;但戴眼镜没有问题,因为那更强化了眼睛这个元素。
    这里是一个C++的样例:Face Detection C++ Library with Skin and Motion Analysis

    语音识别过程主要包括语音信号的预处理、特征提取、模式匹配几个部分。预处理包括预滤波、采样和量化、加窗、端点检测、预加重等过程。语音信号识别最重要的一环就是特征参数提取。在训练阶段,将特征参数进行一定的处理后,为每个词条建立一个模型,保存为模板库。在识别阶段,语音信号经过相同的通道得到语音特征参数,生成测试模板,与参考模板进行匹配,将匹配分数最高的参考模板作为识别结果。同时,还可以在很多先验知识的帮助下,提高识别的准确率。
    关于语音识别,微软有一个
    Microsoft Speech API 5.1,可以研究研究。

    手写识别的简单原理:提取单字的特征,落笔顺序,笔画、形状、轮廓、偏旁等(软件早已完成)。建立手写模板库和单字特征数据库。。对用户的字进行模板匹配,不能确定则给出类似字(后台进行)。用户选择后,利用单词库和语句库进行联想提示,以增加用户输入速度。

    Leo Liu [MSFT]
    MSDN Community Support | Feedback to us
    Get or Request Code Sample from Microsoft
    Please remember to mark the replies as answers if they help and unmark them if they provide no help.

    2011年3月16日 9:15
    版主
  • 谢谢,虽然说的我还是不是太懂,但是有那么一点概念了,我会继续关注这个问题的
    每一天,都是一个新的生命
    2011年3月16日 15:29