トップ回答者
IE11上で動作するコンテンツ上でマイクで入力された音声データを文字データとして取得したい。

質問
-
IE11で動作するコンテンツ上(html,javascript)でマイクで入力された音声データを文字データとして取得したいです。
いくつかWebサイトをみたところ、Windows 8.1 には音声認識の機能があり、
APIとしてSAPIが存在し、このSAPIではIE上で動作するJavaScriptAPIが提供されているように見えました。
上記を利用したいのので以下を教えて頂けないでしょうか?
・開発に必要なSDK(オフラインで利用可能なもの)のダウンロードサイト
・サンプルコードとリファレンスのサイト(可能なら音声データを文字データとして取得するサンプル)
間違いなどがございましたらご指摘ください。
- 編集済み 星 睦美 2015年6月15日 6:07 タイトルを補足しました
回答
-
表題の修正(E上で動作する・・・ ⇒ IE11上で動作する・・・)をお願いします。
> いくつかWebサイトをみたところ、Windows 8.1 には音声認識の機能があり、
> APIとしてSAPIが存在し、このSAPIではIE上で動作するJavaScriptAPIが提供されているように見えました。それは HTML5 の Web Speech API のことではないですか?
そうであれば、以下の URL のページの情報によれば、IE はサポートしてなくて、現時点では Chrome, Safari だけのようです。
Can I Use
http://caniuse.com/#feat=web-speech
ググって調べた限りですが、Chrome では以下のような例が見つかりました。ブラウザのみで音声認識とテキスト読み上げを実現する Web Speech API
http://www.cyokodog.net/blog/web-speechi-api/「html5」「音声認識」などをキーワードに検索すれば、他にも参考になりそうな記事がヒットすると思いますので、興味があればやってみてください。
HTML5 の Web Speech API の話ではなくて、Windows 8.1 の機能だということであれば、質問者さんが見た「いくつかWebサイト」の URL を教えていただけませんか?
-
https://msdn.microsoft.com/en-us/library/ms720593%28v=vs.85%29.aspx
で書かれている "This includes the ability to use JScript®, Visual C#®, ...." は COM オートメーションのアビリティについての話で、IE 上の Jscript (JavaScript) とは別の話です。
hebikuzure
すべての返信
-
表題の修正(E上で動作する・・・ ⇒ IE11上で動作する・・・)をお願いします。
> いくつかWebサイトをみたところ、Windows 8.1 には音声認識の機能があり、
> APIとしてSAPIが存在し、このSAPIではIE上で動作するJavaScriptAPIが提供されているように見えました。それは HTML5 の Web Speech API のことではないですか?
そうであれば、以下の URL のページの情報によれば、IE はサポートしてなくて、現時点では Chrome, Safari だけのようです。
Can I Use
http://caniuse.com/#feat=web-speech
ググって調べた限りですが、Chrome では以下のような例が見つかりました。ブラウザのみで音声認識とテキスト読み上げを実現する Web Speech API
http://www.cyokodog.net/blog/web-speechi-api/「html5」「音声認識」などをキーワードに検索すれば、他にも参考になりそうな記事がヒットすると思いますので、興味があればやってみてください。
HTML5 の Web Speech API の話ではなくて、Windows 8.1 の機能だということであれば、質問者さんが見た「いくつかWebサイト」の URL を教えていただけませんか?
-
Microsoft コミュニティとのマルチポストですね。
内容的にこちらで続けていただくのが良いでしょう。
hebikuzure
-
ご回答ありがごうございます。
本件、最初にコミニティの方に投稿しましたが
投稿先が不適切とご指摘がありましたのでこちらに移動しました。
コミニティの方にも返信したかったのですが私のPCの環境では
scriptの実行エラーで返信ができない状態です。
>質問者さんが見た「いくつかWebサイト」の URL を教えていただけませんか?
上記ですが以下となります。
①
「ja.wikipedia.org/wiki/Speech_Application_Programming_Interface」
SAPI 5.1の説明として「 JScriptなどのスクリプト言語」のサポートの言及があるように見受けられます。
②
「msdn.microsoft.com/en-us/library/ms720593(v=vs.85).aspx」
「This includes the ability to use JScript®, Visual C#®, or possibly other solutions that support automation. 」
上記の通り、JScriptについて言及があるように見受けられます。
これらの情報からwindows 8.1の環境ではこれらのAPIが利用できなるのではないかと
推測している次第です。
また、①のURLの記載として
「Windows Speech Recognition がオペレーティングシステムに統合されると同時に、Speech SDK と API は Windows SDK の一部となっている。」
と記載があるため、利用するためにはどのSDKをダウンロードしたらよいか質問をさせて頂いた次第です。
お手数ですがご確認・ご回答頂けると助かります。
-
https://msdn.microsoft.com/en-us/library/ms720593%28v=vs.85%29.aspx
で書かれている "This includes the ability to use JScript®, Visual C#®, ...." は COM オートメーションのアビリティについての話で、IE 上の Jscript (JavaScript) とは別の話です。
hebikuzure
-
フォーラム オペレーターの星 睦美です。
音声データを文字データにする機能ということで、日本語での検索以外に英語で"Speech-to-Text" や "Speech recognition" をキーワードに私のほうでも検索してみました。Windows 8.1 向けの音声認識に関しては以下の情報がありましたので参考までにリンクさせていただきますね。(残念ながら質問に該当する内容を含んだ情報は見つけることができませんでした。)
・Using Speech-to-Text on the Microsoft Surface:
http://windowsitpro.com/windows-81/using-speech-text-microsoft-surface質問の「IE11上で動作するAPI」からは離れますが、音声認識に関連したクラウドのサービスがありますので、こちらもご参考までに紹介させていただきます。
・Microsoft’s Project Oxford helps developers build more intelligent apps (英語 Microsoft ブログから)
・Project Oxford (英語)
・MSDN フォーラム(英語) Microsoft Azure > Project Oxford
フォーラム オペレーター 星 睦美 - MSDN Community Support
- 編集済み 星 睦美 2015年6月19日 7:42 編集
-
フォーラム オペレーターの星 睦美です。
返信で追加いただいた内容は、新しい質問としてスレッドを作成させていただきました。タイトルは仮に[つづき] としましたので、質問の内容が分かりやすいように変更していただければと思います。[つづき] IE11上で動作するコンテンツ上でマイクで入力された音声データを文字データとして取得したい。
フォーラム オペレーター 星 睦美 - MSDN Community Support