今日覚えたことの覚え書き

Windows10で音声認識による文章作成を試してみる

2017.02.08 黒豆

Windows10で音声認識による文章作成を試してみる

Windows10には音声で文章を入力する機能があります。文章入力が楽になるのであればとりあえず試してみる価値はあるかなと。

そんなわけでWindows10で音声入力を試した四苦八苦した顛末の記事を音声入力で書いていきたいと思います。

Windows10で音声入力をするために前提として、パソコンに音声入力可能なマイクを接続している必要があります。
で、前回高性能のマイクのECM-PCV80Uを購入した記事を書きましたが、今回はそのマイクを使ってWindows10での音声入力を試してみたいと思います。

ソニー SONY エレクトレットコンデンサーマイクロホン PC向けボーカルマイク USB接続対応 ECM-PCV80U
ソニー

音声認識ツールを起動する方法

まず、タスクバー上にある検索(もしくはCortana)に「音声認識」と入力します。
すると「音声認識」というマイクのマークが出てきますのでそれをクリックします。

クリックすると音声認識のウインドウが開きますで、そこから「音声認識の開始」をクリックします。

するとセットアップが始まります。「次へ」をクリックします。

マイクの種類を選択します。ここではまず、自分の選択したマイクはちゃんと認識されているかを確認した後(私の場合はUABｰ80が表示されているのを確認した後)
マイクのタイプを選ぶことになります。私の場合はデスクトップマイクを選択しました。

マイクのセットアップということで、マイクの注意点などが書かれます。特に問題なければ「次へ」を押します。

マイクの音量の調整になります。サンプルとして出された文章を自分で読みあげます。自分の声をうまくパソコンが認識してくれれば次へ進めます。

これでマイクのセットアップは終了です。次は音声認識のセットアップに入ります。なかなかすぐに使えるようにはなりません。

音声認識の精度を上げるためにドキュメントのレビュー有効にするかどうかを聞かれます。
要はすでにパソコン内にあるメールやテキストファイルなどを音声認識に学習させることで変換の精度を上げる機能です。
とはいえわたしは不要だと思って無効にしました。

次は音声認識の起動方法についての選択です。
常に音声認識が発動していると、ふと何げないことをしゃべっている時に誤動作を起こされては困ります。
そんなわけで音声認識のオンオフをを手動でするか、音声でするかをで選択することができます。
私の場合は音声による有効化モードを使用するを選択しました。

音声認識リファレンスカードの印刷という画面が出てきました。
これは要するに音声認識でコンピューターを動作させるコマンドの一覧表です。とはいえ印刷するのも面倒くさいので、ここは「次へ」で飛ばすことにしました。

次の設定として、コンピューターを起動するときに毎回をの音声認識のツールを起動するかどうかの選択になります。
とりあえず私の場合、必要な時に起動すればいいのでここではチェックボックスを外しました。

これで音声認識が使えるようになったようです。な、長かった。
チュートリアルへの移行を進められますが、ムービーのついたチュートリアルページが表示されるだけなのでここでは割愛します。

音声認識がオンになると、このような感じの小さいツールが起動します。

音声認識ツールを使ってテキスト入力してみる

ツールのマイクマークが青になっていることを確認して、テキストエディターをアクティブにし言葉をしゃべってみると文章が書かれます。
青になってない場合、マイクマークをクリックすると青になります。
というわけでさっそく音声入力を試してみる。

ここでは「文章入力をテストしてみよう」と、しゃべってみました。
すると、代替パネルというミニウインドウが出現し、音声入力から判断した文章の例がいくつか出てきます。

今回の場合、一番が正解なので「1」「OK」と喋ると見事テキストエディター上に「文章入力をテストしてみよう」と、表示されました。

無事文章を入力することが出来ました。
この代替パネルのおかげで文章の認識と変換のミスが減ることはわかっているのですが、言葉をしゃべるたびにいちいち何番かと選択するのはテンポが悪くて、思った速度で文章の入力ができません。
というわけで、この代替パネルの消し方もメモっておきます。

まず、音声認識するを右クリックしてメニューを出し、オプションの項目に入ります。
その中に「ディクテーションパネルを有効にする」という項目がありますので、これもチェックボックスを外します。

すると、しゃべるたびに代替パネルが出てくることなく、しゃべったことをそのまま表記してくれます。
ただし、変換候補が出ないということは当然しゃべった内容を正しく変換できる可能性は低くなります。

これは辞書を強化していくほかに方法は無いのかもしれません。

というわけで、音声認識機能ですがこの文章も実際音声認識で書いていますし、思ったよりはスムーズに認識してくれて割と「使える」という印象があります。

ただし、ほんとにしゃべる速度で次々と文書を作成するには、それなりに音声辞書の作成や発音の修正等を行っていく必要がありそうです。
また、Androidの音声入力と比べてどうかというと、PC環境などもありますがやはりGoogleの方に軍配が上がる印象。

といった感じで、音声認識による文章作成でした～。

コメントはこちらコメントをキャンセル

カテゴリー