
〇[今回のテーマ]Word文書に日本語テキストを音声入力。
文書作りで最も面倒なのは、何といっても文字入力の作業ではないだろうか。キーボードからの入力が苦手だったり、困難だったりする人も少なくない。そこで期待が高まるのが、音声で文字列を入力する機能だ。
Wordでは、サブスクリプション版(Microsoft 365)に音声入力の機能が備わっている(図1)。日本語対応は、まだ精度が低いとされるプレビュー段階だが、句読点を自動入力できるなど使い勝手は悪くない。
Θ Microsoft 365のWordで音声入力。
図1、Microsoft 365のWordには音声入力機能「ディクテーション」が備わっていて、文章を読み上げたり、話したりしながら文字列を入力できる。日本語の入力はプレビュー段階だが、句読点や記号の挿入、改行の指示も音声入力が可能だ。
Windows 11にも音声入力機能があり、こちらは日本語が正式にサポートされている(図2)。この機能を利用すれば、永続ライセンス版のWordでも音声入力が可能だ。
Θ Windows 11+Wordで音声入力。
図2、音声入力機能がないWordでは、Windows 11の音声入力機能を利用しよう。こちらは日本語が正式にサポートされており、句読点などの入力に加え、選択といった操作も音声で指示できる。
今回は2つの音声入力機能を実際に試し、操作性と実用性を検証してみる。
キー入力と併用するのが効率的 テープ起こしにもかなり使える。
作例は、自転車保険への加入義務を説明する文章。日付、英単語、記号を含む日本語のテキストを、読み上げる方法で音声入力する。音声入力機能を使うには、パソコンがマイクとインターネットに接続されている必要があるので、事前に確認しておこう。
まずは、Wordの機能を使ってみよう。音声入力は、「ホーム」タブの「ディクテーション」ボタンをクリックして開始する(図3上)。「マイク」アイコンが青くなり、「聞き取り中」と表示されたら準備完了だ。マイクのオンとオフは、アイコンのクリックで切り替えられる(図3下)。
Θ Wordの機能で音声入力を開始する。
図3、音声入力する文書を開き、「ホーム」タブの「ディクテーション」ボタンをクリックする(1)(2)。音声入力ウインドウが表示され、聞き取りが開始される(3)。「マイク」アイコン(または「ディクテーション」ボタン)をクリックすると聞き取りが一時停止し、再度クリックすると再開される。音声入力を終了するときは画面を閉じる(下)。
なお、Wordの音声入力機能はOfficeの「コンテンツを分析するエクスペリエンス」をオフにしていると利用できない。その場合はメッセージが表示されるので、必要な設定をしよう(図4)[注]。
Θ 接続エクスペリエンスの注意が表示された場合。
図4、図3上の操作後に「Officeの接続エクスペリエンスを使用する」の画面が表示されたときは、「[ファイル]>[アカウント]>[アカウントのプライバシー]」を選択(1)。表示される画面の「接続エクスペリエンス」にある「コンテンツを分析するエクスペリエンスをオンにする」をチェックして「OK」ボタンをクリックする(2)(3)。次の画面で「OK」ボタンをクリックし(4)、その後Wordを再起動する(5)。
[注]「コンテンツを分析するエクスペリエンス」をオンにすることで、音声がマイクロソフトに送信され、テキストに変換されて返される。プライバシーについては「音声データや文字起こしされたテキストが保存されることはありません」と説明している
マイクがオンの状態で作例の1行目を読み上げると、文章が想像以上に素早く正確に表示された(図5上・中)。改行の操作も「かいぎょう」という音声で実行できる(図5下)。また「、」は「読点(とうてん)」、「「」は「かぎかっこ開く」のように、記号も音声で入力できる(図6)。もちろん、聞き取りがうまくいかず入力ミスになったり、漢字の変換ミスが起こったりするので、細かい修正は必要だ(図7)。
Θ 音声で文章を入力していく。
図5、ここでは上の文章を読み上げて入力する。まず、1行目を話す(1)。カーソル位置から文字列が入力される(2)。最後に「かいぎょう」と話すと改行される(3)(4)。または「Enter」キーを押して改行してもよい。
図6、続けて本文を音声入力していく(1)。「、」は「とうてん」、「。」は「くてん」、「「」は「かぎかっこ開く」、「」」は「かぎかっこ閉じる」で入力できる。作例では文字列が見やすいよう、フォントと文字サイズを変更した(2)。
図7、入力ミスなどは適宜修正する。誤変換された部分は選択して「スペース」キーを押し、候補から正しい漢字を選ぶ(1)(2)。文字列をひと通り音声入力してから作業してもよい。
ここまでの操作を何度か繰り返して気付いたのは、音声入力にはとにかく静かな環境が必要だということ。マイクの感度にもよると思うが、背後で聞こえるテレビの小さな音声も拾って入力されてしまった。また、言葉はなるべく明瞭に発音することも大事だ。あいまいな発音で「加入」が「搬入」と間違われることもあった。
一部の記号は音声入力できるが(図8)、慣れないとすぐには出てこないもの。そこでお勧めなのは、キー入力と併用する方法。音声入力中もキーボードは使えるので、句読点、スペース、記号などはキー入力してもよい。
Θ 句読点や記号を入力する音声。
図8、句読点と一部の記号は音声で入力できる[注]。覚えたり話したりするのが面倒な場合は、文字列は音声、句読点や記号はキーボードのように、併用しながら入力するのもよい。
[注]1つの記号に複数の音声が用意されている場合がある。ここではその中から、発声しやすい音声を紹介した
作例の文章はすべて音声で入力したが、間違いは比較的少なかった(図9)。このほか「ガチの文化ってやっぱ怖いもんですから」のような話し言葉も聞き取ってくれたので、テープ起こしにも重宝するだろう。
Θ 音声入力した文字列を確認して修正する。
図9、文字列をひと通り入力したら内容を確認する。ここでは、「なかには」が「中庭」(1)、「、」が「当店」(2)、「1日」が「一日」(3)、「Bicycle Safety」が「バイスクルセーフティー」(4)と誤入力された。ただ「とうてん」が続いた部分の「、当店」は正しく入力されている(5)。誤りの箇所は、正しい文字列に修正する。
英数字の入力に関しては、発展途上という感じだ(図10)。なお、日本語以外の音声を入力するときは言語を切り替える(図11)。英語は正式にサポートされており、試しにCNNのニュースを聞き取らせたところ、かなり正確に入力された。
Θ 英数字の精度はケースバイケース。
図10 英単語や日付などの音声入力では、意図した通りに入力される場合と、誤入力される場合があった。結果を見て、適宜修正しよう。
図11、英文を入力する場合は、言語を切り替える。音声入力ウインドウの「ディクテーションの設定」メニューを開き、「話し手の言語」サブメニューから使用する言語(ここでは「英語(米国)」)を選ぶ(1)~(3)。
自動入力は状況に応じて使う Win 11はキーと併用しにくい。
句読点の自動入力では「、」を入れたい箇所に「。」が入ることが多く、精度はあまり良くなかった(図12)。ただ、よどみなく話すと適度に「、」が入るので、テープ起こしの際はオンにしておくのがお勧め。文字列が隙間なく連なるのを防ぐことができる。
Θ 句読点を自動入力する。
図12 音声入力ウインドウの「ディクテーションの設定」メニューから「句読点の自動挿入を有効にする」を選んで、先頭にチェックマークを付ける(1)(2)。音声入力をしていくと、句読点が自動入力される(3)。少し間を空けると「。」が入ってしまい、精度はいまひとつだ。
Wordの音声入力機能で困ったのは、所々に半角スペースが挿入されること(図13)。今後改善される可能性はあるが、現時点では防げない。音声入力後に、Wordの「置換」機能で半角スペースを一括削除しよう(図14)。
Θ 不要な半角スペースを一括削除するには。
図13、「ホーム」タブの「編集記号の表示/非表示」ボタンをオンの状態にする(1)(2)。所々に半角スペース記号「・」が表示され、不要な半角スペースが挿入されているのがわかる(3)。
図14「Ctrl」+「H」キーを押して、「検索と置換」ダイアログボックスの「置換」タブを開く(1)。「検索する文字列」欄にカーソルを移動し、「Shift」+「スペース」キーで半角スペースを入力(2)。「すべて置換」ボタンをクリックする(3)。文書内の半角スペースがすべて削除される(4)。
Windows 11の音声入力機能も、基本的な使い方はWordと変わらない(図15)。聞き取りの精度や句読点の入り方も、ほぼ同じだった。半角スペースの挿入はほとんどなくて助かる。ただ、途中でキーボードを使うとマイクがオフになってしまうため、キー入力と併用しにくいのが難点だ。
Θ Windows 11の音声入力機能を利用する。
図15、Wordの編集画面を表示した状態で「Windows」+「H」キーを押す(1)。Windows 11の音声入力ウインドウが表示され、聞き取りが開始される(2)。句読点を自動入力するときは「設定」メニューを開き、「句読点の自動入力」をオンにする(3)(4)。「マイク」アイコンをクリックすると(5)メニューが閉じられ、聞き取りが開始される。Wordの音声入力機能と同様、文字列を話しながら入力していく(6)。
なお、Windows 11の機能では、句読点や記号などのほか、一部の操作も音声で指示できる(図16)。
図16、Windows 11の機能では、一部の操作も音声で指示できる。例えば、最後に入力した語句を確認してから消したいときは、「それを選択」「それを削除」と続けて話せばよい。