スクリーンリーダーの OCR 機能で画像の文字を読み取る

公開日

スクリーンリーダーユーザーの困る事の一つが文字を画像として表示させているサイト。
重要な事やアピールしたい文章を画像で視覚的に目立つ様にしている訳ですが、「逆にそこだけ読めないよ!」と突っ込みたくなります。
しかし、サイト制作者としては見てもらいたい文章をそこに載せているのですから、読み上げないというのは問題です。
そもそも Alt 属性(代替テキスト)をちゃんと設定しておけという話なのですが、この問題の解決に少し役に立つかもしれないものが OCR 機能です。

NVDA の OCR 機能

NVDA は Windows 10 から搭載された OCR 機能を利用して画像の文字を読み取る事が出来ます。
「設定」→「Windows 10 文字認識」→「文字認識の言語(L)」が「日本語」になっているのを確認。

画像にフォーカスを当てたら「NVDA キー + R」で OCR 機能を呼び出して上下左右キーで読み取ったテキスト間を移動出来ます。
読み終えたら「Esc」で通常モードに戻ります。

PC-Talker 10 の OCR 機能

PC-Talker 10 では OCR 読みがサポートされています。
画像にフォーカスを当て、「Ctrl + Alt + Win + 3」で現在のフォーカスのある部分を OCR 認識して読み上げます。

フォーカスが上手く当てられない場合は、「Ctrl + Alt + Win + 4」で現在アクティブなウィンドウ全体を OCR 読み出来ます。
これは、何かメッセージが出ているけど読み上げてくれないといった時に役に立ちます。

PC-Talker の設定の「音声ガイドの設定」に有る「画像を自動的にOCR認識して読み上げる(&R)」はチェックを入れていてもコマンドを打たないと OCR 読みしてくれない事が多いので注意して下さい。

また、フォーカス部分の OCR 読みとウィンドウ全体の OCR 読み、画面の拡大率でも認識の精度が変わるので何通りか試すと良さそうです。
読み上げたら「Ctrl + Alt + PageUp」でログを呼び出し「Ctrl + Alt + S」でコピーすると、エディターに張り付けたり1文字ずつ確認する事も出来ます。

OCR 機能の使い分け

文字認識の性能は NVDA の方が若干高い印象。
NVDA と言うより Windows 10 の性能になるんですかね。

操作性や応用性は PC-Talker の方が高いです。
特にウィンドウの全文読みは、今まで読み上げる事が出来なかったポップアップのメッセージ等も読み上げる事が出来て便利です。

また、OCR 認識は動画の字幕を読むといった特殊な使い方も出来ます。
プロフェッショナルの仕事の流儀的なものを見ていて「トゥーン」と音が鳴ったらすかさず一時停止して OCR 読みコマンドを入力してみましょう。
そこにはあなたにとって新しい「トゥーン」が有るかもしれません。