jeyseni's diary

「ジェイセニ」と呼んでください。批判ではなく提案をするのが生き甲斐です。

聞き逃しアナウンスを「音声テキスト変換アプリ」でカバーしてみる--スマホでのモニタリング録音の代替措置として

歳を取ったのだろう,電車の車内放送を聞き逃すことがある。アナウンスの順番はいつも同じなので,注意していればいいはずなのだが,なぜかその車内放送だけはいつも肝心な情報を聞き漏らすのである。

 電車の中で筆者の気を引くものといえば,トレインチャンネルの情報である。テレビ世代なので,天井近くの画面で表示させる動画についつい目が行ってしまう。トレインチャンネルは音がない分,かなり集中してしまう。それで,車内放送の肝心な部分を聞き逃してしまうようである。

 そこで,Androidボイスレコーダーアプリを使って,いつも聞き逃すタイミングの車内放送を録音することを考えた。

 Windows PCなら,結構よく使われるAudacityというフリーソフトを標準的に使ってきた。このソフトの良いところとして,録音中の音をイヤホンでモニタリングできることである。原理的にはマイクで拾った音をイヤホンで確認しながら音声ファイルとして記録できるので,安心感があることと,聞き取りにくい場合にイヤホンのボリュームを上げて確認できるところが気に入っていた。

 ところが,Androidスマホでこのモニタリング録音ができるアプリがなかなか見つからなかった。いろいろなボイスレコーダーアプリを片っ端からインストールしては試してみるのだが,イヤホンでのモニタリングの設定がされたアプリが見つからない。

 iOSでは「MOREC」というアプリがすぐに見つかった。しかしgoogle play storeにAndroid用はなかった。

 いちおうAPKファイルとして提供されていたので,ダウンロードしてインストールし,その機能は確かめられた。面白いことに,Bluetoothイヤホンを使うと実際の音からわずかに遅延して聞こえることが分かった。この遅延そのものは今回の聞き逃しに対しては問題はない。ただ,録音後すぐに再生しても,録音の頭に戻ってしまうので,「聞き直し」という目的には合わないかもと思った。有料登録するまでは録音時間や複数ファイルの録音ができないので,そこまですることもないか,という感じだった。

 そこで次に「音声テキスト変換アプリ」を試してみることにした。モニタリング録音ができない代わりに,テキストで記録されて表示されるので,聞き逃した部分を文字で認識できるのではないかと思ったのである。

 一番面白いかったのがgoogleが提供する「音声文字変換&音検知通知」だった。アプリを起動するだけで何のボタンを押さなくても音声認識してテキスト化されて表示される。逆に,録音されないので聞き返しができないというデメリットがある。音声変換も完璧ではなく,誤変換が多いので聞き直ししたいのだが,それができない。ただ,録音ファイルのファイルサイズは大きいため,どんどん溜まることがない点は精神的には楽である。

 現在インストールしてあるのがNottaという音声認識,AI文字起こしというアプリである。これは,起動後,録音ボタンを押す必要がある。リアルタイムにテキストが表示されるほか,音声ファイルとしても記録されるので聞き返しもできる。ほかで録音したファイルを音声認識したり,Web会議の文字起こしもリアルタイムでできるようなので,もう少し評価してみたいと思う。

 それにしても音声テキスト変換アプリが山のように作られているのには驚いた。現時点で聴力に不安はないのだが,残念ながら手話を覚えるだけの気力が残っていない。必要になったらこういうアプリのお世話になれるかもと思っている。そのときはMRメガネで目の前の景色の中に文字が表示されるようなインタフェースが欲しくなるだろう。

 目の前にある文字を認識して読み上げてくれるアプリもgoogle Lensを筆頭に充実しつつある。今のところ,認識した文字をすべて読み上げてしまうインテリジェンスのなさが玉に瑕だが,これもAIとの組み合わせによって「今,どの文字を読み上げたら,このユーザーにとってメリットがあるか」を選択して,音声として提供してくれるインタフェースもいずれ登場してほしいと思っている。

 何度も書いているが,ネット上の膨大な情報から適当に検索して勝手に要約して何となくうまくレポート作成するような,余計なお世話の生成AIは,筆者からすれば「邪道」である。さらに,写真を勝手に加工したり,勝手な動画を作ったりするAIも,「無用な産物」だと思っている。デザイナーが,本当に意図したとおりに作画できるようになるまで,「生成AI」などと面白がって人間の文化を破壊しないでもらいたい。

 2024年のノーベル物理学賞に「AIの父」と呼ばれる2人が選ばれた。それは結構なことである。しかし,現在の生成AIは進む方向を間違えている,と筆者は思っている。現在の生成AIは人類の思考を破壊する危険性を持っていると感じる。正しい方向に進むAIを早く提示してもらいたいものだと思っているのである。