jeyseni's diary

「ジェイセニ」と呼んでください。批判ではなく提案をするのが生き甲斐です。

2台のスマホがあれば,電車内で声を出さずに電話ができるかも【追記】1台でも意外に簡単にできた

特殊詐欺に対応する「AIトークボット」が欲しい--その前にボタンを押して電話に自動的に答えるアプリが欲しい - jeyseni's diary (hatenablog.com) 2023/5/17 のコメントの中で,電車の中でボタンを押せば返事が相手に流れる仕組みが欲しい,と書いた。いろいろ検索をしてみるのだが,音声合成アプリまではあるものの,それはテキストをスピーカーでは再生できるが,電話の相手に聞かせることはできないようだ,というところまでは,その後確認した。なんとその中で,自分の声を合成するサービスも見つけてしまった。以前,高島ちさ子さんの声を作ってしまうフェイク音声の話題を紹介した(フェイク画像・フェイク音声を作るAIなんて,もはや人新世(アントロポシーン)の終わり--AI新世の到来か - jeyseni's diary (hatenablog.com) 2022/3/19)が,それがもはや自分で作れてしまう。最初の登録段階でのクオリティは低いが,覚えさせる言葉を増やせばどんどん改善できるようである。ネット上で作成されるので,悪用される危険もないとは限らない。アカウントを取り消したが少し不安が残る。

 さて,音声合成してスピーカーから流すことはできることは確認できた。するとその音声信号はイヤホンジャックから取り出せる。この音声信号を,もう1台のスマホに付けたマイクつきイヤホンのマイクの回路から入力すれば,電話の相手に合成した音声が聞こえるのではないだろうか。

 イヤホンの出力レベルと,マイクの入力レベルは電圧が異なると思われるので,少し電気的な工作の必要がある。スマホ用のマイク付きイヤホンだと加工は少し難しいので,ヘッドセットを分解して使ってみるといいかもしれない。

 さらに,この仕組みを使うと,音声合成はパソコンで行うことで,あらかじめ登録した文章だけでなく,その場で返答ができるような仕組みも作れそうである。

 これを書いた段階ではまだ構想段階なので,いずれ実験してみたいと考えている。

【追記】意外な方法で,実現できそうである。方法としては,マイク付きの有線イヤホンをそのまま使う。電話の受信の際に,マイク付きイヤホンをジャックに差し込んでいることが条件である。

 一般に,マイク付き有線イヤホンはステレオである。一方(たとえば右耳用)のケーブルの途中にマイク付きのボリュームが取り付けてある。

 電話が入った際,マイクの付いていない左耳にはイヤホンを入れたまま,右耳のイヤホンを外す。そしてこの右耳用イヤホンをマイクの小孔の上に重ねる。

 そして,テキスト読み上げアプリを立ち上げる。予め,複数の文章を登録しておき,相手の言葉によって文章を選択し,読み上げされる。するとこの音声は,イヤホンから再生されるので,その再生音をマイクで拾うことにより,相手に音声が伝わる,という仕組みである。

 とりあえず,ボイス録音アプリで録音できるかどうかを確認したところ,うまく録音できた。ボイス録音アプリを動作させながらテキスト読み上げアプリも動作させている。ボイス録音アプリの代わりに電話アプリを動作させていれば,同じことが実現できると思われる。

 イヤホンからの音声なので,外部にはほとんど漏れない。イヤホンに付いているマイクは結構優秀なので,十分拾うことができそうである。

 次回は,実際に電話アプリで試してみようと思っている。