jeyseni's diary

「ジェイセニ」と呼んでください。批判ではなく提案をするのが生き甲斐です。

AIチャットボットが続々と登場しているが,日本版ができないのが悔しくないのか

2022年11月に登場したChatGPTに続き,Microsoft社はBing,GoogleはBardがあっと言う間に発表され,中国バイドゥのERNIEBotも発表された。2023年5月には,Bardが日本語にも対応し,メディアでも「どんなことができる?」「どれがいい?」と利用することを前提とした評価が盛んに行われている。書籍もあっという間に発行されてきた。

 筆者も,生成された文章を見る機会はあったので,結果を見る限り否の打ちどころのない文章を見ることができた。他人の文章を見ている筆者としては,「誤字脱字がないな」というところに単純に驚いた。かつてのgoogle翻訳で酷い訳を見てきたのとは,隔世の感がした。

 ちょうど,AI人工知能の展示会が東京で開かれているようで,AIを使った画像処理など,本来使った方がいい分野も含めて200もの展示がされている。しかし,AIチャットボット,ないしテキスト生成AIについては,日本からのプレゼンテーションはないようである。

 中国のバイドゥが,不完全ながらもChatGPTの発表後すぐに自前のAIチャットボットを発表したのに,日本はいまだに何の音沙汰もない。ただ先行を許した各社のAIを使っているだけである。

 NTTはどうしたのか。ソフトバンクはどうしたのか。NEC東芝富士通パナソニックソニー,そして日本IBMはどこに行ってしまったのだろうか。ただ指をくわえて見ているだけなのだろうか。

 前から書いているように,筆者は生成AIには否定的である。創造するのは人間の仕事だからである。かつて,会社の仕事の整理のために「キーワード」を設定し,これを検索し,五十音順に並べて整理する「キーワード・インデックス」作りを担当していた。今で言う「#ハッシュタグ」である。1年分の仕事を整理し,キーワードごとに並べ替えて表示することで,必要な情報を取り出しやすくする。仕事にどのようなキーワードを付けるかは,最適な言葉を選ぶのもノウハウの一つだった。

 その後,コンピュータの能力向上によって「フリーターム検索」つまり全文検索が可能になった。こうすると,同じ言葉が何度も文章の中に出てくる場合,「ゴミ」情報が何十倍にも増えてくる。現在のgoogle検索でも,1つの言葉で数万件の情報がヒットするのと同じである。これを絞り込むのも大変だし,正しい情報にたどり着くのも結構大変なのだが,そこに人間の判断が加わるからよかったのである。

 ChatGPTでは1つの答え,Bardでは3つの答えを出してくるが,あまりにも情報を絞り込み過ぎて,人間が判断する出番がない。これでは,雑学クイズ番組で正解を当てるのと違いはない。

 AIを画像認識,特に監視業務に適用すべきだと筆者は書いた。監視カメラにこそAIで不審者検出機能を - jeyseni's diary (hatenablog.com) 2023/5/7。それよりも,AIチャットボットでも,ChatGPTやBing,Bardを越える,より日本らしいシステムを作れないものか。

 おそらく,これまで出たAIチャットボットで「俳句」「和歌」を作らせたら,5-7-5,5-7-5-7-7の文字数の句をあっと言う間に100句も作り出すだろう。しかし,俳句や和歌には「字余り」などのイレギュラーなルールが許されている。その字余りで「味を出す」ことはできないだろう。テレビで人の俳句を切り刻んで解説する師匠が監修した俳句生成AIでも作ってみればどうだろうか。

 それにしても,メディア関連の人間はあまりにも腰が軽すぎるのではないか。