jeyseni's diary

「ジェイセニ」と呼んでください。批判ではなく提案をするのが生き甲斐です。

Eメールに限界を感じる--どこでもメールが使えない

新型コロナウイルスの世界的蔓延で、筆者は2020年2月から自主テレワーク生活を送り、2022年4月にようやく解除した。非常に快適なテレワーク生活だった。

 SDGsを考えると、東京近辺で1年を過ごすよりも、夏は例えば軽井沢、冬は沖縄でリモート仕事ができると理想だな、と考えるようになった。実現そのものは、予算上はかなり難しいのだが・・・。

 さて、このテレワーク生活を通じて、筆者はパソコンと通信環境があればどこでも出版社の今の自分の仕事ができることが分かり、Zoomがあれば遠方の執筆者との打ち合わせも問題なくできることも証明できた。

 かつてはSkypeで同じことができるなと思っていたのだが、Skypeをインストールしている相手は当時はほとんどなかった。わざわざインストールしていただくこともできなかった。また、ノートパソコンにWebカメラが内蔵されてもいなかったし、デスクトップパソコンでもWebカメラを接続している人はほとんどいなかった。今は、すべてのノートパソコン、タブレットWebカメラが搭載されている。隔世の感がある。

 ところが、このテレワーク環境において思わぬ障害が起きている。それがEメールである。

 どこでも仕事をしようとすると、いちばん使い勝手がいいのがWebメールである。中でも複数のメールアドレスを使えるGmailにはお世話になっている。Webブラウザーがあればどこでもつながる。たとえばインターネットカフェでもメールのやり取りはできるし、スマホWebブラウザーでもやり取りができる(Gmailは、スマホに標準でGmail用のメールソフトが入っているので、さらに便利である)。

 ところが、一般企業や学校などがその所属メンバーに提供しているメールシステムは、一般にメールソフトでなければ読むことができない。Webブラウザーで読むことができない。メールソフトをインストールできないネットカフェでは、企業メールでは仕事はできない。

 これを解決する方法として、会社で受信したメールをGmailなどのWebメールのアカウントに転送してもらうという方法がある。この場合、会社に転送を申請し、認められた人しか転送してもらえない。企業の秘密情報、取引情報が外部に漏れる可能性があり、コンプライアンスの問題が生じるからである。転送設定を許可される際、会社と約束を書面で取り交わす必要もある。

 この方法のもう1つの問題は、受信した内容を読むことはできても、返信や新規送信ができない。Webメールで送信すると、メールアドレスが「@gmail.com」「@yahoo.co.jp」などのWebメールになってしまうからである。

 これを解決する方法として、2つ考えられる。1つは、企業が「Google Workspace」契約をして、会社のドメインのメールが使えるようにすることである。Gmail用メールソフトで会社のメールのやり取りができる。これは企業側がGoogleと契約してくれないと実現しない。

 もう1つの方法は、「別のメールアドレスやエイリアスからメールを送信する」という機能を利用することである。WebブラウザーでGmailアカウントを設定し、そこに「外部メールアドレスを設定する」のである。企業のメールサーバーがファイアウォールの中にある場合は、この設定は一般には使えないが、プロバイダーのメールサーバーを使ってドメイン設定している場合は、使うことができる。筆者の場合も、この設定でしばらく問題なく使えてきたし、今でも9割以上のメールのやり取りは問題なくできている。

 この方法は一種の「なりすまし」である。Gmailのアカウントでやり取りしながら、会社のカスタムメールアドレスを上に被せて送信している。相手には、会社のメールアドレスが見えている。これに返信する場合も、会社のメールアドレスが表示されるので、Gmailに送っているようには見えない。

 ところが、メールサーバー側でこのような使い方を不正使用としてSpamメール扱いに設定するケースが増えてきた。企業側としては、怪しげなメールをブロックするのは当然の対応なのだが、いちおう真面目なやり取り用に使っている筆者としては、厄介なブロック設定である。特に、大学のメールサーバー側でのセキュリティー設定がここのところ急に厳しくなっているようである。メールに外部URLを追加しただけで弾かれることも増えている。

 ノートパソコンを常に持ち歩けば、そこにメールソフトを入れて使えばいい。またスマホのメールソフトで設定すればいい。しかし、結局は企業のドメインメールを社外で使うのは限界がある。

 しかも、IMAPのメールサーバーならメールをダウンロードしなくてもサーバーに残しておけるが、POP3のメールサーバーはすべてのメールをダウンロードしなければならない。複数個所でメールを読むと、それぞれにメールデータがダウンロードされるほか、間違って設定をすると最初に読んだ段階でサーバーのメールが消去されてしまって、ほかの個所で読めなくなってしまう可能性もある。

 時代はクラウドサーバーである。各企業がローカルにメールサーバーを設定するのはセキュリティー上必要なことかもしれないが、テレワークには極めて使い勝手が悪い。

 1つは、企業がクラウドサーバーで運用する道を選ぶことである。上記のGoogle Workspaceが1つの案であり、もう1つが、表計算で盛んにコマーシャルを打っているサイボウズなどの「グループウエア」を活用する方法である。

 もう1つは、正当なリモートアクセスで運用することである。リモートアクセスの仕組みはすでに提供されており、勝手に使うことができる時代になっている リモートアクセスが熱い--AndroidもChromeOSもファイルメーカー搭載をあきらめて代替策で凌ぐことを決意 - jeyseni's diary 2022/5/6。しかし、企業がこの仕組みを勝手に許していては、情報漏洩のリスクがある。ここでは、VPNというセキュリティーを確保したネットワーク接続環境を社員に提供して、社内のパソコンを外から操作する、という方法を提供すべきだろう。これも、企業のコンプライアンスからすれば有料のシステムを契約する必要があるだろう。

 いずれにしても、企業側がテレワークに理解がなければ実現しない。情報に対する投資をしない企業は、いずれ取り残されるだろう。一方で、情報も社員も囲い込まなければ、情報漏洩のリスクを回避できない。テレワークをさせて、直接目の届くところで管理できないことを良しと思わない経営者であれば、テレワークに積極的に取り組むことは期待できない。

 企業が、形式的なオフィスを持たず、グループウエアを介してバーチャルなグループワークで運営できるとすれば、そこではメールのやり取りではなく、チャットソフトで意見交換できるような環境が提供できると面白い。かつてのチャットソフトは、今で言えばSNSである。現在のSNSは世界全体を1つのグループとしているが、企業限定でSNSを運用すれば、それはグループウエアである。

 今度はそういう世界を考えてみたいと思っている。

リモートアクセスが熱い--AndroidもChromeOSもファイルメーカー搭載をあきらめて代替策で凌ぐことを決意

筆者のファイルメーカー愛は半端ではない ファイルメーカー「命」 - jeyseni's diary 2021/1/23。このブログでファイルメーカーで検索していただくと、いろいろな挑戦をしていることをご理解いただけると思う。

 筆者にとって最大の悩みが、ファイルメーカーWindowsMacにしか基本的に提供されないことである。現在、実験を進めているChrome OSも、基本的にLinuxなので、ファイルメーカーは動かない。

 ファイルメーカーには、インスタントWeb公開という機能がある。1台のマシンでデータベースを動かし、ここにWebブラウザーでアクセスする。一覧表示も個別表示も、元のデータベースで設定した形をほぼそのまま使える。ひとつづきのLANの中なら自由につなぐことができるし、ファイルメーカーデータベースを公開できるWebサーバーがあれば外部からでも接続できる。まあ、Webサーバーをどうするか、その費用は、という問題があるので、個人ではなかなか難しい。WebDirectという機能も追加になったが、これもさらに設定が大変である。

 そこでもう、ほかのプラットフォームでの開発はあきらめることにした。代わりに、複数の端末間をリモートアクセスでつなぐことにした。

 かつて、Macの世界ではApple Remote Access(ARA)というリモートアクセスが標準で提供されていた。同じLAN内でのサーバーの操作や、社外から自分のMacにアクセスするなどが本当に簡単にできた。その後、Windowsでも提供されたが、こちらはユーザー登録やら各種ネットワークの設定などがあり、なかなかつなぐことができなかった。

 現在では、サードパーティー製のリモートアクセスソフトを使っている。最初に使い始めたのがTeamViewerで、これは画期的に接続が簡単だった。そのうち管理が厳しくなったため、現在はAnyDeskというソフトを主に使っている。

 ただ、自宅のタブレットが古くなって、インストールができなくなっていた。そこで、ブラウザーベースで簡単につながるChrome Remote Desktopも設定した。Chrome OS用にも同じ仕組みを導入した。

 現在自宅では、2階にある筆者の勉強部屋でWindows 11のマウスコンピュータのノートPCを置いてある。これを1階のリビングに持ってきてももちろん使えるのだが、1階で仕事をするときはChrome OS flexを入れたASUSの元Windows 10ノートPCを持ち込んでいる。メールも基本的にWebブラウザーで動かしているので、ファイルの確認やメールのやり取りなどは、Chrome OS flexで十分できている。ただ、WordやExcelなどOfficeでの仕事や、Adobe系の仕事はマウスコンピュータでしかできないので、2階で作業をするか、もしくはリビングにマウスコンピュータを持ち込むか、あるいはChrome OS flex機でChrome Remote Desktopでマウスコンピュータをリモートで動かして、作業ができることが確認されている。

 さすがに、オフィスで仕事をする場合は、ファイルメーカーのデータごとUSBメモリーにコピーしてローカルで仕事をしている。USBメモリーのサイズは現在128GBである。過去のデータも持ち歩いているため、ほぼ満杯状態である。差分コピーをするのにも10分はかかるが、リモートでマシンが不具合を起こした際に復旧は難しいので、ここはそれぞれローカルで同じ環境で動かしている。

 基本的に、データベースはデータが1個所にあることが前提である。自宅の場合、仕事部屋で動かした状態でオペレーターが移動できることも利便性が高い。Chrome OS flexを入れたASUSマシンも10.5インチ画面で、それほど問題ないので、この環境でファイルメーカーを使うことにした。

 あとは、Officeのように、クラウドファイルメーカーが動くようにしてくれれば、利用したいと思う。

擬人化はわかりやすいが、誤解も招く--「はたらく細胞(BLACK)」を見てメタバースへの懸念をさらに深めた件

はたらく細胞」シリーズが評判と聞いている。身体のさまざまな機能を擬人化してコミック化してわかりやすく解説している。最初のシリーズでは、ケガをしたときに血小板が集まって出血を止める仕組みを、可愛い女の子たちが集まって手をつないでかさぶたを作る様子が表現されていて、なるほどと思っていた。

 赤血球は酸素を運ぶ力仕事をするから男子という設定で、バイキンと闘う白血球やマクロファージが刀を振り回す女子という設定になったところですでに無理があるように感じていたが、白血球の働きとして菌を身体に取り込んで分解する貪食機能を表現するあたりで、これはもう擬人化の限界ではないかと感じていた。

 今回見たシリーズでは、赤血球のリフレッシュをする肝臓を、歌舞伎町を思わせる夜の繁華街で描き、「スッキリ」させるといったキーワードで思わせぶりに話が展開した。肝細胞をバーの女性に擬人化。最後には、寿命を迎えた赤血球をマクロファージが貪食するという設定になっていた。次の話では、生殖細胞の働きも擬人化した表現になるようで、もう頭が拒否している。

 初回シリーズの成功で浮足立って、作者は理性を失ってしまったと言えなくもない。男女に分けたのも、残念ながら失敗だった。さらに現実の仕事の中でも裏舞台の世界を使ってしまっている。ウエットな世界をウエットな設定で展開するから、実際以上に生々しくなってしまったと思われる。

 正直、近頃のコミックやアニメは、かつての男性週刊誌のマンガレベルにまで発想が落ちていると感じる。コンピューターを使ってキャラクターを3Dモデル化して自由な視点で表現している。コマとコマの補間もコンピュータ化されている。シューティングゲームの感覚になっている。表現のウエット化も、かつてのエロマンガレベルである。

 子供たちに大人気だった「鬼滅の刃」や「呪術廻戦」も、時代を侍社会にシフトさせることで現実から逃避して責任逃れしているように思える。こちらは、男同士が戦い、か弱い女子を助ける、という設定も、ステレオタイプである。

 これだけ、セクシャルハラスメントが時代に合わないと言われている中で、このようなコミックやアニメが流行ること自体、やはり日本がいかに意識として遅れているかを証明しているのではないか。

 アニメの世界でも実写の世界でも、男女が入れ替わるような設定があり、ことさら男女差を強調するストーリーがなぜ受けるのかが不思議である。作画技術が優れているからといって、ストーリーをいい加減にしてはならないと思うのである。

 そういう意味では、筆者の愛読(愛視聴)している「名探偵コナン」もすでに時代遅れなストーリーが延々を繰り返されていて、情けなくなる(筆者は、謎解きの部分だけを楽しんでいる)。

 コミック、アニメの世界というのは、すでに「メタバース」である。読者、視聴者は、主人公に自分を当てはめてアニメの世界に入り込んでいる。

 スマホを使い始める年齢が中学1年生がピークで、そこから小学生にどんどん広まっている。1日の使用時間が8時間などというのも普通になりつつある。SNSの世界も、個人を特定できない仮想空間である。ゲームでつぎ込むお金も、リアルの世界ではありえないような仮想通貨が普通に使われている。

 これらの状況をまったく意識せずに入り込めるのがメタバースだとすると、すでに子供たちはメタバースに入り込んでいると言っていいだろう。アバターというのもいわば擬人化である。

 これからどういう世界になるのだろうか。筆者としては,明るい未来が見えてこない。「表現の自由」を勝手な解釈をしては,残虐な面を持つ子供と同レベルで脳の働きが停まった異常な状態と思われるのだが,「異常」の解釈が都合のいいようにどんどん拡大解釈化されている。これに釘を刺せるのは,自主規制力のある大手メディアしかないと思われるのだが,その大手メディアがすでに方向性を間違えて暴走している今,だれがどうコントロールできるのか,まったく分からない。

 メタバースを目指しているMeta(元Facebook)のマーク・ザッカーバーグも,twitterを買収したイーロン・マスクも,本当に理性を持っているのか,筆者には理解不能な存在である。良心を持ち合わせて理性で制御してくれることを祈るしかないのだろうか。

レインコートを考えた件--雨が嫌いなので

筆者は雨が嫌いである。雨が降ると気分が落ち込むということではなく,ただ濡れるのが嫌なのである。

 傘もどんどん大型化して現在は70cmというのを愛用している。さすがにこれ以上のサイズのものを使用するとすれ違うときに傘が確実にぶつかるので遠慮している。それでも濡れてしまう。傘をさす角度や身体からの距離などをいろいろ試すのだが,背中のデイパックや膝から下が必ずといっていいほど濡れてしまうのである。

 最近はようやく,息子がクルマで送り迎えをしてくれるようになり,気を利かせてくれることも増えたが,いちおうカバンには非常用のレインコートとバッグカバーを入れてある。ゲリラ豪雨が頻繁に起きた時期に準備したものだが,そういえばその後,ゲリラ豪雨をほとんど聞かなくなった。あれは何だったのだろうか。現在は線状降水帯がもっぱらである。

 先日,傘を持たずに出かけた娘に傘を持って駅に行った。レインコートを着て自転車で行ったのだが,厄介な現象に2つ遭遇した。1つは,レインコートのフードが風にあおられて脱げてしまうこと,もう1つはレインズボンの防水が効かなかったことである。

 レインコートもいろいろと探しているのだが,納得のいくものは少ない。上着だけのレインコートは,街でも着られるようなオシャレなものか非常用のビニール製の携帯レインコートぐらい。あるいはポンチョ型で頭から被るタイプのものが多い。

 一方,上下セットのレインコートは雨の中の作業用に1つほしいのだが,これもいろいろありすぎてピンと来ない。台風や大雨の際の家周りの点検や整理作業の際に必要と考えている。多くは上着の丈が腰ぐらいまでなので,ズボンと組み合わせて使うことが前提となっている。筆者の場合,上着だけで使いたいことが多く,これを兼用できるレインコートを探しているというわけである。

 また,とにかく濡れたくないので性能的にも防水性は絶対にほしい。単なる撥水加工では強い雨だと染み込んでくる。かといってビニール製だと耐久性に問題があるのは経験済みである。いざ使おうとすると使い物にならなかったりするからである。

 現在使っているのは,DIYショップで購入した上着タイプのレインコートである。色は紺で,形はビジネスコート風のスッキリしたものである。裏にゴム引きがしてあり,耐水性は抜群。前ボタンも二重になっており,よほどの台風でもないかぎり雨の侵入は防げそうである。フードも同様に裏のゴム引きがあり,頭も濡れない。雨のときのイヌの散歩時に主に使用していて,問題は感じていなかった。

 しかし,自転車に乗って困ったのが,フードの問題と,同様の性能を持ったズボンがないことである。

 フードも紐を引けばいいのだが,それだと顔が濡れてしまう。レインバイザーを買うという手もあるようだが,常に自転車を使うこともないので,買うことはないと考える。またズボンも別途購入すればいいのだが,これも一時的な使用なので迷っているところである。いちおう,非常用のビニールのズボンは持っているのだが,現在どこにしまい込んだのか行方不明である。

 そろそろクルマも寿命が来ているが,次に購入する余裕もない。電動自転車はあるので,これをもう少し利用したり,さらに低速モビリティーなども検討しなければならないのかもしれないが,いずれにしてもレインコートは必要かもしれない。探索の旅は続く(しかし,低速モビリティーや1人用電動自動車,キャノピーなどに,屋根があってもドアがオプションだったり,ビニールのペラペラだったりで,雨や冬場を想定していないのがいつも不思議である。手軽に格好良く乗れる低速モビリティーを老人に安く提供してもらいたいものである,と密かに考えている)。

音声のテキスト化で2つの方法--リアルタイムならGoogle Documents,キャプチャ後ならVrewで字幕化が便利そう

音声のテキスト化(音声認識,自動字幕)で遅れを取っていることを報告した 音声認識から翻訳,そして字幕入りの動画制作環境にすっかり取り残されてしまっていた件 - jeyseni's diary (hatenablog.com) 2022/5/3。とりあえず,2つの方法について整理しておくことにする。

 たとえばZoom会議の流れを,主催者が録画したファイルがあるとする。これをテキスト起こしして議事録に仕上げようとした場合は,自動字幕化ソフトのVrewが良さそうである。これまで,手で要点をメモっていたのだが,書き取ったキーワードがだれの発言だったか,結構迷うことがある。○○さんがコメントしたな,と思っていても,実は違ったりする。画像ファイルをVrewで開いて自動字幕にすると,そのコメントを発言した話者がだれか,すぐに分かる。Vrewは,字幕部分を一気にテキストとして出力もできるので,テキストエディタやWordなどで整理するのも簡単だろうと思われる。

 一方,リアルタイムに音声をテキストファイル化したい場合は,Google DocumentsとGoogle音声認識を使ってパソコンから流れる音声をテキスト化するのが便利そうである。Google Documentsにはツールメニューの中に「音声認識」が用意されている。パソコンのローカルのテキストエディタやWordなどを使ってもいいが,IME音声認識に変更しなければならない。Google Documentsならその必要がない。

 1つだけ設定変更するのが,システムの設定の「サウンドの設定」において,「録音」タブの「ステレオミキサー」を「既定のデバイス」に指定することである。通常の音声認識がマイクロフォンからの入力を拾うのに対し,ステレオミキサーにするとパソコン内の音を入力として使うことができる。Youtubeで再生した音声も,このステレオミキサー経由でGoogle 音声認識でテキスト化できる。ただし,zoom会議中はマイク入力を既定のデバイスにしておかないと,自分の声が会議につながらなくなるので,注意が必要である。聞きっぱなしのオンライン授業や,Webセミナーなどは,この方法でテキスト化すると,メモを取らなくても良さそうである。

 また,英語での講演なら,Google翻訳の画面でリアルタイムに英語のテキスト化と日本語同時翻訳を設定すると,理解が一気にできる。ただし,Google翻訳は1回に5000字しか受け付けないので,早口な人だと10分ごとぐらいに内容を保存して入力ボックスを空にしないと次が取り込めなくなる。録画・録音も同時にしておいて,後でテキスト起こし処理をする構えも必要である。

 英語は嫌いではないが,ネイティブでもバイリンガルでもないので,頭で考えながら聞くのはそれなりに負担になる。かつて,普通の英文を単語ごとに逐語訳変換する方法を考えて,翻訳用の突き合わせ辞書で置き換える仕組みを考えたことがあったが,時間がかかるばかりで結果は惨憺たるものだった。パソコン用の複数の翻訳ソフトも試してみたが,どれもまともな日本語を出したものはなかった。初期のGoogle翻訳で軽くそのレベルを越え,その後のパターン認識方式,さらに現在のAI方式に進化して,十分意味のある日本語訳が提供されるようになったと思う。

 これにGoogleの同時翻訳とVrewの自動字幕が加わり,新しい段階に入ったと感じている。正直,テープ起こし業や同時通訳業は厳しい時代になったと思われるし,音声合成まで入れればアナウンサー業も安泰ではなくなった。さらにAI技術を駆使したディープ・フェイクの画像,音声,動画が広がりつつある。詐欺に対抗する音声技術の開発も必要になるのかもしれない。

音声認識から翻訳,そして字幕入りの動画制作環境にすっかり取り残されてしまっていた件

筆者は,いまだにキーボードでポチポチと文章を入力するのが仕事である。ただ記者時代のような執筆の仕事はなくなったので,他人の原稿をメディアにとって正しいスタイルの文章に修正して,市場に送り出すまでの編集業務に携わっている。ある意味,定型的な仕事,単純な仕事なので,なるべくコンピューターに仕事をさせ,自分は楽をする方法を日々考えている。

 かつて,セミナーの企画・運営の仕事をしていたとき,特に海外からの講演者の講演を日本の視聴者にいかに伝えるかについては,いろいろ悩んできた。英語の聞き取りには比較的自信はあったが,専門用語をまくし立てる講演者の話に付いていくのは並大抵ではなかった。同時通訳を手配し,インカムで日本語で聞いてもらう手配もしたが,その場でチェックしても話者の内容の1/3ぐらいをすっ飛ばして訳していることもあり,不満だった。それなりに高い通訳料を払っているのにも関わらずの結果だったからである。

 講演をまとめて1本の記事にするにあたっては,すべて録音し,このテープ起こしを外注し,上がってきた日本語テキストを編集する,という流れも多かったが,外注では数日かかることと,やはり専門用語の聞き取りと翻訳にミスが目立つことが多かった。

 結局,本数が少ないときは,自分で録音テープを聞いて英語の文章を起こし,これを頭で翻訳しながら日本語の文章にする,という作業をしていた。テープの同じ個所を何度も何度も聞き返し,プレゼン資料と見比べながら専門用語を認識する,という作業はやはり苦痛だった。夜中まで使ってテープ起こしに丸1日かかることも珍しくなかったが,出来上がった英語の原文を見れば,あとはストーリーを日本語化するのは問題なかった。

 英語の講演の同時通訳をコンピューターで行うことを考えたのは言うまでもない。しかし20年前は,不特定話者の音声認識ができる仕組みがなかった。話者本人の声で複数の文章を読んでもらい,それをベースにコンピューターが音声認識する,という特定話者音声認識という仕組みしかなかった。それも精度は著しく悪かった。結局,講演者以外の人間が講演者の発言と同じことをオウム返しでマイクに対して話し,これをコンピューターが音声認識する,という方法の方が精度は高まるが,それでも100%完璧ではなかった。

 音声認識は,英語の場合は単語単位で分離できるので,欧米の方が進んでいた。日本でも,大学やコンピューターメーカー,カーメーカーなどがこぞって日本語音声認識の研究をしたが,たとえばカーナビとか,議会の議事録とか,特定用途では何とか実務に堪えられたが,一般向けにはほとんど使えなかった。筆者も,パソコンレベルでマウス操作レベルのコマンドを音声コントロールすることや,数字の入力などは実現していたが,とても普通の会話を聞き取るような使い方はできなかった。

 その後,2010年にGoogleが音声による日本語を含むマルチ言語の入力インタフェースを開発した。不特定話者の会話をリアルタイムで漢字かな混じり変換していく様子には,度肝を抜かれた。スマホでもこの音声入力は使える。テレビのスピーカーの前にスマホを置いてニュースを流せば,ニュースで読み上げた文章がテキストとして取得できる,という実験も行った。日本以外の言葉も,韓国語でも中国語でも,何でもほぼ読み取れた。

 2020年を越えた現在,話はさらに進歩している。1つは,Google翻訳においてリアルタイムで同時翻訳が実現できていることである。Google翻訳は画面の左右の2つのボックスがあり,左側の原文入力をGoogle音声入力としてマイクからの音を入れ,右側の翻訳枠を例えば日本語に設定すると,話者が英語で話した内容が原文ボックスに音声認識されてテキストで表示されるのとほぼ同時に,右のボックスに翻訳された内容が表示される。しかも,最初は聞き取りミスがあった部分でも,しばらくすると前後関係から類推して正しい単語に置き換え,その置き換えに基づいてさらに訳文も修正される,という様子が見える。かつてシステム構築を見積もったら1000万円と言われたことが,眼の前のパソコン上で簡単に実現しているのである。

 もう1つが,動画の自動字幕入れ機能である。Google音声入力によって,講演のテキスト化と翻訳はできたが,これを動画の字幕として画面に組み込もうとすると,高額な映像編集システムを使うという大変な作業になっていた。映像と音声を聞きながら,それにタイミングを合わせてテキストをはめ込んでいくという作業は,基本的に手作業だった。そもそも動画を扱えるソフトがプロ用しかなく,したがってそのソフトが動くコンピューターも大容量のメモリーと大容量のハードディスクと高速処理ができるCPUを搭載したとんでもない仕組みが必要だった。いわばテレビ局並みの装備が必要だった。手持ちのパソコンでも時間をかければできないことではなかったが,編集に半日,データの合体出力に夜中いっぱい,などということも珍しくなかった。まったく非効率的な仕事で自分で試したのは1,2回ぐらいで,あとはプロに任せざるをえなかった。

 カラオケの映像を作るソフトで,何秒から何秒までこのテキストを表示する,といういわゆる字幕フォーマットを作って読み込ませればできないこともなかったが,そもそもこの「何秒から何秒まで」を一覧表で用意するのが実に面倒だった。

 これがいとも簡単にできるのを知ったのが,つい1週間ぐらい前の話である。

 まず,Youtube。再生時に「字幕をオン・オフ」する機能があることを知った。さらに,自分で作成した動画をYoutubeにアップロードして字幕作成を指定すると,勝手に字幕を付けてくれることを知ったのである。さすがにすぐに付けてくれるわけではなく,英語や日本語の場合,30分ぐらいのファイルだとアップして1時間後ぐらいには字幕機能が使えて表示できるようになった。まずこれには驚いた。

 このYoutubeの自動字幕作成機能が,いつ字幕が出来上がるのかが残念ながら予想ができない。中国語の音声でも字幕が作れるはずなのだが,3分ぐらいの動画ファイルでも丸1日経っても字幕は現れなかった。そこで,ソフトやWebサービスで代わりの機能を探したところ,「Vrew」というソフトが動画からテキストを文字変換して字幕として自動的に画面に入れてくれるのを知ったのである。Vrewについては,また別稿でご紹介したいと思っている。

 筆者はYoutuberになる気もないし,人様にお見せできるような動画を提供できるとも思っていない。Youtubeは,テレビドラマをときどき見たりするだけで,特にソフトの使い方の紹介動画や料理の紹介動画などは基本的に見ないようにしていた。見始めると何十分も時間がかかるし,不必要な情報も多いと思っているからである。文章と写真にこだわっているのも,そのためである。そのさまざまな紹介動画に,テロップが入ったり,大きな文字が入ったりして,画像加工にずいぶん時間がかかっているなと思っていた。しかしこの2つの方法で字幕を入れる作業は,あとの文字修正をするだけでほとんど手間がかからない。しかもスマホだけでも簡単に無料で動画編集・作成ができるアプリがどんどん作られている。なるほど,動画制作の環境がこれほど劇的に変わっているのかと,改めて思い知らされた。すっかり取り残されたなと思った次第である。

 ちょうど大型連休に入り,いろいろな動画・音声素材で字幕入れや翻訳などのテストをし始めたところである。まあ,筆者の続報を見なくても,検索で「自動字幕」でさまざまな情報が出てくる。というのは,釈迦に説法かもしれない。

Google Earthにリアルタイム更新の期待

知床半島の観光船沈没事故での初動捜索が遅かったのではないかと指摘した 緊急時の高解像画像衛星やスカイホークの利用はできなかったものか--観光船沈没事故 - jeyseni's diary (hatenablog.com) 2022/4/27。

   民間の人工衛星会社によるウクライナ侵攻状況の映像も見た。事故連絡から早い段階で、半島周辺の映像の提供を依頼できなかったのかとも考えた。その他の災害時にも利用できるのではないだろうか。

   もっと身近なGoogle Map 、Google Earth を見て驚いた。知床半島周辺を航行する船舶の姿や航跡がはっきり写っている。

Google Mapでの航空写真の例


取得の時間は古いものもあるが、何らかの分析の対象になりそうである。

   Google 社に緊急時に情報提供してもらえるような交渉をするのが、まず第一かもしれない。ミサイル発射についても、何らかの情報が早く入手できるかもしれない。

   マスコミ用語としては使用不可なのだかが、この際使わせていただくと、日本はあらゆる危機に対して゛目くら゛同然であると言いたい。かつて、富士山レーダーが日本の気象予報の画期的な目になって以来、国難に対する目がまったくないと言っていいのではないだろうか。

   今朝のニュースで、G7の中で日本は「平和主義」という表現をしていた。平和主義って、どういうことを言おうとしているのだろうか。丸腰で「争いはやめよう」と言うだけでは、話し合いをしようとしない相手にとっては、単なるカモでしかない。それを見守る目(レーダー、人工衛星)もなければ、見ていても見殺しにするだけの政府では、国民を守る意思はない、と判断せざるをえない。

   軍備を放棄するのはいいとして、それならば、「他国にないほどの完璧な自衛手段」を構築するべきではないか。少なくとも、目の機能の圧倒的な強化は必要である。夜道を歩く時の防犯カメラや防犯ブザーが必要である。ただし、犯罪が起きてからの防犯カメラではほとんど意味がない。常に監視してリアルタイムに対応できるような仕組みまで進める必要があるだろう。