シニアにとって、デジタルの垣根がどんどん低くなる。音声の文字起こしがAIで加速。

東京新聞の6月9日の記事で、「東芝がオンライン授業の音声を人工知能(AI)で即座に字幕化し配信するシステムを開発したと発表した」と報じていました。「慶応大や法政大で6月中に実証実験を始める予定で、1年~1年半後をめどに一般利用できるようにするという」と、まだまだ時間がかかるようですが、いますぐ使えるアプリがあります。

Vrew という、人工知能を活用した動画編集プログラムを利用すれば、音声認識を通じてテキストに変換された動画から、文字だけを文書にコピーすることができます。Vrewアプリ→https://vrew.voyagerx.com/ja/

今朝、YouTube動画を観ていてこれを発見しました。→【無料】YouTube動画に自動でテロップを入れる神動画編集アプリ  https://youtu.be/L7Og53GRFew

いやー凄いレベルです、AIの進化の恩恵で一気に。ホントに驚きました!ボクは、文字起こしが仕事で必要でしたので今までもいろいろとトライしてきたのです。

(1)2019年前半までは、 iPhoneアプリで録音したものを、人に依頼して文字起こしをしてもらしか実用性はなかったのです。クラウドワークスに頼むと、専門の人がいて(文字起こしを仕事にしてきた経験者)1時間分で2万円くらいの相場で支払っていました。

(2)2019年後半になると、YouTubeに音声動画をアップロードして、YouTubeの機能のひとつである「翻訳」を使い、編集画面に自動的に貼り出される文字をコピーするのが、最も精度の高い方法でした。精度としては、65%くらいでしたが、インタビューの内容をテキストにするのに使用していました。

このVrewの精度は、85%から90%レベルだと感じています。みなさんが、講演会や学びの場で(もちろん許可を得て)iPhoneで撮影したビデオを(録画の長さによりますが)その場で、1〜3分で画面に字幕を付けてくれるのです。帰りの電車で、音声はoffにしてiPhone画面の文字を読みながら復習ができます。

ボクは今週の土曜日から主催するスピーチ教室で、早速受講生にアプリをダウンロードしてもらって活用することをお勧めでます。

この記事を書いた人

荒井 好一(Yoshikazu Arai)

荒井 好一(Yoshikazu Arai)

会社員38年・定年後フリーランス10年、好きな仕事で歩いてこれた。

45歳の春から東京単身赴任をスタートさせて、退職後もデュアルライフを楽しむ。異なる文化の街暮らしと移動空間で企画をするのが大好きで、2017年は実に新幹線乗車105回で仕事を楽しんだ。

スピーチのコーチ、法人代表、時々ビジネス書の著者、ブロガーに挑戦中。