「話す方が4倍速い」生産性アップに音声入力。本執筆、おかず1品、英語授業の字幕も

1日のうち、スマホやパソコンでタイピングをしている時間は、どれくらいありますか。

音声認識の精度が格段に上がったのが、この2、3年。徐々に音声認識を仕事に生かす人たちが増えている。タイピングを音声入力に置き換えると、仕事の生産性を上げられるだけでなく、会議の仕方、子どもとの接し方、学び方まで変化している。

siri1

音声入力を使うことで、生産性は格段にアップするようだ。

音声入力で誕生したヒット本

ほぼ声だけでできあがった本がある。シリコンバレー在住のシバタナオキさん(36)の著書『MBAより簡単で英語より大切な決算を読む習慣』。300ページ近い情報量で、2017年7月の予約開始直後に3万部を増刷した話題作だ。

kessanngayomerunote

ほぼ音声のみで原稿を書いた本。

シバタさんは、2016年ごろから、原稿の執筆に音声入力を導入した。著書のもととなったウェブ(note)上の連載は、1本3000〜5000字。週2本のペースで新作をアップしている。

1本の原稿は1時間ほどで仕上げる。30分でテーマを決めてデータなどを調査、30分で声でGoogle ドキュメントに原稿を“執筆”する。その後、編集を手伝ってくれているアシスタントが誤字脱字を修正して完成させていく。

シバタさんは、「土曜の夜、子どもが寝た後にしゃべりながら2本を書いているんですよ。タイピングなら、(連載が)できていた気がしないですね」と話す。

自身のnote(音声入力のすヽめ:「決算が読めるようになるノート」)の中で、日本語ワープロ検定試験やアナウンサーの話す速度のデータを比較し、「情報を出力する場合は『話す』方が『書く(タイプする)』よりも4倍以上速い」と紹介している。

会議室は不要、散歩中にミーティング

2011年にシリコンバレーで、アプリ開発社向けのマーケティングツールを提供する「SearchMan」を共同創業したシバタさん。

チャットツールやメールも、ほとんど音声入力。起床してベッドの中で、スマホから声で返信する。

レスポンスのスピードを上げると、みんなの待ち時間が減って、会社への影響が大きい。ボールが止まっている時間を短くできる」(シバタさん)

社内なら、多少の誤字脱字があっても意味は通じるし、許される。

音声入力を導入し、1年ほど前から、社内の会議も散歩をしながらするようになった。2〜4人ほどの社内会議で、ブレインストーミングのような内容なら、会社の周辺を一緒に歩いて、最後に要点だけ、音声入力でメモをしておく。

「30分も歩くと、みんな疲れるから、早く会議が終わる。時間も無駄にしない。人数も増えなくて、個人的にはお勧め。雨の時はできないし、5人も6人もいたら声が聞こえないし、歩けませんけどね」

keyboard

近い未来にキーボードはなくなる?

音声入力により、劇的に生産性が上がったというシバタさんだが、2018年の年始に、乾燥によりのどを痛めてしまった。声が枯れると、音声認識の精度は下がり、「何度も言わなきゃいけなくなって、また声が枯れ、これはやめないと」と、喉が回復するまでの3、4日やむなくタイピングに切り替えた。

それでも、シバタさんはこう話す。

「キーボードは、化石みたいなデバイスだと思います。5年もすれば、キーボードはないかもしれませんね」

音声入力でおかず一品追加

音声入力は、働くママの味方にもなる。

Facebookの広報担当、下村祐貴子さん(38)は、8歳と4歳の2児の母親。半年ほど前から音声入力を仕事に取り入れた。

毎日の起床時間は午前5時、夜中のうちにUSから届いたメールをチェックし、スマホを口元にかざして、メールの返信を始める。8、9割は正確に入力でき、誤字は後から修正する。冬場はまだ外は暗く、「部屋の明かりをつけて、パソコンの光の強いスクリーンを見たくなくって」。

音声入力をすることで、「スマホで打つのより4倍、パソコンで打つのの2倍」くらいに入力のスピードは上がった。音声入力をする前は、午前7時過ぎから朝食の準備を始めていたが、今では午前6時45分ごろから準備に取りかかれる。

そういえば、子どもに『最近卵がついてる(おかずが増えた)』と言われるようになりました。果物もむく時間ができた」(下村さん)

たった5分間だが、コーヒを飲んで一息つく時間もできた。

自宅から職場まで歩いて25分の道のりも、ヘッドセットをつけて口述でメールを返したり、Facebookのワークプレイスへの投稿をしたり。会社に到着して、あとは送信・投稿ボタンを押すだけ。これまでは出社後30分ほどはメッセージをタイピングしていたが、音声入力により時短ができた。

simomurayukiko

音声入力で時短するFacebookの下村祐貴子さん。

午後6時の帰社時は、タクシーの中で10分ほど、簡単なメールを音声で返信する。「やり残したものがない」と思える精神的な安心感が大きいという。自宅に重たいパソコンを持ち帰らずに済むだけで、子どものお迎えにも心の余裕が生まれる

帰宅後は洗濯をたたんだり、簡単な家事を並行したりしながら、また、子どもの宿題の時間に隣で「ボソボソ」と音声入力する。その姿に子どもから驚かれることもあるが、「家と違う文脈で母親が働いている姿を、子どもに見せるのもいいと思う。パソコンに向かっているだけでは、何をしているか、分からないから」と下村さんは言う。ただ、子どもがちゃちゃを入れてくると、文字は当然不正確になってしまうのだが……。

英語の授業に字幕をリアルタイムで表示

音声入力は、学びにも活用できる。

経済産業省の橋本直樹さん(31)は、留学先のアメリカの授業で、教員の講義をパソコンに音声入力している。パソコンの画面には、ほぼリアルタイムでレクチャーの内容が文字化されるため、橋本さんは英語の字幕を見ながら授業を受けている感覚だ

留学を始めた当初、英語の聞き取りに苦労し、「絶望的な気持ちに」なった。何とか授業の内容を理解しようと、音声入力を思いついた。指向性のあるマイクをアマゾンで購入し、パソコンに取り付け、教室に持ち込んだ。Googleドキュメントを起動し、音声入力をオンにすると、自動で文字起こしが始まる。

hasimotonaoki

音声認識で、授業中に英語の字幕をリアルタイムで表示する。パソコンにマイクをつけた姿は確かに目立ちそうだ。

5メートルほど離れていても音声は拾えるが、橋本さんはなるべく教室の前の方に座り、電源の確保にも気を使う。教室でディスカッションが始まったり、生徒が意見を行ったりする場合は、発言者の方向にマイクを向けて、音を拾う。

当初は、橋本さんのパソコンにマイクをつけた姿が目立ち、メカを使って授業をボイス化しているのがクール」「ファンタスティック、すごいね」とクラスの評判になった。次第に留学生の台湾人も、橋本さんの手法をまねるようになった。さらに、橋本さんがFacebookの投稿で音声入力の効果を語ると、海外留学中の同僚らから問い合わせがあり、「公務員留学生は、みんな一様に苦労しているんだ。自分だけじゃないんだ、とホッとした」という。

文字起こしの制度は「かなり正確」だという。文章をGoogle翻訳にかけてしまえば、英語読解のハードルも下がる。難点は、討論などで複数人の声が重なるときや、なまりの強い英語のときという。その場合は、文字がうまく表示されないという

橋本さんの手法は、授業の教材にも波及した。終末期医療のコミュニケーションをテーマにした授業で、患者と医師のロールプレイを録音・文字化し、医師の言葉遣いを見直す試みだ。「直樹のやってるボイスタイピングが使えるのでは?」というクラスメイトの提案で、チリ人とアメリカ人の2人と研究を始めた。

pc

将来はキーボードは不要になる?

撮影:今村拓馬

働き方改革を契機に企業も続々導入

音声認識・入力のシステムを提供する「アドバンスト・メディア」によると、コールセンターや医療機関、教育機関やマスコミなど、幅広い業種でシステムの導入が進んでいる。

コールセンターは、顧客とオペレーターのやりとりを記録し、医療機関は電子カルテを音声で入力する。マスコミは字幕の作成、自治体は議事録の文字起こしに役立てている。電子カルテ、議事録ともに、人が文字起こしをするよりも、2〜3倍速く、書類が完成する

同社のシステムを導入する医療機関は5547施設、コールセンターは183社、会議・議会の議事録用に導入する企業は93社以上、自治体は都議会をはじめ、120以上ある。教育機関では、英語の発音矯正に生かしている。発音をすると波形が表示されて、音の違いを目で見て理解する。316施設の教育機関が同社のシステムを導入済みだ。

同社の広報担当者は「音声認識のターニングポイントは、iPhoneのSiriが出た2011年。音声検索が知られ、導入が拡大した。ここ1、2年は、働き方改革で残業時間を減らすために、議事録の作成のために導入する企業・自治体が増えている」と話していた。

1日のうちに、スマホやパソコンでタイピングしている時間を思い浮かべると、膨大な時間を割いていることに気付く。もし、音声入力が社会に浸透すれば、働き方、学び方、人とのコミュニケーションが大きく変わるかもしれない。

(文、写真・木許はるみ)

Popular

あわせて読みたい

BUSINESS INSIDER JAPAN PRESS RELEASE - 取材の依頼などはこちらから送付して下さい

広告のお問い合わせ・媒体資料のお申し込み