テクノロジー

AIの音声が人間を超える!聞き取りやすさの秘密はノイズにあった

SiriやGoogleアシスタント、初音ミクなどのボカロなど「ん!?この声、人間じゃないな!」と感じる機会も増えて来ましたよね。スマホやAIスピーカーだけではなく、人工音声を利用したサービスはどんどん開発され、誰でも使えるようになり、その敷居は下がりつつあります。

わたし(タルミホ)は、起きたらまずラジオをつけて1日をスタートするんですが、その日も早起きしてラジオを聞いていると・・・

AI

おはようございます。AIアナウンサーです。

タルミホ
おお!?この声、人間じゃないな!

AI(人工知能)がアナウンサーしてるのね〜!さっそく人工音声との遭遇です!

山本さん

おはようございます、山本学です。

ななっ!しかも人間(男性)とのコラボ!おもしろい!しっかり耳をすませて聞いてみましょう。
↓↓↓実際のAIアナウンサーの音声↓↓↓

タルミホ
なるほど、AI(人工知能)の音声は、思ったより聞きとりやすい。すごいなぁ、ここまでできる時代になっているとは。

AI(人工知能)の音声の後に、人間である山本さんの声を聞いていると・・・噛まずにスムーズに読み上げるAI(人工知能)より、山本さんの方が「間」があったりするのに聞きとりやすいことに気が付きました。

タルミホ
なぜなんだろう。
タルミホ

なぜ「間」がある不完全な方が聞きやすいんだろう?

タルミホ
これはもう!AIZINEの力を使って、直接山本さんに聞きに行っちゃおう。

ということで今回は、無駄がないAI(人工知能)音声のおしゃべりより、無駄のある山本さんの方が聞きとりやすいと感じたのはなぜか!?(ディスってるわけではありませんw)

その謎解きと、ますます発展するであろうAI(人工知能)音声の未来を、山本さんと楽しく予想してきました。

いざ!神戸をいつも盛り上げているラジオ局「Kiss FM KOBE」さんへ

今回インタビューに向かったのは、神戸のみなさまに愛されている「Kiss FM KOBE」という海の近くにあるラジオ局。もちろん神戸っ子のわたしは、いつも聞いてるのでテンション上がります!!

そして、お答えくださったのはAIアナウンサーと掛け合いながら、一緒に番組出演されているKiss FM KOBE「神戸経済ニュースウィークリー」の山本学さんです。

タルミホ
番組聞きましたよ〜。
タルミホ
すごいですよね!AI(人工知能)がラジオアナウンサーになっていて驚きました。
山本さん

聞いてくださったんですね〜、ありがとうございます。

タルミホ
はい!早速なんですが、どうしてAI(人工知能)の音声を使おうと思われたのですか?
山本さん

そうですね、働き方改革が目的ですね。

タルミホ
ほほう、最近よく聞く働き方改革ですね。
山本さん

はい。アナウンサーと番組を作るには、関係者はスタジオに張り付いて、長時間に渡り拘束されてしまうんですが、アナウンサーがいない時間にも効率的に番組を作る方法を考えました。

タルミホ
そうなんですね。番組作りって大変そうですもんね。やはり効果は出ているのですか?
山本さん

はい。このニュース番組は時間も場所も選ばず、PCがあれば編集でき、アナウンスを間違えてもすぐに取り直しができます。

山本さん

アナウンサーの場合だと、またアナウンサーを呼び出して、スタジオを抑えて・・・とすぐにはできないので、効率よく時間を使えていますね。

タルミホ
なるほど〜!いつでもどこでも作れて、AIアナウンサーと番組をしている意味がしっかり成立していますよね。
タルミホ

ちなみに、他のDJやスタッフからAI(人工知能)起用に反対意見はなかったんですか?

山本さん

それがみんな拒否反応もなく、面白い!といってくれました。

タルミホ
おおお、さすがクリエイターな方々!面白いことに貪欲ですねw

AI(人工知能)による音声読み上げサービス「Amazon Polly」の魅力

Amazon Polly(アマゾンポリー)とは高度なディープラーニング技術を使用し、テキストを読み上げるサービスで、24言語、48の音声パターンの人間の声のような音声を、低コストでの合成を実現しています。

タルミホ
Kiss FM KOBEさんではAmazon Pollyを使われていますが、選ばれた理由は何ですか。
山本さん

そうですね、やはり使いやすさです。音声の調整機能など、まだまだ未完成な部分はありますが、今後使用者が増えればどんどん改良されていくと思います。

タルミホ
なるほど、今後に期待ですね!ところで、Amazon Pollyには男性の声もありますが、起用の予定はあるんですか?
山本さん

もちろん、男性も使いたいですし、英語、中国語、韓国語など多言語で使っていきたいですね。緊急放送などで使っていくのがすごく役に立ちそうなんですよ。

タルミホ
たしかに!緊急放送で様々な言語で話せるアナウンサーを揃えるのは大変そうですもんね。
山本さん

地震や台風の被害が起きた時などは、観光客にも何が起きているか素早く伝えたいですよね。現代では即時性というか、すぐに答えが出ることを求められているので。

タルミホ
確かに今はスマホですぐに情報が得られる時代ですし、スピード対応って大切ですよね。
山本さん

AI(人工知能)の最大のメリットは、僕と違って噛まない、疲れない、声が変わらないw 緊急時もずーーっとアナウンスを続けることができますからね。

タルミホ
確かに疲れ知らずですよね〜!w

タルミホ
ちなみに、現在AI(人工知能)による音声を利用していて大変な部分などはありますか?
山本さん

やはり、くぎりをどこで入れるかが大変ですね。それによって読み上げ方に変化が出るんです。

タルミホ
ということは、テキスト入力時の(、)や(スペース)(改行)で、聞き取りやすくなるよう工夫されているんですね。
山本さん

日本語は英語より難しくて、なめらかさを出すのに苦労します・・・微妙な言葉の上げ下げなどがAmazon Pollyはできないので、そのまま入力すると違和感になるんですよ。

山本さん

社内でも、AI(人工知能)の音声は気持ち悪い!という意見もあったんですよ。

タルミホ
へぇー、そうなんですね。辛いですね・・・w
タルミホ
その分、今後どんどん改善されていくAIアナウンサーに注目ということですね!

そろそろ本題へ!AIの音声と人間の声の聞き取りやすさの違いはノイズにあった!

タルミホ
今回お伺いしたかったことの1つなんですが。
山本さん

はい、なんでしょう?

タルミホ
実際に番組を聞いていると、山本さんは「えー」「まぁー」とか間があったり、つまったりしますよね。
山本さん

・・・

タルミホ
ディスってませんよ!汗

山本さん

・・・

タルミホ
つまりですね!人工音声は詰まらずスムーズに話していてスッと聞けるのに、山本さんの声より頭に入ってきにくい印象を受けたんです。何でなのかなって考えていまして・・・
山本さん

ふむ、なるほど!そうなんですよね、僕もAIアナウンサーと共演して気づいたんですが、実は人の息を吸う瞬間の音や、リップノイズがないと、人間の頭に残りにくいんです。

タルミホ
ははぁ・・・!たしかに人間のおしゃべりには、息を吸う音や、唇の触れる音、いろんなノイズがありますもんね。
山本さん

ですよね。つまり、息を吸った瞬間に話題が変わることを、人は無意識に察知するので集中するんですね。

山本さん

そういう人間のもつ独特の「間」に、人の耳は慣れているんですよ。

タルミホ
なるほど〜、すごく納得しました!ノイズにこそ人間の良さがあるんですねー
山本さん

実はあえてその人間のノイズを残すように編集しているんですよ。

タルミホ
え!そうなんですか!だから山本さんの良い感じの「間」が際立っているんですね!謎がとけました〜!スッキリ・・・。
山本さん

・・・

タルミホ
ちなみに、山本さんとAIアナウンサーの掛け合いはどうやって作られているんですか?
山本さん

プロデューサーと私が話しているのを収録して、そのあとプロデューサーの部分をAI(人工知能)の音声に置き換えているんです。

タルミホ
え!?それってひと手間もふた手間もかかっていますねw むしろ面倒なのでは!?
山本さん

それでもAI(人工知能)音声とのコラボにこだわりたかったんですよw

タルミホ
そうなんですね〜w

AI(人工知能)による音声の未来はどうなっていくか予想してみた!

せっかくAI(人工知能)を使っているのだから、名前をつけたり、年齢や性格などキャラ設定をして、DJとして全面に出しちゃうの良いのでは!?と勝手に考えていたので、その辺も聞いて見ましょう。

タルミホ
人間のように、AIアナウンサーに名前をつけたりキャラ付けなどは考えておられないんですか?
山本さん

はい。AIにセクシー系のキャラ付けして起用する会社も多いようですが、むしろ機械は機械らしいほうが面白いと思うんですよね。

タルミホ
え!意外です!その心は!?
山本さん

機械らしくあるメリットは、AI(人工知能)だとわかることで、人間と違うと感じた時の気持ち悪さや違和感を抑えられることですね。

タルミホ
あー!だから番組の最初に、AIアナウンサーですと名乗っているんですね。
山本さん

ずばりそうです。

山本さん

でも、これからは人間側の耳がAI(人工知能)の音声になれてくる可能性が高いと考えています。

タルミホ
つまり、わたしたちが日常で人工音声を聞く機会が増えると。
山本さん

そうですね、人工音声に違和感を感じなくなっていくんじゃないでしょうか。

タルミホ
あー、たしかに身の回りでも確実に増えてますもんね。
山本さん

そうなんですよ。AIスピーカーに今朝のニュース教えてと話しかけて、人工音声で聞く。そんな時代がもう来ていますからね。

タルミホ
うんうん、ニュースは人工音声で聞くもんだってなる日も近いかもしれませんね。
山本さん

それまでは世の中の様子をみながら送り出しますが、みなさんの耳の方が変わっていくと予想できるので、AIアナウンサーが人間らしくなる必要はないでしょう。

タルミホ
なるほど!人間は良くも悪くもすぐ慣れますもんねw
山本さん

きっと人間か機械か判別できないレベルまでAI(人工知能)音声進化すると思います。それは人間の声が一番良いというのではなく、その方がわかりやすいからだと思います。だから人間に近づいている。

タルミホ
なるほど。
山本さん

でも、もし人間が話すより「わかりやすい話し方」があるならそれになっていくでしょうね。

タルミホ
AI(人工知能)の音声の進化が気になっていたんですが、自分の耳が変わっていく未来もめっちゃ楽しみになってきました。
タルミホ
今日は本当にありがとうございました。

まとめ

今回は「無駄がないAI(人工知能)の音声」と、「無駄がある人間の声」その聞き取りやすさの違いについて、Kiss FM KOBEの山本さんと謎解きをしました!

  • 人が息を吸う瞬間の音や、唇のふれる音などリップノイズがないと、話が人間の頭に残りにくい。
  • 息を吸った瞬間に話題が変わることを、人は無意識に察知するので集中できる。

また、AI(人工知能)の音声の未来がどうなっていくかの予想も興味深かったですよね。

  • AI(人工知能)の音声は人間と判別つかないくらいに進化する。
  • 人間の耳がAI(人工知能)の音声に慣れて、違和感を感じなくなる。

何気なく耳にしたラジオ番組から、AI(人工音声)音声と人間の声の違いや、人間を超える未来を感じさせる貴重なお話を聞けました。

まさかまさか、聞き取りやすさの秘密がリップノイズにあったなんて・・・一瞬で判断を下す人間の五感って本当に面白いですよね。AI(人工知能)の進化だけではなく、自身の対応力の変化にも注目して、AI(人工知能)との日常を楽しんでいきたいですよね。

神戸密着型の市民に愛され系ラジオ局、Kiss FM KOBEさん

今回お応えくださった山本さんが、AIアナウンサーと出演されているのは、Kiss FM KOBEにて毎週土曜 AM7:00から放送中の「神戸経済ニュースウィークリー」です。

朝早くてちょっと・・・という方は、ラジオアプリ「radiko」のいつでも好きな時間に番組を聞ける「タイムフリー」機能がおすすめです!

そんな「タイムフリー」にぴったりな、10分間でちょい聞きできる「10BLOCKS」という番組が人気急上昇中。そんな斬新かつおもしろい番組にチャレンジされている、魅力的なKiss FM KOBEさんですが、リアルにスタッフ募集中とのこと。ぜひ、サイトも覗いてみてください!

わたしも応募しちゃおうかな♡