質問箱の方で、面白いご質問を頂いておりました〜!
以前私もCoeFont(コエフォント)というサービスを試したことがありますが、今の音声合成ソフトやAIによる吹き替えなどの技術って本当にすごいですよね…!
ChatGPTなど見ていてもそうですけど、最近のAI技術の進んでいくスピードって本当に速いと思います。
情報追いかけるのに必死だぜ…
今回はとっても個人的にですが、
声優の仕事はAIに奪われるのか?ということを考えてみたいと思います〜!
こういうこと考えるのって楽しいよね〜〜
もくじ
AIの得意は「音として読むこと」「日本語を理解させること」
すでに音声合成技術で作られているナレーション、つまり人間が読んでいないナレーションは結構使われていたりします。
例えば電車の駅構内でのアナウンス。これは最近よく人間じゃないナレーションを聞きますね〜
バス車内のアナウンスも割と多いです。
私が聞いてAIだって分かるので、やっぱり生の人間とは差があるってことだけどね〜
あとは、読み上げ系って自然と使ってますけど、昔からあるものですよね。
ゆっくり解説とか、ニコニコのコメント読み上げとか。
こういう読みは「日本語として理解できる」「説明すること」が目的とされているナレーションになります。
そこに抑揚などが付いている意味があまりないので、こういう仕事は早々にAIに代わられてしまって、人間がやる必要性がなくなる仕事かなぁと思っています。
特に最近、低単価で募集されいてる仕事によく見る、説明を目的とした動画のナレーションはすぐになくなる気がします。
音声合成ソフトが得意としているのはやはり「打ち込まれた文章を音として発音すること」です。
ですが、日本語というのは文字と文字の読み上げのスピードを微妙に変えてニュアンスをつけたり、音の高低によって意味が変わったりする言葉があったりします。
また文章だと、どこでブレス(息継ぎ)をとるのか、ということで意味合いが変わったりすることもあります。
こういうのは人間が喋りながら無意識に入れているエッセンスなので、どうにも音声合成ソフトで入れ込むのは難しいようです。
AIの不得意は「安心感を出す」「抑揚のあるもの」「掛け合い芝居」
よくロボットが人間に近づくと現れる不気味の谷現象というのがありますが、
音声コンテンツでもそれはあるように思っていて、
綺麗に発音して完璧でありすぎるからこそ、不気味に感じる、不安を感じるというのはあると思うんですよね。
不気味の谷現象の例は?
不気味の谷とは、人間の心理現象の一つで、ロボットなどの人工物の造形を人間の姿に近づけていくと、かなり似てきた段階で急激に強い違和感や嫌悪感が惹起される現象のこと。
IT用語辞典より引用
なので、「人間が読んでくれるからこそ安心感を感じるもの」というのはしばらくはなくならないかなと思っています。
例えば医療系のナレーションなんかはそうかなと思います。
人間らしいことで安心して聴けるナレーションってやっぱりありますよね。
あとは掛け合い芝居。
アニメや吹き替えなども、アフレコ時は同じスタジオに共演者が集まって、相手のお芝居をそこで初めて聞いて、それに合わせて自分の芝居がイメージしていたものとは違うものに変わっていく、ということがよくあります。
これはAIや音声合成ソフトではまだ追い付いていない部分かなと思います。
ただ、感情も結局データとして数値化することができるはずなので、それがクリアできればいつかはAIに奪われる仕事かもしれません笑
最近の音声合成ソフトをいじっている感じだと「まだ大丈夫そう」という感じですが、
いかんせん本当にAI界隈のスピードが速いので、どうなるかはわからないですね〜
数年でかなり変わってしまいそう。
現状では、AIの得意不得意があるので、得意な部分はAIに奪われる仕事があると思うし、
不得意なところは声優がまだまだ必要なシーンがありそう、って感じかな〜と思っています。
有名声優の声の機械学習
ユーザーが打ち込んだテキストから画像やイラストを生成してくれるサービスとしていち早くリリースされたのがMidjourneyでしたが、
AI絵に関してはネット上に上がっている絵を機械学習して作られているもので、
つまり、そのネット上に上がっているイラストの著作権は作者である絵師さんに帰属するはずなのに…っていう問題が話題になっていました。
絵師さんの中にはAI絵に強い拒否反応を示している方もいらっしゃいます。
ここはAIの躍進に対して法整備が追い付いていない感じだよね…
これの声優版も全然あり得るよなぁとは思います。
ネット上に落ちている音声っていっぱいあるので、それを機械学習してくれて、指示を出すと理想的な声(あるいは特定の声優さんの声で)喋ってくれる。
そして権利的な話でまた揉め揉めする…笑
逆に有名声優さんにある程度まとまった金額を提示して、機械学習させてもらっちゃう、みたいなことも起こりそうです。
有名声優さんはアフレコの必要がなくなり、自分の声が使われるたびに少しロイヤリティが発生する、みたいな感じにすれば働かなくてもお金が入ってくるようになっちゃいます。
CoeFontとかはまさにそういう仕組みだし、
もっと技術が追いつけばコンテンツにも使えそうだしな…?
これは結構現実的にあり得そうだな〜と思ってます。
でもそうすると、すでに名前が売れている声優はさらに稼げるようになり、
新人の露出できる機会は著しく減ってしまうでしょうね〜
もちろん私は演じる仕事を一生続けたいと思っているので、こんなことを妄想しながらも、「生き残るには…」をめっちゃ考えてますよ笑
プロンプターや監修の仕事は新しく増えるかもしれない
海外ではすでにAIプロンプターという職業が出てきているそうです。
つまり、企業などのクライアント側の意向を汲んで、正しくAIに指示出しをする、というお仕事ですね。
あと、現場で音声合成ソフトを試しに使ってみたというスタッフさんが、
結局今の技術だと、ブレスの位置や音の高低、強弱みたいな細かいニュアンスを後から修正する必要があって、
むしろ音声合成ソフトに読んでもらうよりも人間に読んでもらった方が早いんですよねw
っておっしゃってました。
この溝は徐々に縮まっていくとは思うので、音声合成ソフトが生成した音声コンテンツを監修する、という仕事ももしかしたら生まれるかもしれません。
AIが生成したものでちょっと違和感があるところを修正させたり、
あるいは、「今こうなってるけど、こういう風に読むとこう聞こえるので、作りたいものに近いと思いますがどうですか?」という提案をクライアントにするようなお仕事。
今イラスト業界だと、イラストのベースをAIに描いてもらって、それをもとにちょっと自分で手を加える、みたいな方が結構いらっしゃいますよね。
でもこれってイラストを描ける人だからできることだと思います。
イラストを全然描けない人がAI絵を修正することはできない訳です。
多分音声合成ソフトも同じで、声優やナレーターなど、読みのプロが監修することによって、コンテンツがよりブラッシュアップされて完成形に近づくのかなと思います。
今までも技術革新によって失われてきた職業があるけど、
それによって生まれた新しい仕事もたくさんあったと思うんですよね。
あまり悲観的にならず、新しい技術を楽しんで使っていって、
その中で、「じゃぁ自分だったら何が出来るかな、どういうものが今後求められていくのかな」っていうのを考えていけたらいいな〜と思います!
新しいものは大好きなので、未来が楽しみっ
読んでくれてありがとうございました!
ではっ
やっほい!声優ブロガーの幸田夢波です!