機械学習でボイチェンして平沢唯ちゃんになりたい!|セキュリティごった煮ブログ

ネットエージェント
セキュリティごった煮ブログ

 コース:あっさり

機械学習でボイチェンして平沢唯ちゃんになりたい!

セキュ松

あけましておめでとうございます!
なぜか気分はハッピーニューイヤー、どうもセキュ松です。

改元が重なり、10連休となったGWが終わりましたが、皆さんは何をしていましたか?

聖地巡礼のために海外旅行。
声優さんのイベントをハシゴ。
などなど、有意義な休みを過ごされましたでしょうか?

私は引きこもってアニメを見ていた派です。

令和最初のごった煮ブログの記事ですが、平成を代表する作品の話をしたいと思います。
オタクである皆さんは 「けいおん!」という作品をもちろんご存知ですよね?

girls_band

この記事ではけいおん! 12話『軽音!』 の話しかしません。
そのため、未視聴のオタクはBDやDVDを買うか、
4月4日よりTBS/BS-TBSで始まっているアンコール放送を見ましょう!

さて、けいおん! 12話『軽音!』 と言えば、
学生バンド(放課後ティータイム)のボーカルを務める平沢唯ちゃんが学園祭直前に風邪を引いてしまい、てんやわんやする話ですが......
やはり、平沢唯ちゃんの変装をして声真似をする 平沢憂ちゃんが印象的ですよね!
妹ならではの見た目と声のそっくりさに、最初はバンドのメンバーである 田井中律ちゃんあずにゃんも騙されていました。

学園祭当日は復調した唯ちゃんによる「ふでぺん~ボールペン~」や「ふわふわ時間」が熱唱され、
「この講堂が、私達の武道館です」
という名言まで飛び出たわけですが......

考察をしまくるタイプのオタクとしては、
もし、あのまま風邪が治らなかったら、本当に憂ちゃんが代打で歌っていたのではないか????
と思ってしまうわけです。

顔が重視されるスクールアイドルではなく、学生バンドなので、
声が似ていれば妹が出ても観客はきっと同じテンションで盛り上がれるはず!

むしろ......
平沢唯ちゃんの声が出せるのであれば......

誰でも
放課後ティータイムの
一員に
なれるのでは!?

つい、が入ってしまい、前置きが長くなりましたが本題です。
巷で噂のDeep Learningの力を借りて平沢唯ちゃんになってみましょう。

今回はCycleGANを用いてやっていきます。
深層学習とかを使ってボイスチェンジャー作るリポジトリ
を大変参考にさせていただきました。

豊崎愛生さんの声が脳内で思い出せないという方は、こちらを確認してください。
豊崎愛生/ぼくを探して(Short Ver.) - YouTube

まず、汚いセキュ松の音声と、天使のような平沢唯ちゃんの中の人(豊崎愛生さん)の声を用意します。
それぞれの声で、学習用に1時間30分程度の音声ファイルと、プレビュー用に20秒程度の音声ファイルを用意します。

その後、AWS SageMakerの力を借りて学習させてみた結果がこちらです。

セキュ松の声(matsu_org)
セキュ松の声を豊崎愛生さんの声に変換したもの(matsu_toToyo)

いかがでしょうか......?

放課後ティータイムのメンバーを騙せるような精度には至っていないですが、
微かに何を言っているかは聞き取れるような気がします。
(スピーカーではなくイヤホンで聞くと、聞き取りやすくなるかもしれません。)

学習回数が足りていなかったのか、前処理が微妙だったのか、学習用のデータが微妙だったのかは定かではないですが......
良い成果が出た際には、またブログで記事が書けるはず......です!

今回、全くセキュリティと関係ないように思える話でしたが、
下記の記事のように、深層学習によって作成された識別器を欺く研究が存在しています。
Fooling Neural Networks in the Physical World with 3D Adversarial Objects

今後、精巧なボイスチェンジャーが出てくれば、今までになかったソーシャルハックや、
偽物か本物かを判断するのがとても難しいオレオレ詐欺などが行われるかもしれませんね!

それでは!

※「けいおん!」は株式会社芳文社の登録済み商標です。
  (登録番号 第5351261号)

メルマガ読者募集 採用情報 2020年卒向けインターンシップ

月別