なにそれ
これを見ましょう
Clarity Vxとかいう声をAIで抽出するVSTをmy new gear...して優勝した pic.twitter.com/JTM7LNY7RJ
— 清太郎 (@ArchivE_NcaxaR) 2022年6月6日
音声から人の声をAI君の力で抽出してくれます すごいね
一般的な音MADでも素材抽出に使えそう
実践
VSTの紹介にかこつけて動画を宣伝!
これと比較すると違いが分かりやすいです
REAPERなどのDAWソフト上で動作させます
下の短所の部分でも言ってますが、小さい声に弱いのでGCompなどで素材の音量を均一化してから載せるとうまいこと反応してくれます
除去度?ダイヤル?は高くて80%程度に留めています 100%でもいいんですか?
車内放送の場合、NEURAL NETWORKはBroad 2のほうが適している気がします
車内チャイムなどには使えないので、別のトラックに避難させましょう
この画像の場合ではトラック2にClarity Vxとアナウンス素材を設置して、トラック1に声以外の音声(3点チャイム)を避難、Voice De-noiseを載せた
長所
他のブログがさんざん褒めちぎっているのでそれを見てください
ひとつ言えるのは、Voice De-noise*1よりも圧倒的に性能がいいです
弱点
守備範囲が人の声限定
これは自明ですが、人の声以外は全てカットされます
音楽やチャイムに被ったノイズを除去するとかはできません
「さ行」に弱い
たぶんAI君がノイズと勘違いしちゃうんじゃないかな
基本的に「s」の発音は小さいので、ノイズと一緒に刈り取られることがまれによくあります
判定が粗い(?)
誤検知なのかクセが強いのか、残したい音まで刈り取られて音声が不自然に小さくなったり、音質がこもっておかしくなったりすることがあります
深層学習の教えはどうなってんだ教えは
でもお高いんでしょう?
Yahoo!ショッピングなら3960円です(6月6日現在)
金取んのかよ!? くそったれ!
上のリンクをクリックすると私にアフィリエイト報酬が入りません 安心してください
私は1500円引きクーポンで2460円で購入しました
*1:数年前に無料で配布してましたね 私も持ってます