【音MAD】メロディーの被った宇佐の駅名連呼をボーカル抽出の技術を用いて救出する実験

はじめに
使ったサイト・ソフトウェア
- 【追記】
- spleeterの補足「Error: Missing argument 'FILES...' ってなんぞ」
実験結果

はじめに

みんな大好き宇佐駅

f:id:ArchivE_NcaxaR_9:20210706203002j:plain

ここでは当駅独自の到着放送（駅名連呼）が流れるんですが、

電車が到着する時にメロディーが流れるようになってからは、残念ながらほぼ100％到着放送に被るようになってしまいました

f:id:ArchivE_NcaxaR_9:20210706203236j:plain

こちらがその音声

自分はとりあえず、このメロディーがバリバリ被った音声を下車素材として無理やり使っていたのですが、

ある日某ブログで、セリフにBGMが被った音源からセリフのみを抽出することができるという技術を知ってしまいました

下車じゃない音MAD向けの技術だとは思いますが、

『これいけんじゃね？』

どうせならキレイな素材を使いたいということで早速、宇佐の駅名連呼の抽出に挑戦

使ったサイト・ソフトウェア

【追記】

最近精度がもっといいソフトウェアがあることを知りました　Ultimate Vocal Removerっていうんですが

相当なマシンパワーがいるみたいです

PCスペックの低い人は下の方法でいいんじゃないかな　知らんけど

作例

spleeter単体で出力した例

どちらが、“上”かな？　もちろん、上だよね？

今回利用したのはVocalRemoverというサイトと、Spleeterというソフトウェア

前者はオンライン上のツールで、音声素材をドラッグ・アンド・ドロップでぶち込むだけで簡単にBGMとボーカルを分離してくれます

※出力された音声は両端がだいぶカットされているみたいなので、音声の前後には長めにブランクを作ってあげるといいと思います

後者はpythonというプログラミング言語で書かれていて、Windows PowerShell上で動かすソフトウェアのため導入と慣れるのに手間がかかりますが、精度はかなりいい模様

使い方は他のブログさんが丁寧に解説してくれているので、「spleeter ボーカル抽出」とかググってみてください

一方の抽出ツールだけではうまく抽出できてない部分もあったりするので、

2種類のツールで抽出したものから、それぞれ状態のいいほうのパーツを選んで貼り合わせる作戦

↓あとボーカル抽出はこのサイトもオススメ↓

spleeterの補足「Error: Missing argument 'FILES...' ってなんぞ」

「spleeterの導入後、いざ抽出しようとしたらこんなエラーが出たよ」って人向けの補足

spleeterの解説をしている多くのサイトでは、コマンドーを

spleeter separate -i [音声ファイルのパス] -o [出力先のフォルダのパス] -p spleeter:[2/4/5]stems

と解説していますが、

どうやらアップデートで仕様が変わったみたいで、「-i」が使用不可能になった模様　たぶんこれが原因

spleeterのバージョンが新しい場合、正しいコマンドは

spleeter separate -p spleeter:[2/4/5]stems [音声ファイルのパス] -o [出力先のフォルダのパス]

になります。

これ解説してるとこが少ないのでこの記事で補足しておきます

実験結果

もう一度、こちらが今回解剖する到着放送

実際にこれ使って下車作ってみると分かりますが、このままでは素材としてマジで使いづらいです

ちなみにspleeterの方は、今回は4stemsで実行

そして完成したのがこちら

成功しました　よかったね

若干メロディーが残っていて声も少し削られていますが、音MADの素材としての使用には十分堪えると思います

声に対してBGMの音量が大きいとしんどくなりそう

みんなもやってみよう

九州のごみすてば

あああああ