左右で違う音声データの作成方法。ffmpegで作ってみた。

本サイトはアフィリエイト広告を利用しています。
Bluetooth LE

左右で違う音声データを作成してみました。

左はドイツ語、右は英語みたいな2chの音声データを作成しています。

ffmpegで作成した内容を紹介します。

 

スポンサーリンク

左右で違う音声データの作成方法。ffmpegで作ってみた。

左右で違う音声データを作成してみました。

左はドイツ語、右は英語みたいな2chの音声データを作成しています。

ffmpegで作成した内容を紹介します。

 

Google Cloudのtext to speech

これはテストで使った音声データです。

Google Cloudのtext to speechのサービスを使って音声を生成しています。

英語、ドイツ語、中国語、スペイン語を各出力しています

Text-to-Speech AI: Lifelike Speech Synthesis | Google Cloud
Turn text into natural-sounding speech in 220+ voices across 40+ languages and variants with an API powered by Google’s ...

 

文章を多言語で音声出力

下記のNordicのICである、nRF5340の冒頭の文章を音声にしています。

BLE Audioのデバッグで使いたく、今回作成してみました。

nRF5340 - Nordic Semiconductor
nRF5340 - Dual-core Bluetooth 5.4 SoC supporting Bluetooth Low Energy, Bluetooth mesh, NFC, Thread and Zigbee

 

データは公開済

作成した音声データは下記GitHubで公開済です。

実際に確認してみたい方はダウンロードをお願いします。

Sonic-Sprint/src/audio-data at main · iotengineer22/Sonic-Sprint
This repository present solution for the Sonic Sprint - iotengineer22/Sonic-Sprint

 

 

ffmpegでの合成例

ffmpegを使い、2ch言語の音声、または4ch言語の音声に合成しています。

合成例のコマンドです。英語とドイツ語を2chの音声にしました。

2ch言語の合成例
ffmpeg -i nRF5340_en.wav -i nRF5340_ge.wav -filter_complex "[0:a]pan=mono|c0=c0[left];[1:a]pan=mono|c0=c0[right];[left][right]amerge=inputs=2[a]" -map "[a]" nRF5340_en_ge.wav

 

デモ

実際に英語とドイツ語を2chの音声をスピーカテストした動画です。

 

まとめ

左右で違う音声データを作成してみました。

左はドイツ語、右は英語みたいな2chの音声データを作成しています。

ffmpegで作成した内容を紹介しました

 

 

コメント