irodori-TTSの凄さ

ローカルでの音声合成が手軽にできるようになった昨今、VOICEVOXをこねくり回してましたが、どうやらirodori-TTSというものがあるらしい。
本家はかなり重たそうですが、4-bit量子化されたirodori-TTS-Liteという軽量ランタイムがあり、自分のGTX 1050 Tiで動かせるか試してみました。
メモリ量は十分ですが、Compute Capability は 6.1 (Pascal) という古いアーキテクチャなので、動くかどうかダメ元でセットアップしましたが、動きました。
音声合成そのものより、モデルのロードや前準備段階に時間がかかるので、リアルタイムな変換は実用的ではないですが、オフラインで変換する分には十分いけそうです。
で、驚いたのかその自然なイントネーション。いっさいチューニングせずとも、全然違和感がありませんでした。
試しに方言を喋らせてみたのですが、「え?すごっ!」と思うくらい自然でした。

博多弁っぽい言葉1

博多弁っぽい言葉2

博多弁っぽい言葉3

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です