- 歌声合成ソフト『 CeVIO Creative Studio 』 Part.5
445 :名無しサンプリング@48kHz[sage]:2019/04/19(金) 17:15:30.88 ID:vnD22eye - >>443
今回のワンコーラス聞いて率直に技術が未完成だと感じたのか? CDでエフェクトかけてない出音を聴けばはっきりするが、記事を読んだ感じではAIが作れる現状の上限品質が これであって今年出しうる技術水準では実質の完成品だと思うのだが。 処理高速化と歌唱力向上の実証をしなければならないし、さらに人間が調整するパラメータやらUI、製品化に 必要な諸々の機能を実装する段階ではないだろう。 あと根本的に権利関係の問題をクリアできるのかどうかすら分からないな。リアルすぎて問題が出るというやつだ。
|
- 歌声合成ソフト『 CeVIO Creative Studio 』 Part.5
448 :名無しサンプリング@48kHz[sage]:2019/04/19(金) 20:06:20.29 ID:vnD22eye - >>446
数時間の素材で「上手い歌唱」を学習するという研究目的は、SCOPEと関係ない自分のような一般人には二の次、 「鼻声ノイズが少ない」「音素が明確に聞き取れる」「人間らしい声色を持っている」ことが自分には大事なんだな。 で第三者が「まだ難もあるけどこんだけ生っぽく歌ったよすごいよ」とやってくれるのは純粋にありがたいのよ。 というのもボカロは今まで長年突き詰めてみても、どれについても自分の理想に遠いし(良くなってきたけど声色がね…) 音声・歌声合成界隈の現状水準を踏まえてのSCOPEの意義は理解できる一方で、現行ささらは既知の中の人と技術で 製品化して実績があることから母体のCeVIOプロジェクトと、SCOPEの研究を同じレールに乗せるのか?が気になってる。 まず研究を成功させるのが最優先なのは当然なので、学習素材を厳選して、歌にうるさい専門家の評価に耐えうる精度を 出すように持っていくだろうし、CeVIOプロジェクトで新ささら・新IAをリリースするためには、大人気になってる中の人や 所属会社にお願いして新しい素材で高品質に仕上げなきゃファンががっかりするから、コストがかかって大変に違いない。 さしあたり製品化するなら研究時に厳選した素材、別人のボイスで出してくる可能性もありそうだ。 要するに、昔の素材でとりあえず学習して仕上がったAIささら・IAの声が聴けるのは、テクノスピーチのサンプル以外では このCDだけになるかもしれない。ならば自分はささらに需要があるからこれは記念で買っておきますよと。
|
- 歌声合成ソフト『 CeVIO Creative Studio 』 Part.5
450 :名無しサンプリング@48kHz[sage]:2019/04/19(金) 20:37:45.91 ID:vnD22eye - CDじゃなく配信だとしてもオリジナル曲として世界初のはずなんだけどな。
りんなの実力も、オリジナルをアカペラで歌ってもらわないと分からんのだよ。
|
- 歌声合成ソフト『 CeVIO Creative Studio 』 Part.5
453 :名無しサンプリング@48kHz[sage]:2019/04/19(金) 21:46:48.93 ID:vnD22eye - >>451
人間の歌唱の上手さってSCOPEで明確に定義されてるのかな? 楽譜どおり歌うという言葉があるが、ボカロの時代から「それは厳密には違う」って言われてる部分。 声量やリズムはともかくとして、ピッチは揺らぐのが人間らしい歌唱だし、V5で追加されたスタイルって作り手が 明示的に指図しない限りは楽譜上は「無い方がいい」表現要素の塊。 ハスキーとかファルセットとか巻き舌気味にとか色々あるけど失敗すると聞き取りにくいだけなんよね。 それはともかく、現行ささらのベタ打ちが上手だなと思ったのは最初だけで実際は割とピッチヨレヨレなので、 AIささらがよほどブレブレでもなけりゃ現行より手間がかかるってことはなさそうに思う。 発声自体はたぶんおおむね良好だろうし、音素タイミングも1ティック単位の調整をAIに求めても仕方ない。 こだわり作業は人間に残してくれてかまわない。でないとリアル歌手の仕事がなくなりそうだ。 ともかく早くユーザーに使わせてくれ、性能向上は金取ってアプデすればいいから、とCeVIOプロジェクトに言いたい。 今キックスタートでビジネスに持ち込めばきっと成功すると思うんだが…3年も待ちたくないぞ。
|
- 歌声合成ソフト『 CeVIO Creative Studio 』 Part.5
454 :名無しサンプリング@48kHz[sage]:2019/04/19(金) 21:54:13.27 ID:vnD22eye - >>452
ビッグデータの歌声DBって悪い言い方をすると「無個性な集合体」になるのかな。誰かが細かくアノテーションするのかもしれないけど。 ささらやハルオロイドが無個性だったら拍子抜けだし、やはりボイスキャラクターを重視してもらいたいので学習素材は厳選してほしいな。 バックコーラスなら専用の音源も出ているので欲しいのは声が際立つリードボーカルなんだよ。
|