あらゆる種類の言語モデルがコンテンツ作成に提供するアプリケーションと可能性は、実際には非常に広範です。一般的な ChatGPT でさえ、いわゆるクリエイティブブロック。
SunoAI は、歌詞と適切なプロンプトに基づいて独自の曲を作成するツールで、音楽ファンの間でも非常に人気があります。このツールで生み出される創造性には制限がないように見えることがありますが、これは特にそのような実験を恐れない人にとっては非常に素晴らしいことです。
そんな人たちのために、今回はNVIDIAが開発した新しいツールが誕生した。フガットとは?どのような可能性があるのでしょうか?
音作りツール「Fugatto」
ふがっと(英語より) 基本的なジェネレーティブ オーディオ トランスフォーマー Opus 1) は、NVIDIA エンジニアによって開発された高度な GenAI モデルで、テキスト コマンドを使用してサウンドを操作できます。音楽を作成したり、ボイスを置き換えたり、エフェクトを追加したり、まったくユニークなサウンドを作成したりできます。 Fugatto は複数のタスクを同時に処理し、音声のアクセントや感情などのさまざまな指示を組み合わせます。
このモデルが作られたスケールも印象的です。 Fugatto がニーズに応じて使用する 25 億個のパラメーターについて話しています。もちろん、これらはすべて NVIDIA テクノロジを活用しており、すべてがさまざまな国のチームによって作成および開発されました。 Fugatto は革新的な機能により、これまでにない規模で芸術的な実験を行うことができます。
したがって、エンジニアがサウンドの観点からこのモデルを「スイス アーミー ナイフ」と呼んだのは驚くべきことではありません。このテクノロジーは大量のデータに基づいてトレーニングされているため、可能性は非常に大きくなります。以下のものが利用可能でした。 BBC サウンド ライブラリでは、本当に印象的な豊富なソース素材にアクセスできます。
大きな可能性

しかし、フガットは何に使えるのでしょうか?そうですね、プロンプトに基づいて曲の「スケッチ」を作成できる音楽プロデューサーの例を挙げることができます。また、エフェクトを簡単に追加したり、いくつかのコマンドでさまざまなスタイル、楽器、エフェクトを調整したりすることもできます。
今日のヒーローは、既存のトラックの全体的な品質を向上させたり、個々の楽器を分離したりすることもできます。可能性はたくさんありますが、それは音楽業界だけに限定されません。
確立されているように、Fugatto はサウンドも操作するため、ゲーム開発者はサウンドを動的な状況に適応させることができる可能性があります。これにより、各プレイヤーの個性がさらに高まり、状況に応じて異なるサウンドや異なる増幅されたダイアログが聞こえるようになります。
マーケティングの場合も状況は同様で、このモデルはナレーターの音声とアクセントを特定の地域に適応させることができます。これは、将来的に広告キャンペーンを作成し、世界中の受信者にリーチしたいと考えているすべての人にとって、非常に簡素化されます。
フガットはいつ一般利用できるようになりますか?

Fugatto のエンジニアによると、私たちは AI が最高のアシスタントとなる、音楽とサウンドの創造の新時代に突入しているとのことです。興味深いことに、この熱意は有名プロデューサーのイド・ズミシュラニー氏も同様です。
実際、この場合、唯一の障壁は私たち自身の創造性であるように見えるかもしれません。 NVIDIA モデルが興味を持つ多数のユーザーにどのように対処するのか疑問です。
ただし今のところ、NVIDIA は Fugatto がいつリリースされ、より多くのユーザーが利用できるようになるのかを明らかにしていません。今のところ、私たちはそれが早く起こることを期待して待つことしかできません。