Stable AI推出可透過文字描述生成44.1kHz規格、長度達3分鐘立體音訊的Stable Audio 2.0相比先前版本僅能產生45秒明顯有大幅成長

推出Stable Diffusion影像生成工具的人工智慧業者Stable AI,近期宣布推出其新款語音生成模型Stable Audio 2.0,將能透過文字產生時間長度達3分鐘的44.1kHz規格立體聲音訊,相比先前版本僅能產生45秒明顯有大幅成長。 Stable Audio 2.0跟1.0版本一樣,都是透過AudioSparx收錄超過80萬組音訊...

看更多...

Stability AI推出可在一秒內渲染CD音質立體聲音訊的自動生成音訊服務Stable Audio生成音訊內容的品質可達44.1 kHz

Stability AI近期攜手旗下投資人工智慧實驗室Harmonai,推出名為Stable Audio的人工智慧音樂生成模型,可在配合NVIDIA A100 GPU加速系統上以不到一秒時間內完成渲染95秒長度的CD音質立體聲音訊。 目前Stable Audio將以免費版本及付費版本提供使用,後者將以每月12美元價格提供。而免費版本最多僅能生成20個音訊內容,每個...

看更多...