Stable AI推出可透過文字描述生成44.1kHz規格、長度達3分鐘立體音訊的Stable Audio 2.0相比先前版本僅能產生45秒明顯有大幅成長

推出Stable Diffusion影像生成工具的人工智慧業者Stable AI,近期宣布推出其新款語音生成模型Stable Audio 2.0,將能透過文字產生時間長度達3分鐘的44.1kHz規格立體聲音訊,相比先前版本僅能產生45秒明顯有大幅成長。 Stable Audio 2.0跟1.0版本一樣,都是透過AudioSparx收錄超過80萬組音訊...

看更多...

人工智慧新創Stability AI推出新版Stable Diffusion 3,標榜讓生成影像更符合實際需求暫時尚未對外公開使用

在OpenAI、Google、微軟在內業者接連推出新款能以文字描述快速生成影像內容的服務後,人工智慧新創Stability AI稍早也宣布推出新版Stable Diffusion 3,標榜能提高生成影像畫質,並且能對應處理更多主題內容,讓生成影像更符合實際需求。 而針對目前越來越多惡意人士利用自動生成式人工智慧技術製造不實內容,或是透過以假亂真影像進...

看更多...