愛3C > 人工智慧 > 微軟打造「VALL-E」人工智慧語音模型，透過3秒長度資料即可模擬真實人聲甚至可以加入不同情緒時的說話方式，以及在不同房間等環境下的發聲效果

微軟打造「VALL-E」人工智慧語音模型，透過3秒長度資料即可模擬真實人聲甚至可以加入不同情緒時的說話方式，以及在不同房間等環境下的發聲效果

01-10-2023

愛比價相關商品 :

人工智慧

微軟

房間

微軟研究人員在一篇論文中描述名為「VALL-E」的人工智慧語音模型，標榜僅需3秒鐘長度的聲音資料，即可建立模擬聲音本人說話語調，甚至可以加入不同情緒時的說話方式，以及在不同房間等環境下的發聲效果。依照微軟研究人員說明，此項人工智慧語音模型是以Meta在Libri-light聲音資料庫收錄源自7000多名演講者、長度超過60000小時的英語演講內容進行訓練，藉此讓…

Shares 0

凱文

More Posts