Meta揭曉可快速產生清晰、自然,並且能在後續編輯、調整的語音內容生成模型考量可能會被濫用,因此未公布模型原始碼內容

Meta稍早公布名為Voicebox的語音生成模型,將可透過Flow Matching演算法,從大量原始音訊與轉錄文字進行學習,進而生成自然生動的語音內容。 同時,Voicebox並未限制僅能用於特定領域的語音內容,透過足夠音訊與文字內容即可產生去除噪音、清晰語音,同時還能進行內容編輯、風格轉換,或是輸出不同聲音特色語音內容。 而藉由Flow Matchin...

看更多...

蘋果讓開發者能更容易透過iPhone、iPad建立3D模型,短短幾分鐘就能完成將以USDZ通用檔案格式呈現

在此次WWDC 2023期間,蘋果將過去向開發者提供的「Object Capture」的API資源帶到iOS、iPadOS平台作業系統,將能藉由iPhone、iPad所搭載光達 (LiDAR)系統圍繞物體拍攝,即可在短短幾分鐘內完成被攝物體的3D建模。 實際上,先前已經有不少業者提出類似技術,包含直接透過機器學習方式將2D影像轉換為3D模型,或是透過多張照片建構3...

看更多...

Google強化聊天機器人「Bard」表現,強化預測及解決複雜推論的能力改良過去僅仰賴大型語言模型運算情況

Google宣布其整合自動生成式人工智慧的聊天機器人「Bard」再次升級,主要改良過去僅仰賴大型語言模型運算情況,強化預測及解決複雜推論的能力,並且在應對字詞、數字運算等情況提高約30%準確度。 例如可以回覆100萬以內的質因數問題,或是特定字詞反意內容,但Google仍強調「Bard」所給出解答仍有可能出錯,甚至透過其編寫程式碼可能包含錯誤內容,或是給予錯誤解答...

看更多...

台灣二重國民中學課程結合微軟新一代大型自然語言模型,以更有趣方式學習英語採用微軟Azure OpenAI技術

此次微軟Build 2023中,微軟宣布在台灣教育部資助之下,在新北市三重區的二重國民中學由吳美玲老師教導英語課程,導入結合微軟新一代大型自然語言模型的聊天機器人CoolE Bot,將讓學生能以更有趣方式學習英語。 在過往的英語學習情況中,台灣學生往往是在寫作及閱讀有較好表現,但口說能力反而顯得較弱,原因多半在於缺乏足夠的對話練習,或是害怕與人藉由英語溝通。 ...

看更多...

Google新大型自然語言模型PaLM 2以更「輕巧」形式運作,對應更高人工智慧運算效率提升其應用彈性之餘,更能對應離線使用需求

針對Google此次在Google I/O 2023揭曉的大型自然語言模型PaLM 2,DeepMind首席軟體工程師戴明博 (Andrew Dai)與DeepMind生成模型產品經理Paige Bailey在會後進一部分享更多細節。 戴明博表示,相比先前提出的PaLM,這次揭曉的PaLM 2其實採用相對較小的模型架構,主要改變資料運算結構,進而讓縮小後的模型可以...

看更多...

台智雲以台灣杉二號超級電腦建立參數多達1760億個參數的繁中版企業大型語言模型以「福爾摩沙大模型」為稱

成立於2021年的台智雲 (台灣智慧雲端服務股份有限公司),今日 (5/17)宣布藉由台灣杉二號超級電腦,建立台灣第一個參數多達1760億個的繁中版企業大型語言模型「福爾摩沙大模型」。 藉由對應繁體中文的語意理解能力,以及自動化文本生成能力,台智雲預期將推動企業級自動生成式人工智慧解決方案,並且催生全新商業模式。 除了強調提供更具彈性、安心,並且快速產生符合...

看更多...

傳OpenAI準備推出新款開源語言模型,但非類似GPT等大型語言模型產品預期針對開源社群應用需求打造

The Information網站取得消息指出,OpenAI將準備對外公開一款全新開源語言模型,但可能不是類似GPT等大型語言模型產品。 不過,OpenAI方面並未對此作任何回應,而OpenAI執行長Sam Altman日前則表示近期並未計畫投入GPT-4下一代大型自然語言模型訓練,因此即便推出新款語言模型,有可能是針對開源社群應用需求打造的產品。 在Ope...

看更多...

Google聊天機器人「Bard」將支援40種語言,增加影像識別、與諸多服務整合背後接入大型自然語言模型PaLM 2、透過Google第四代TPU加速運作

在Google I/O 2023正式展開前,Google其實在3月下旬開始就對外開放申請其聊天機器人「Bard」,在此次活動更透露在此聊天機器人背後接入大型自然語言模型PaLM 2,使其能有更快執行速度與反應速率,同時也能對應多語言互動,接下來更計畫在全球180個國家地區開放使用,初期仍會以英語介面互動為主,但確定加入支援日文與韓文互動,後續更準備支援全球最常被使用的40種語言...

看更多...

Google正式揭曉大型自然語言模型PaLM 2,預計用在近25款Google服務產品讓全球資訊更容易被廣泛取用

Google在此次Google I/O 2023期間宣布推出大型自然語言模型PaLM 2,標榜強化多種語言支援、推論能力與編碼相容性,並且建立在用於轉換數值函數的機器學習框架Google JAX,以及加速硬體第四代TPU (TPU v4)架構基礎之上,藉此加快執行與反應速度,預計佈署應用在近25款Google服務產品。 在此之前,Google已經對外公布LaMDA...

看更多...

微軟提出NUWA-XL多模自動生成式人工智慧模型,以16組描述句生成11分鐘長度影片將加快動畫內容製作速度

微軟亞洲研究院近期提出名為NUWA-XL的多模自動生成式人工智慧模型,標榜能以16組描述句即可生成長達11分鐘的影片內容。 微軟亞洲研究院在2021年便提出多模自動生成式人工智慧模型NUWA (女媧),能以自然語言描述生成文字、圖像、影片內容,後續推出的升級版NUWA-Infinity更進一步將生成圖像、影片解析度提高。 而此次提出的NUWA-XL,則是建立...

看更多...