OpenAI推出規模更小,但圖文理解能力更高的輕量版大型自然語言模型GPT-4o mini將取代免費版ChatGPT背後的GPT-3.5 Turbo模型

日前揭曉全新GPT-4o人工智慧模型之後,OpenAI稍早接續推出其輕量化版本模型,並且以GPT-4o mini為稱。 以MMLU (Measuring Massive Multitask Language Understanding)量測工具比對之下,GPT-4o mini對於多工語言理解程度達82%,對比先前推出的GPT-4o為88.7%低了一些...

看更多...

蘋果強調其AI模型雖然使用近期有爭議資料集,但未用於「Apple Intelligence」服務等功能目前並未規劃建立任何新版OpenELM人工智慧模型

先前報導指出,包含蘋果、NVIDIA、Anthropic在內科技業者均採用由非營利人工智慧研究團體Eleuther AI建立的資料集,藉此訓練其人工智慧模型,而使用資料涵蓋源自4萬8000個YouTube頻道、超過17萬3000部影片內容的文字內容,而蘋果在稍早向9to5Mac網站回應說法,指稱其OpenELM人工智慧模型雖然使用此資料集,但並未用於包含「Apple ...

看更多...

報導指稱蘋果、NVIDIA、Anthropic等以諸多YouTube文字資料訓練人工智慧模型透過非營利機構建立資料集取得訓練內容

相關報導指出,包含蘋果、NVIDIA、Anthropic在內科技業者均採用由非營利人工智慧研究團體EleutherAI建立的資料集,藉此訓練其人工智慧模型,但此資料集內容涵蓋源自4萬8000個YouTube頻道、超過17萬3000部影片內容的文字資料,其中更包括著名網紅MrBeast與MKBHD (Marques Brownlee)所拍攝影片,以及包含紐約時報、BBC...

看更多...

傳OpenAI正在打造一款代號「草莓」的先進人工智慧模型,將可回答複雜問題或數學難題可能就是先前曾在內部展示的「Q*」

路透新聞報導指稱,OpenAI正在開放一款代號「草莓」 (Strawberry)的新款人工智慧模型,將能藉由更先進的推理能力提前規劃、執行更複雜工作任務。 而此款人工智慧模型在更早前則是以「Q*」 (Q star)為稱,並且能回答棘手的科學問題與數學計算。 不過,目前還無法確認此款人工智慧模型實際開發進度,以及是否就是先前OpenAI內部曾展...

看更多...

原先計畫以100億美元與甲骨文合作協議破局,Elon Musk強調將自行建構大型超級電腦訓練叢集將轉向以自有GPU資源訓練其人工智慧模型

Elon Musk表示,旗下人工智慧新創公司xAI已經結束與甲骨文擴大現有合作租用GPU協議,將轉向以自有GPU資源訓練其人工智慧模型。 在此之前,Elon Musk便透露採購10萬組NVIDIA H100 GPU,藉此建構大規模超級電腦訓練叢集,而此次結束與甲骨文擴大現有合作租用GPU協議,主要希望掌握自主權,藉此加速成為發展更為快速的人工智慧公司...

看更多...

Anthropic執行長認為未來人工智慧模型訓練成本將大規模增加硬體採購、電力損耗等成本都會面臨挑戰

近期接受採訪時,Anthropic執行長Dario Amodei認為目前訓練人工智慧模型的成本將持續增加,甚至未來3年內的訓練成本將會增加至100億美元,甚至高達破兆美元規模。 Dario Amodei表示,硬體將成為日後人工智慧訓練成本重要關鍵,以NVIDIA今年公布的「Blackwell」顯示架構B200 GPU為例,價格約落在3萬美元至4萬美元...

看更多...

Google正式向開發者、研究人員開放使用可對應270億組參數的開源模型Gemma 2接下來也會提供更小規模設計的26億組參數版本,將可在手機端執行

Google在今年Google I/O 2024期間宣布推出全新開源模型Gemma 2,本身針對TPU、GPU加速最佳化,並且能輸出2倍高的模型運行效能,最多更可對應270億組參數,但同時也提供可對應90億組參數的小規模版本,接下來也會提供更小規模設計的26億組參數版本,將可在手機端執行。 在稍早說明中,Gemma 2可透過數據建模與數據分析競賽平台...

看更多...

Google以PaLM 2模型大幅提升翻譯功能,新增110種語言翻譯、透過AI學習更多語言強化多數非洲境內語言,甚至也強化中文裡的粵語遣辭用字

Google宣布以其大型自然語言模型PaLM 2強化翻譯功能,讓Google翻譯服務新增110種語言,其中強化多數非洲境內語言,甚至也強化中文裡的粵語遣辭用字,使其更符合香港地區中文翻譯習慣。 距離上次在2022年5月大幅更新Google翻譯服務,並且在後續聲明將以人工智慧技術強化翻譯品質之後,Google在此次更新也利用PaLM 2模型學習翻譯語種...

看更多...

Anthropic釋出新款聊天機器人服務模型Claude 3.5 Sonnet,標榜性能超越OpenAI的GPT-4o目前已經開放包含免費帳號在內用戶使用

Anthropic稍早釋出新款聊天機器人服務模型Claude 3.5 Sonnet,標榜性能高於先前釋出的Claude 3 Opus,同時反應速度更是其兩倍以上,目前已經開放包含免費帳號在內用戶使用。 除了Claude 3.5 Sonnet,在Anthropic的具體說明中,更透露接下來也會推出反應速度更快的Claude 3.5 Haiku,以及性能...

看更多...

觀點/蘋果其實在「Apple Intelligence」放入自有人工智慧模型,與第三方業者合作提高應用彈性「Private Cloud Compute」雲端運算顯然也採用自有處理器硬體架構

雖然蘋果過去強調已經在人工智慧技術領域發展多年,但始終強調著重在機器學習或深度學習等應用,直到今年介紹新款iPad Pro、iPad Air時,才開始大量使用人工智慧描述詞彙,因此在今年WWDC 2024期間正式揭曉「Apple Intelligence」技術,不少看法認為蘋果正式開啟其「人工智慧元年」。 ▲蘋果在今年WWDC 2024期間正式揭曉「Apple...

看更多...