March 14, 2025In Gemini, GoogleBy 金髮扮工少年

Gemini 橫空出世！DeepMind AI 霸主稱雄人類專家

DeepMind 震撼推出 Gemini 模型！文字、圖像、音頻、視頻無所不能，達人類專家水平，Ultra、Pro、Nano 三版本突破 AI 極限，開啟智能新紀元

多模態大型語言模型（MLLM）近年成為研究焦點，利用大型語言模型的強大功能處理多樣化的跨模態任務。Google DeepMind 團隊推出革命性的 Gemini 系列多模態模型，在文字、圖像、音頻及視頻理解方面表現卓越。這些模型突破語言處理、圖像分析、音頻解讀及視頻理解的界限。以優化的 Transformer 解碼器為基礎，Gemini 提供三種版本：Ultra 應對複雜挑戰、Pro 提供高效能擴展、Nano 適用於設備應用，展現媲美人類專家的能力，預示人工通用智能的未來方向。

來源: Synced

OpenAI 新語音模型殺到！AI 助理講野似足真人？從此「有血有肉」？

AI 而家唔單止識講人話，仲識扮嘆氣、偷笑！OpenAI 最新音頻模型勁到連 IT人都嚇親，即睇點樣用 AI 幫你慳返 90% 開會時間！

March 21, 2025

深度學習 vs 機器學習：IBM專家話你知！

想知 AI、機器學習同深度學習有咩分別？IBM 同 Opera Solutions 專家為你解構，一文睇清未來趨勢！

Gemini 橫空出世！DeepMind AI 霸主稱雄人類專家

相關新聞

其他