March 14, 2025In Gemini, GoogleBy 金髮扮工少年

Gemini 橫空出世!DeepMind AI 霸主稱雄人類專家


DeepMind 震撼推出 Gemini 模型!文字、圖像、音頻、視頻無所不能,達人類專家水平,Ultra、Pro、Nano 三版本突破 AI 極限,開啟智能新紀元

多模態大型語言模型(MLLM)近年成為研究焦點,利用大型語言模型的強大功能處理多樣化的跨模態任務。Google DeepMind 團隊推出革命性的 Gemini 系列多模態模型,在文字、圖像、音頻及視頻理解方面表現卓越。這些模型突破語言處理、圖像分析、音頻解讀及視頻理解的界限。以優化的 Transformer 解碼器為基礎,Gemini 提供三種版本:Ultra 應對複雜挑戰、Pro 提供高效能擴展、Nano 適用於設備應用,展現媲美人類專家的能力,預示人工通用智能的未來方向。
來源: Synced



相關新聞

OpenAI 新語音模型殺到!AI 助理講野似足真人?從此「有血有肉」?

AI 而家唔單止識講人話,仲識扮嘆氣、偷笑!OpenAI 最新音頻模型勁到連 IT人都嚇親,即睇點樣用 AI 幫你慳返 90% 開會時間!

深度學習 vs 機器學習:IBM專家話你知!

想知 AI、機器學習同深度學習有咩分別?IBM 同 Opera Solutions 專家為你解構,一文睇清未來趨勢!