Gemini 橫空出世!DeepMind AI 霸主稱雄人類專家
DeepMind 震撼推出 Gemini 模型!文字、圖像、音頻、視頻無所不能,達人類專家水平,Ultra、Pro、Nano 三版本突破 AI 極限,開啟智能新紀元

多模態大型語言模型(MLLM)近年成為研究焦點,利用大型語言模型的強大功能處理多樣化的跨模態任務。Google DeepMind 團隊推出革命性的 Gemini 系列多模態模型,在文字、圖像、音頻及視頻理解方面表現卓越。這些模型突破語言處理、圖像分析、音頻解讀及視頻理解的界限。以優化的 Transformer 解碼器為基礎,Gemini 提供三種版本:Ultra 應對複雜挑戰、Pro 提供高效能擴展、Nano 適用於設備應用,展現媲美人類專家的能力,預示人工通用智能的未來方向。
來源: Synced

相關新聞
March 21, 2025
OpenAI 新語音模型殺到!AI 助理講野似足真人?從此「有血有肉」?
AI 而家唔單止識講人話,仲識扮嘆氣、偷笑!OpenAI 最新音頻模型勁到連 IT人都嚇親,即睇點樣用 AI 幫你慳返 90% 開會時間!
其他
OpenAI 新語音模型殺到!AI 助理講野似足真人?從此「有血有肉」?
March 21, 2025
深度學習 vs 機器學習:IBM專家話你知!
March 21, 2025
Nvidia推全球首個 Open Source 機器人 Blue, 黃仁勳:通用機器人的時代已來臨
March 20, 2025
輕鬆3D設計!BlenderMCP + Claude AI 夠晒簡單
March 19, 2025
阿里巴巴 R1-Omni 閃耀登場!結合 RLVR 強化多模態 AI
March 14, 2025
Google DeepMind 推 Gemini Robotics 革新機器人
March 14, 2025
Windows 11 AI 記事本!總結功能大升級
March 14, 2025
MCP 或取代HTTP!AI 通訊新標準,效率提升未來
March 14, 2025










