【谷歌发布多模态大模型旗舰Gemini Omini】谷歌在本届I/O正式发布Gemini Omni,这是Gemini模型家族迄今为止能力最为全面的版本。「Omni」顾名思义,意指「全能」——该模型在处理文字、图像、视频、音频等多种模态信息时,展示出前所未有的流畅性与深度。 在演示素材中,GeminiOmni展现了多项令人印象深刻的能力:面对用户手绘的一条鱼,它不仅能够识别并与之互动,还能实时生成流动动画;在「弹珠世界知识」演示中,它将各类知识点具象化为弹珠穿行于复杂管道的视觉叙事;面对天文级别的「黑洞素描」,Omni能精准识别物理概念并展开深度讲解;在蛋白质折叠演示中,则直观呈现了其在科学领域的推理与可视化潜力。 Gemini Omni还被深度集成至Gemini App,成为用户每日与AI交互的「默认智能引擎」,为后续所有基于Gemini的服务提供统一的模型底座。
