继量子芯片之后,谷歌又来抢" OpenAI 双 12 直播"的流量了!
就在刚刚,谷歌新一代大模子Gemini 2.0短暂登场,再次由谷歌 CEO 皮猜躬行官宣。
新一代模子专为 AI Agent 而打造,谷歌暗意目下也曾将 2.0 版块提供给了一些建设者内测,正在赶快将其集成在 Gemini 和搜索等居品线中。
好音尘是,Gemini 2.0 Flash 履行版模子今天就在网页端洞开,大众齐能玩,挪动端行将推出。
除此以外,谷歌还推出了一项名为深度斟酌(Deep Research)的新功能,基于高等推理和长险峻文智商,它能径直帮你干斟酌助理的活儿——给个主题,我方出阐明的那种。
目下这个新功能在 Gemini Advanced 版块中可用。
谷歌这一波脱手,再勾通 Sora 的不尽如东谈办法,新一天的直播还没运行,也曾有东谈主运行唱衰 OpenAI 了:
OpenAI 的护城河是什么?
在谷歌 CEO 皮猜、Google DeepMind CEO 哈萨比斯,以及 Google DeepMind CTO 科雷(Koray Kavukcuoglu)三东谈主共同撰写的博客著述中,官方给Gemini 2.0的定位是:
面向智能体时间的 AI 模子。
在多模态方面的新进展,以及原生器用的使用,使咱们或者构建新的 AI 智能体,以更接近齐备通用助手的愿景。
具体何如体现?在 Gemini 2.0 Flash 履行版第一期间上线的同期,谷歌还在 Gemini Advanced 中推出了一项名为深度斟酌(Deep Research)的智能体新功能。
你不错把它当成以斟酌助理,围绕一个复杂主题生成斟酌阐明。有点像是个科研版 AI 搜索。
另外一个 Gemini 2.0 的重心要津词是:多模态。
2.0 Flash 履行版除了支撑图像、视频、音频多模态输入,还支撑多模态输出。
不只单是粗浅的图文混排,可控的多语种文本到语音(TTS)输出也行,还能径直土产货调用器用,比如谷歌搜索、代码器用、第三方用户界说的功能。
有 ChatGPT 插件那味儿了。
不外,算作履行模子,其文本到语音和原生图像生告捷能目下仅提供给早期探望配合资伴。谷歌显现 2.0 Flash 将在 1 月份崇拜推出,会提供更多不同大小的模子。
而左证谷歌发布的基准测试效果,不管是在多模态的图片、视频智商上,如故编码、数学等智商上,仅是 Flash 履行版的 Gemini 2.0 阐述就已险些全面卓越 Gemini 1.5 Pro 002。
而且它的速率是 1.5 Pro 的两倍。
谷歌暗意,来岁岁首,会将 Gemini 2.0 推广到更多旗下居品中,比如 Project Astra。
即是 I/O 大会上谷歌推出来跟 GPT-4o 的语音功能打擂台的阿谁。
这次,基于 Gemini 2.0,Project Astra 更新了以下功能:
更好的对话:当今或者以多种话语和搀杂话语进行对话,更好地联合口音和不常见的单词。
使用新器用:Project Astra 会用谷歌搜索、Lens 和舆图了。
更强的操心力:Project Astra 当今领有10 分钟的会话操心,况兼不错记着更多历史对话,也就说,凭借这些"操心",它能更懂你了。
篡改延伸:Project Astra 不错按经常东谈主类对话的节律来联合对话。
谷歌还提到,正在将 Project Astra 移植到眼镜等更多挪动终局中。
另外,谷歌显现,他们正在和 Supercell 等游戏建设商配合,测试基于 Gemini 2.0 打造的游戏智能体们的实力。
这些智能体不错左证屏幕上的动作对游戏进行推理,并与玩家及时对话提供行为提倡。
玩《突击小队》、《部落突破》、《农场日志》,方法 belike:
除了网页端可用,Gemini 2.0 Flash 履行模子还通过 Google AI Studio 和 Vertex AI 的 Gemini API 向建设者提供。
从 OpenAI 跳槽到谷歌的 Logan Kilpatrick 暗意,他们在 Google AI Studio 中创建了一个全新体验,展示了 Gemini 2.0 视频联合、原生器用使用、空间联合的初学欺诈。
那么,你合计这够 Agent 吗?
参考集结:
[ 1 ] https://x.com/GoogleDeepMind/status/1866869343570608557
[ 2 ] https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/#ai-game-agents
— 完 —
点这里� � 关怀我,紧记标星哦~
一键三连「共享」、「点赞」和「在看」
科技前沿进展日日相逢 ~