谷歌Gemini Ultra来了!每月19.9刀网友:GPT4不香了

农历春节除夕这一天，Google 直接来了一票大的：

Bard今后统称Gemini。

通过Gemini Advanced，即可访问Google能力最强的原生多模态大模型Gemini Ultra！

去年12月，Go ogle 推出Gem ini Pro和Gemini Nano，人们可以通过聊天机器人Bard、Pixel 8 Pro 和三星S24 系列手机免费使用。而今天，Bard改头换面，带来由超大杯Ultra 1.0 驱动的会员版Gemini Advanced全新体验，同时推出支持安卓和iOS客户端的手机移动应用。

新服务订阅价格为每月19.99美金，和ChatGPT Plus、Perplexity Pro等主流生成式AI应用每月20美金的价格差不多。不过为了显示诚意，Google会提供前两个月免费试用。

Google最高阶多模态大模型，Gemini Ultra新时代开启

据Google CEO 桑达尔·皮查伊称，Ultra 1.0是首个在 MMLU（大规模多任务语言理解）上超越人类专家的模型，使用了包括数学、物理、历史、法律、医学和伦理学在内的57个学科组合来测试知识和解决问题的能力。

因此，Gemini Advanced在编码、逻辑推理、遵循微妙指令和协作创意项目等高度复杂的任务上将更加强大。不仅可以与用户进行更长、更详细的对话，还能更好地理解提示上下文。

比如：Gemini Advanced可以成为个人导师，为你创建逐步说明、个性化测验或根据学习风格量身定制回答；解决更复杂的编码场景，并协助评估不同的编程思路；成为数字创作者的创意伙伴，生成新鲜内容，分析最新趋势，制定商业计划书。值得一提的是，Gemini Ultra内由Imagen 2生成的所有图像都应用了数字水印（虽然你看不到它）。

随着新功能不断添加，用户将体验到更强的多模态能力、更多交互式编程功能以及更深入的数据分析。目前Gemini Advanced仅支持英语，可以在超过150个国家和地区使用，将逐步扩展到更多语言。

安卓和IOS手机端登场，Gmail、文档、表格可使用

Gemini Advanced作为全新Google One AI高级计划的一部分，还会给用户提供2TB存储空间。此外，AI高级订阅者很快就能够在Gmail、Docs、Slides、Sheets等之前被集合为Duet AI的应用中指调用Gemini Ultra。

为了实现手机端轻松访问，Google此次推出全新Gemini应用程序。

你可以拍摄一张车胎的照片请求说明，为晚宴邀请函生成自定义图像，或者要求撰写一条复杂短信。Google称之为“构建真正的AI助手的重要第一步，一个具有对话性、多模态的新型实用助理。”

安卓手机用户可以下载Gemini应用程序，或按照平时激活Google助手的方式——比如直接说“嘿，Google”来将它唤醒。Gemini 能为你刚拍摄的照片生成描述，回答阅读中文章的相关问题。许多Google助手的语音功能也将通过Gemini App可用，包括设置定时器、打电话和控制智能家居设备等。

虽然iOS应用还在路上，但Google表示在接下来的几周里即会上架App Store。

将Gemini 能力扩展至更多产品

Gemini也将全面应用于个人和企业每天使用的产品，包括 Workspace 和谷歌云服务。

Workspace：

皮查伊表示，目前已经有超过100万人正在使用像「Help me write 」这样的功能，通过 Duet AI 提高生产力和创造力。从今天起，Duet AI 将改为 Gemini for Workspace，并且很快， Google One AI 高级计划订阅者就能在 Gmail、Docs、Sheets、Slides 和 Meet 等谷歌办公全套件中使用 Gemini Ultra。

谷歌云：

对于云客户来说，Gemini 将帮助提高企业生产力，协助开发人员更高效编写代码，并保护组织免受网络攻击。

开发者一直是每一次重大技术变革的基础，在 Gemini 生态系统中也扮演着同样重要的角色。现在已经有数十万技术人员和企业正在使用 Gemini 大模型进行开发。Google将在下周分享更多关于开发者和云客户未来权益的详细信息。

皮查伊还透露，Google已经在积极训练下一代 Gemini 模型了。

网友迫不及待，Gemini Ultra新鲜开测

去年12月6日Google发布Gemini Pro时，对标的是GPT-3.5。由于取消了原定的线下亮相，Gemini系列被媒体渲染得阴影重重。于是没隔几天，中杯大杯忽然集体登场，还以一个震慑三观的“鸭子”视频demo引发热烈讨论和网络打假。当时Google曾预告说在32项LLM广泛使用的基准测试中，Gemini Ultra有30项都超越了 ChatGPT代表的业界最先进水平。

究竟Ultra版本实力如何，现在终于可以上手一探究竟了。

用写LinkedIn Post来测试内容生成。结论是Gemini Ultra凭借更多标题选项、更快响应速度和“没有愚蠢的emoji表情”击败GPT-4成为绝对胜者。

网友 Alphabetting拿出一道逻辑推理题：Tabitha喜欢饼干但不喜欢蛋糕，喜欢羊肉但不喜欢羔羊肉，喜欢秋葵但不喜欢南瓜。它询问按照相同规则，Tabitha会喜欢樱桃还是梨。

Gemini Ultra给出的建议是：“Tabitha喜欢发音两个音节的食物，不喜欢一个音节的食物。”它列出谜题中每种食物的音节数，由于「cherries」有两个音节，因此答案是樱桃。

GPT-4认为Tabitha的偏好可能与单词最后一个字母有关。她喜欢的食物结尾是辅音，而她不喜欢的食物结尾是原因。这样的话，樱桃和梨都符合条件——有些棘手，但一定要选一个的话，那就樱桃吧。

他表示Gemini Ultra成功解决了被GPT-4搞到稀碎的逻辑测试。

用户Brett Winton测试两者的文生图功能，提示词是“生成一个画家试图在火箭外部画静物的图像，让它幽默一些，一幅插画“。左边是GPT-4，右边是Gemini Ultra。

AI模型的想象力见仁见智，不过Gemini图像里的画家比起绘画更像在吃东西，手部细节也有点问题。评论里都觉得GPT-4更好些。

他又紧接着对比了Gemini Ultra、 Claude和GPT-3.5对于8年级数学题计算能力。

题面是：Garcia正策划一个比萨派对，她需要确保30名学生每人至少得到3片，每个比萨有8片。为增加多样性， Garcia决定订购一半奶酪比萨和一半香肠比萨。然而有5名学生是素食者，只会吃奶酪比萨。

请回答：

1.Garcia需要订购多少个比萨，以确保每个学生至少3片？

2.每种类型比萨各多少个？

3.如果每个比萨12美元，总订单费用是多少？

在之前的测试中， Gemini Pro把这道题搞砸了。此次Ultra答对了总数12个比萨和费用144美元。但第2题的正确答案应该是两种比萨各6个，Ultra没通过。

Brett Winton表示，Gemini Ultra和Claude一样，数学计算都不如GPT-3.5准确。

编码能力上，网友Mervin Praison在Gemini Ultra用Python成功创建了一个贪吃蛇游戏。

更多更深入的用例，大家可以抓住两个月的免费试用福利，亲自上手玩一玩。

OpenAI开辟AI代理新战场，Google 不甘落后

谷歌副总裁兼Gemini体验和Google助手部门总经理Sissie Hsiao表示，“对谷歌来说，Gemini不仅仅是模型。它实际上是我们思考最先进技术，以及我们在其基础上构建的整个生态系统的转变，从影响数十亿用户的产品，到开发者和企业用来创新的API平台。”

就在昨天，The Information发表题为《OpenAI正将AI竞争焦点转移到能操作设备和自动化任务的软件上》的报道。

文中爆料，OpenAI正在开发一种代理软件，能有效接管手机和电脑，替用户执行复杂任务操作。你可以命令ChatGPT执行从文档到表格的数据转移，自动填写费用报告并输入到会计软件中，或者在特定预算下创建行程或预订机票等基于网络的任务。

随着越来越多全新大模型的推出，OpenAI也深知今年可能不再拥有市场上最强大LLM的可能性。所以加紧开辟新战场早做准备。

据知情人士称，这类请求将触发代理点击、光标移动、文本输入等其它人类动作。可能会将将ChatGPT变成Sam Altman私下称为「超智能个人工作助理」的工具，也将与微软Copilot和谷歌Gemini for Workspace 展开更直接竞争。

去年ChatGPT已经给OpenAI带来16亿美元收入，微软也靠生成式AI显著拉升了最新季度财报业绩。

而AI业务却还没有给Google带来明朗的现金流。如今付费版本Gemini Advanced和Ultra 1.0的推出会带来怎样的市场回馈，那些已经花钱订阅GPT的用户们会不会转投Gemini，人工智能整合进谷歌生态的全新究极样貌是什么？这些都让人期待。今年，注定继续是高潮迭起的AI拉锯战。

推荐阅读

谷歌发布全新AI模型Gemini 3:宣称全球最智能模型

法国专家指出《中国正努力引领低碳工业》

为了让你吃上现炒 老乡鸡们开始用机器人颠勺了

为了让你吃上现炒老乡鸡们开始用机器人颠勺了