“最聪明的谷歌AI”:原生多模态,百万字上下文
谷歌AI负责人Koray Kavukcuoglu在发布会上直言:“这是谷歌有史以来最智能的模型。”
Gemini 3 Pro具备“原生多模态”能力,可同时处理文本、图像、音频与视频,不再像旧模型那样逐一分割分析。例如,用户只需上传一张手写菜谱的照片,Gemini不仅能翻译,还能自动整理成电子食谱、生成购物清单,甚至创建可交互的烹饪指南。
更惊人的是其100万tokens的上下文窗口——相当于700页英文书籍或2小时4K视频内容。这意味着用户可一次性上传整本报告、长篇论文或项目文档,让AI进行深度分析与摘要,彻底告别“信息碎片化”处理。
AI不再“讨好”,而是“说真话”
过去,AI常被诟病“只会奉承、回避问题”。但Gemini 3被刻意设计为减少“阿谀奉承”(sycophancy)。
谷歌产品总监Tulsee Doshi表示:“我们希望回应是聪明、简洁、直接的,避免陈词滥调与无意义的赞美。”这意味着,当用户提出错误前提时,AI将更敢于纠正,而非一味迎合。
谷歌CEO桑达尔·皮查伊也借此提醒公众:“不要盲目相信AI的每一句话。”他强调,AI仍需与传统搜索等工具结合使用,以确保信息准确性。
“反引力”平台:用一句话,让AI替你编程
本次发布的最大“杀手锏”,是名为 Antigravity 的全新AI开发平台。
它允许开发者用自然语言下达指令,例如:“帮我做一个网页,能上传PDF并提取所有合同条款,按优先级分类。”随后,AI将自主规划、编写代码、测试功能,甚至控制浏览器验证结果。
谷歌称,这是“代理式编程”(Agentic Coding)的里程碑——AI不再是辅助写代码的“助手”,而是能独立完成任务的“数字员工”。
沃顿商学院教授伊桑·莫利克(Ethan Mollick)实测后惊叹:“我给了AI一个文件夹里所有文章,让它整理成网页并验证预测准确性。它像一位真正的员工一样,分阶段汇报、请求批准、自主执行。”
全面接入搜索与Gemini应用,20亿用户将被重塑体验
Gemini 3将迅速整合进两大核心产品:
• Gemini应用:月活超6.5亿,用户将体验更智能的对话、文件分析与创作辅助。
• Google搜索:通过“AI Overviews”功能,月活超20亿,Gemini 3将让搜索结果从“链接列表”升级为“可视化交互答案”。例如,搜索“新西兰自驾路线”,系统可能直接生成带地图、日程、预算表的可点击方案。
谷歌产品副总裁Robby Stein称:“你将能在搜索中,直接回答最复杂的问题。”
从“掉队”到“领跑”:谷歌的AI逆袭之路
回望2023年初,谷歌曾因Bard AI的糟糕演示被群嘲,被ChatGPT“抢尽风头”。但短短两年,Gemini已从“模仿者”蜕变为“定义者”。
此次Gemini 3的发布,距上一代仅9个月,显示谷歌正以“极速迭代+全栈整合”策略加速追赶。其自研TPU芯片、谷歌云基础设施与搜索生态的协同优势,正成为对抗OpenAI依赖微软算力的“护城河”。
然而,皮查伊也罕见发出警告:当前AI投资热潮中存在“非理性”,算力成本与能源消耗“极其巨大”,行业或面临泡沫风险。
AI已不是“工具”,而是“同事”
Gemini 3的发布,标志着一个分水岭:AI不再只是回答问题的“工具”,而是能主动思考、规划、执行的“数字代理”。
当搜索能自动生成应用,当AI能独立完成编程,我们面对的已不是技术升级,而是一场工作方式与社会结构的深层变革。
谷歌正在下一盘大棋:用AI重新定义搜索,用搜索重塑世界的信息获取方式。
而这一次,它,似乎真的领先了。
来源:综合法新社
(即时多来源) 最新英语科技新闻 New Zealand English News👉 [点击此处查看全部最新文章]
请小编喝咖啡☕️ ------------------------------------
广告 | Advertisement
在澳纽网做广告 | Advertise with us
286 views