共计 4183 个字符,预计需要花费 11 分钟才能阅读完成。

新智元报道
新智元报道
【新智元导读】OpenAI 发布 AI 浏览器ChatGPT Atlas:原生嵌入 ChatGPT,提供侧边栏、浏览器记忆与智能体模式,可在页面内理解意图并自动完成填表、下单等任务。
OpenAI 再次向谷歌发起冲锋!
就在刚刚,OpenAI 发布了一款以 ChatGPT 为核心打造的全新浏览器——ChatGPT Atlas。
核心功能如下:
-
内置 ChatGPT:可通过侧边栏在任意页面调用
-
浏览器记忆:搜索你的浏览记录
-
AI 智能体:可在页面上执行操作
手快的网友,已经用上ChatGPT Atlas 发推了!
网友「swyx」表示,这是 OpenAI 在获取完整用户上下文、打造完全个性化通用人工智能方面,迈出的最关键一步——
下一代操作系统,就是浏览器。


ChatGPT Atlas 到底给谷歌 Chrome 带来了多大威胁?
产品刚一发布,谷歌母公司 Alphabet 的股价今日应声下挫超 2%。


上手非常简单:首次打开ChatGPT Atlas 时,登录你的 ChatGPT 账户,并从当前浏览器导入书签、已保存的密码和浏览历史即可。

顺便一提,设成默认浏览器后还可获赠 7 天「会员」。

今天,全世界的 macOS 用户都可以下载 ChatGPT Atlas 使用,包括免费、Plus、Pro 及 Go 用户。Windows、iOS 和 Android 版本很快就会推出。
与此同时,Beta 版已经提供给 Business 用户;开启相关权限后,Enterprise 和 Edu 用户也能使用。
而最为关键的「智能体模式」,则会以预览版的形式向 Plus、Pro 和 Business 用户开放。(付费 only)
看来,又有一波初创要被杀死了。


有了 Atlas,ChatGPT 可以在网络的任何角落与你同行:
在当前所在的窗口中,直接提供帮助,理解你的意图,帮你完成任务,全程无需复制粘贴或离开页面。

由于 Atlas 内置 ChatGPT 记忆功能,因此对话可以随时调用过往的聊天记录和细节,助你高效完成新任务。
使用 Atlas 越多,ChatGPT 就会变得越智能、越得力。
浏览器记忆功能让 ChatGPT 能够记住你访问过网站的上下文,并在你需要时随时调用。
这意味着你可以向 ChatGPT 提问,例如:「找出我上周浏览过的所有职位招聘,并总结一下行业趋势,帮我为面试做准备。」
同时,浏览器中的记忆也完全由你掌控:在设置中,你可以随时查看或归档记忆,删除浏览历史也会一并删除所有相关的浏览器记忆。

通过智能体模式,ChatGPT 还可以在 Atlas 中为你分担工作。
经过改进,它能更好地结合你的浏览上下文,运行速度更快、用途更广,如今更擅长研究分析、任务自动化,并能在你浏览网页的同时,帮你规划活动或预订约会。

当智能体控制浏览器时,光标的方向和我们常用的正好相反
对此,有网友在试用之后进行了总结:
-
智能体模式能帮忙搞定很多事,比如在浏览器里用保存的密码订咖啡、填 TSA 预检申请表。
-
当智能体所在的标签页处于后台时,会被内容拦截器干扰。
-
有些网站会阻止 Atlas 总结内容。
-
智能体操作起来非常像真人,比如它会通过点击弹窗旁边的空白区域来关闭弹窗。
-
UI 很赞,新手引导也超级丝滑。它非常巧妙地利用了 Mac 的全屏空间,动画效果堪称炸裂。

顺便一提,Atlas 依然是基于谷歌的 Chromium 内核打造。

就是看这满屏的广告,不知道能不能支持屏蔽插件。



新标签页是你在 Atlas 中的起点。无论是提问还是输入网址,都能在同一个地方获得更快、更有用的结果。
如果想探索聊天以外的特定结果类型,可以切换至搜索链接、图片、视频和新闻等标签页。

打开一个标签页
接下来,不管你是打开什么网页,点击「询问 ChatGPT」即可打开 ChatGPT 侧边栏,无需离开当前窗口,就能进行内容总结、概念解释或处理各项任务。
ChatGPT 能够理解您当前浏览的页面详情,因此它的回复会更贴切、更有帮助。

询问 ChatGPT
当你在任意文本框中书写时,ChatGPT 也能随时提供帮助,给出实时的编辑和修改建议。

使用光标

ChatGPT 能记住你探索过的内容,并为你建议下一步行动,无论是返回最近访问的页面、深入研究某个主题、发现相关灵感,还是将日常任务自动化。

个性化建议
当你有需要时,只需开口即可。
输入「重新打开我昨天看过的那些鞋子」或「整理一下标签页」,剩下的就放心交给 ChatGPT 吧。

随心所问

在你浏览网页时,你能看到什么、记住什么,完全由你掌控。
你可以清除特定页面的记录,清空全部浏览历史,或者打开无痕窗口临时退出 ChatGPT 登录状态。

如果你开启了浏览器记忆,ChatGPT 将会记住你浏览内容的关键细节,从而优化聊天回复并提供更智能的建议。
比如,根据你近期的活动创建待办事项清单,或基于你浏览过的商品继续研究节日礼物。
浏览器记忆属于你的 ChatGPT 账户隐私,并由你全权控制。
你可以在设置中查看所有记忆,归档不再需要的内容,或通过清除浏览历史来删除它们。
即使开启了浏览器记忆,你也可以随时通过地址栏的开关决定 ChatGPT 是否可以查看某个特定网站。
当页面可见性关闭时,ChatGPT 将无法查看该页面内容,也不会从中创建任何记忆。

默认情况下,OpenAI 不会使用你浏览的内容来训练模型,但你也可以选择开启。
家长控制功能同样适用,并且还添加了如关闭浏览器记忆和智能体模式等新的选项。

在 Atlas 中,你现在可以直接让 ChatGPT 采取行动,就在你的浏览器里为你完成各种任务。
此前 OpenAI 推出的 ChatGPT 智能体,现已正式原生集成于 Atlas 中,并且运行速度更快。
想象一下,你正计划一场晚宴,心中已有一份食谱。你可以把食谱交给 ChatGPT,让它帮你找到一家生鲜商店,将所有食材加入购物车,并下单送到你家。
在工作中,你可以让 ChatGPT 打开并阅读过去的团队文档,执行新的竞品调研,并将洞察汇总成一份团队简报。
当你提出请求时,ChatGPT 可能会询问是否可以打开标签页并执行点击操作来完成任务。你也可以直接选择智能体模式按钮,让 ChatGPT 开始行动。

在构建 Atlas 中 ChatGPT 的智能体能力时,OpenAI 增加了多重保障措施以应对新出现的风险,例如:
-
它无法在浏览器中运行代码、下载文件或安装扩展程序。
-
它无法访问你计算机上的其他应用程序或文件系统。
-
在金融机构等特定敏感网站上执行操作时,它会暂停,以确保你在监督其行为。
-
你可以在登出模式下使用智能体,以限制其对敏感数据的访问,并降低它以你的身份在网站上执行操作的风险。
ChatGPT 的智能体能力依然存在风险。除了在代表你行动时可能犯错外,智能体还易受隐藏恶意指令的操纵。
这些指令可能被藏匿在网页或电子邮件等地方,意图覆盖 ChatGPT 智能体的正常行为,可能导致从你已登录的网站窃取数据,或执行你非预期的操作。
总的来说,此次发布标志着我们正迈向一个全新的未来:
在这里,大部分网络活动都将通过智能体系统完成,你可以把常规工作都交给它处理,从而专注于真正重要的事情。
氛围编程(vibe coding)是 AI 辅助的起点,而 OpenAI 想通过 ChatGPT Atlas 让所有人都能过上 氛围生活(vibe lifing),享受 AI 伙伴随时介入带来的高效生活。

OpenAI 表示,Atlas 浏览器还在持续进化中,后续产品路线图中将包括:
-
支持 多用户配置文件,满足不同使用场景;
-
提升 开发者工具体验;
-
为使用 Apps SDK 的开发者提供更多方法,提升他们应用在 Atlas 中的 可发现性。

首先上场的是,Atlas 项目工程负责人 Ben Goodger,Atlas 项目产品负责人 Adam Fry,以及 Atlas 项目首席设计师 Ryan O’Rouke。

随后做介绍的是,Atlas 项目产品负责人 Pranav Vishnu,Atlas 团队工程师 Justin Rushing,以及 Agent 功能研发负责人 Will Ellsworth。

Ben Goodger 是本场直播出席人员中最值得介绍的一位。
拓展阅读:隐藏在浏览器背后 25 年的男人,被奥特曼找到了!OpenAI 剑指 Chrome 霸权

他是一位浏览器专家,从上世纪开始就开始专注浏览器开发工作。
从网景到火狐,再自 2005 年起加入谷歌开发 Chrome,他是除了当时的领导、也是如今的 CEO 劈柴哥之外,最接近「Chrome 之父」的一位对 Chrome 开发贡献最大的人员。
2024 年,他以谷歌副总裁的身份离开谷歌转投 OpenAI,全权负责 ChatGPT Atlas 的技术开发工作。

而如今 ChatGPT Atlas 经过一年半的孕育终于付梓,他难掩喜悦,招聘广告也接踵而至。


在 OpenAI DevDay 大会上,ChatGPT 负责人 Nick Turley 接受媒体采访时表示,他的灵感来自「浏览器正在重新定义操作系统的样子」。
他指出,浏览器已经彻底改变了人们在线工作的方式,而 ChatGPT 也正在引发类似的变革。
早在 2024 年 7 月,OpenAI 就低调发布过一款原型搜索引擎,名为SearchGPT。

但到了现在,AI 浏览器已经成为 AI 技术角逐的新前线。
今年夏季,AI 新锐公司 Perplexity 推出自家浏览器产品Comet,一度引发热议。
它主打「简化上网体验」,摒弃传统的谷歌搜索结果「长截图」,转而提供一个「答案引擎」:先给你几条相关链接,再直接用 AI 回答你的问题。
不仅如此,它还能:
扫描你所有打开的网页标签;总结视频内容;清理邮件收件箱;甚至能在 Amazon 上代你购物。

9 月,谷歌宣布将把自家的 Gemini AI 助手更深度集成进 Chrome 浏览器。
未来几个月,Gemini 将在 Chrome 中升级各种功能:

不过,谷歌目前尚未透露确切的上线时间。
随着 OpenAI 的 Atlas 正式登场,AI 浏览器之战正在升温。

当然,OpenAI 能否真正撼动全球超 30 亿用户的 Chrome 浏览器,还未可知。
目前来看,AI 浏览器在硅谷已成为炙手可热的风口,但它们在大众市场的影响力仍待检验。


<