2026年3月4日,GitHub上发生了一件让整个技术圈集体沉默三秒的事情。 一个开源项目,以28万Stars的成绩,正式超越了Facebook用十年时间打造的React框架,成为GitHub历史上Stars最多的软件项目之一。这个项目从第一行代码推送到GitHub,到超越React,总共用了不到60天。 这个项目叫OpenClaw。一只龙虾。 与此同时,就在这只龙虾刚刚超越React的几周前,它 ...
人工智能领域的发展速度往往让预测显得保守,但当我们把目光投向即将到来的 GPT-5 时代,特别是传闻中的 GPT-5.4 版本时,两个关键词显得格外耀眼:原生电脑操控(Computer Use)与深度 Thinking 模式。这不再仅仅是关于“更聪明的聊天机器人”,而是关于 AI 如何从“对话者”进化为真正的“操作者”。 许多开发者还在为如何优化 Prompt 绞尽脑汁,OpenAI 似乎正准备掀 ...
而很多当前的 GUI Agent 缺少的正是这一层。它能识别界面、能理解指令,却仍然主要依赖真实交互去排除错误路径。也就是在环境里不断试错,直到碰到正确步骤。换句话说,它更像是在反应,而不是在决策。
【新智元导读】GPT-5.4,已经把白领桌面一口吞下!1M上下文,原生Computer Use,Excel直接变身数据分析平台;超越麦肯锡,取代投行律所咨询公司不是梦。白领工作,要被AI彻底颠覆了吗?
智通财经APP获悉,国金证券发布研报称,GPT-5.4的发布标志着AI从“对话生成”向“任务执行”的关键跃迁,通过原生Computer Use、Tool ...
就在刚刚,OpenAI 头号竞争对手 Anthropic 推出了 “computer use” 功能,让 Claude 能够像人类一样操作电脑了!看屏幕、动光标、点按钮、打字等。通过 API,开发者可以让 Claude 将指令翻译成计算机指令,从而解放一些枯燥的重复性流程任务。 一、西方的Anthropic 的 ...
全球领先的金融科技公司Klarna曾说过,他们用OpenAI的AI Agent在一个月内接管了三分之二的客服工作,相当于700名全职员工的工作量。这是企业级AI Agent落地最常被引用的案例,但要注意一个细节:Klarna用的是经过严格安全审查的商业API,不是一个把最高系统权限开放给外部的开源工具。
IT之家 10 月 8 日消息,谷歌正在预览一款全新的 Gemini 人工智能模型,该模型旨在通过浏览器浏览网络并与之交互,使 AI 智能体能够在原本为人而非机器人设计的用户界面中执行操作。这款名为“Gemini 2.5 计算机使用”(Gemini 2.5 Computer Use)的模型,利用“视觉 ...