研究对象本质上是 Claude Code 的“显性偏好”,而这些偏好可能来自训练数据频率、强化学习调整和系统提示,而不一定代表工具本身更好。 报告还提醒,这项测试主要覆盖 Java 和 Python ...
前几天,Anthropic 开源了 claude-desktop-buddy,用一块小屏幕显示 Claude Code 里 Buddy 的状态。我看到后想:手头刚好有一块 M5Paper ...
随着 AI coding agent 从 “辅助写代码” 走向 “直接执行开发操作”,模型开始被赋予修改代码、部署服务等真实运维权限。为减少频繁人工确认带来的打断,Anthropic 近期为 Claude Code 推出 Auto Mode,希望通过自动分类代替用户审核操作。 然而,当用户指令本身存在权限上的歧义时,Auto Mode 是否真的能够稳定替代人工审核?香港科技大学与 ETH Zuri ...
今年开年以来,“MCP”可以说一路被硅谷大佬们炮轰,就在昨天,Anthropic 的回应终于来了! 4 月 19 日,Anthropic 技术工程师 David Soria Parra 在参与了“AI ...
2026年4月17日,估值数百亿的设计巨头Figma,股价瞬间闪崩。 凶手不是另一款更炫酷的设计软件,而是曾经亲密的合作伙伴Anthropic,刚刚发布的Claude Design。
作者 | Steef-Jan Wiggers译者 | 张卫滨Cloudflare 近期推出了 Dynamic Worker 的公开测试版,面向所有付费 Workers 用户开放。该 API 允许 Cloudflare Worker ...
去年这个时候,一位以色列程序员正在东南亚旅行。他顺手把一个在脑子里转了很久的想法做成了产品,一个让任何人都能用自然语言“说出”自己想要的软件,然后AI直接帮你把它做出来的平台,数据库、登录系统、数据存储全部自动配好,不需要写一行代码。他把它叫做base44。 四个月后,这个平台有了25万用户,单月盈利接近20万美元。六个月后,网站建设巨头Wix用8000万美元现金把它买走了。 后来这个故事在国内社 ...