Claude最新旗舰Opus 4.8发布。 距离上一版4.7只过了43天。 手快的网友@stevibe已经做出了两大版本pk演示。 自动播放 从测评结果来看,终端工程能力和知识工作上进步较大。 也有人补充了与Mythos已知数据的对比,Opus 4.8在部分能力上甚至超过Mythos。 官方特别强调,Opus 4.8可以长时间执行任务,人类不用经常回来检查它的工作。 多家早期测试企业也给出了反馈。
以“安全优先”定位的Anthropic,其核心开发工具Claude Code的网络沙箱在过去五个月里从未真正安全过。 独立安全研究员关傲男(Aonan Guan)5月20日发布最新研究,披露Claude ...