Perplexity launches Bumblebee: How its new read-only dev scanner differs from Chainguard ...
最近团队在推进“测试智能体”落地,我基于 Playwright 封装了三个核心 AI Agent,分别负责 用例生成、自动执行与自愈、结果断言分析。三者在工作流中协作,让 Web 自动化测试的编写与维护成本降低了约 60%。下面是完整实操记录,所有命令均可直接复现。 一、整体架构 Agent 1 – 用例生成器:根据自然语言需求或 Swagger 文档,调用 RAG + Playwright 代码 ...
当 AI 帮你写 SQL、做分析的时候,谁来判断它做得对不对?今天聊聊大模型领域的“裁判模型”如何让数据 Agent 不再是“薛定谔的准确”。 扒完Claude的125个隐藏设置:18个真正能改命的开关,4个连官方文档都没收录。 Anthropic 给 Claude Code 的 settings.json 塞了 125 ...