有开发者用最简单粗暴的方式创建了一个 Claude Code 插件,让它能够理解视频(包括声音)。 通过 ffmpeg 提取视频帧,然后使用另外的后端模型(Gemini API、本地 Whisper 或 OpenAI API)处理音频。 最终 Claude Code 接收到图像帧,和带有时间戳的音频转文本,理解了视频。
一家依靠开源生态快速构建起自己产品生态的公司,却在做大后反手封锁开发者的开源项目。3D打印机巨头拓竹科技正在遭受到海外开源社区的集体抗议。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果