AI 圈的头条被 DeepSeek 承包了十几天,昨天,OpenAI 终于坐不住了,推出了全新推理模型系列 o3-mini。不仅首次向免费用户开放了推理模型,而且相比之前的 o1 系列,成本更是降低了 15 倍之多。 OpenAI 也称这是其推理模型系列中最新、最具成本效益的模型: 刚刚 ...
DeepSeek-TUI 不是 DeepSeek 官方产品,而是个人开发者基于 DeepSeek V4 开发的终端原生编程智能体。但它涨星的速度很快,吸引了国内外很多 AI 开发者的关注,短短几天时间就冲上了 GitHub Trending 前列,被很多开发者称为「DeepSeek 版 Claude Code」「国产 Codex CLI」或者更本土化的「鲸鱼」。
79位跨方向骨干、87%的初代留存率,和一套让年轻人围绕问题自由组队的机制。作者|周悦编辑|王博过去一年,围绕DeepSeek的人才流动消息一直没有停。从早期罗福莉离职,到初代大模型作者王炳宣、多模态骨干阮翀、R1核心作者郭达雅,相继跳槽。核心作者接 ...
GLM-5即将发布?我似乎又看到了DeepSeek的影子。 离春节不到一周,过去两年的经验告诉我们,国产AI新产品的爆发期又要来了。 Kimi K2.5在OpenRouter上一骑绝尘,Minimax也在官网上隐隐约约透露出M2.2的版本代号。
此次华为等国产芯片厂商与 DeepSeek 强强联合,在技术协同迭代、规模化产业落地、本土生态共建三大维度,都具有里程碑意义。此举有望打破英伟达长期主导的垄断生态,推动国内AI国产软硬一体、自主可控产业链发展。
编程王者Claude地位不稳了?? 大模型竞技场最新战报出炉,DeepSeek新版R1拿下网页编程第一,小胜Claude Opus 4。 要知道Claude Opus 4可是公认的“全球最强编码模型”。 so,能在编程上战胜Claude Opus 4,DeepSeek-R1-0528到底啥来头? 看名字你可能以为是个小版本更新,但 ...
当单一硬件设备的性能边界难以承载复杂模型的运行需求时,分布式架构通过将多个轻量化设备协同组网,构建起弹性可扩展的算力网络,突破物理硬件的性能边界,可实现高效运行大规模的模型。 distributed-llama 是一个用于将家用设备连接成强大集群以加速大 ...
有关Deepseek V4 要来的消息可以说是从去年炒到今年,本月真的要来了吗? 根据相关报道——DeepSeek创始人梁文锋近日在内部沟通中透露,DeepSeek V4将于4月下旬正式发布。 首先是,Deepseek 网页端出现疑似新模型测试痕迹。在4月8日,Deepseek 上线“专家模式”与 ...
星期五中午,本该是盘算周末去哪嗨的黄金时段。但没想到 DeepSeek 突然正式发布并开源了 V4 系列模型预览版。 即日起可在官网 chat.deepseek.com 或官方 App 体验,API 服务同步上线。 DeepSeek V4 登场,Agent 玩家迎来大狂欢 Agent 能力是此次升级最核心的方向。 V4-Pro 已 ...
2026 年 4 月 24 日,国产 AI 大模型领军者深度求索(DeepSeek)正式发布DeepSeek-V4预览版并同步开源,以原生 100 万 Token 上下文、混合专家 MoE 架构、全栈国产算力适配三大技术突破,彻底改写全球大模型产业格局。据斯坦福 HAI 最新《2026 人工智能指数报告》显示,全球 AI 产业已从单一模型能力比拼,转向模型、算力、应用、生态的系统化竞争,长文本处理 ...
“如果顶尖的AI模型被优化在华为芯片上运行,对美国而言将是‘可怕的后果’。” 这是英伟达CEO黄仁勋近期在一档播客节目中发出的警告。让他发出警告的对象,是即将发布新模型的中国AI公司DeepSeek。 让黄仁勋警惕的,并不是某个具体的模型能力,而是另一 ...