deepseek - 搜索 News

格隆汇 on MSN

DeepSeek将发布具备强劲编程能力的下一代旗舰AI模型

格隆汇1月9日｜据两位知情人士透露，中国AI初创公司DeepSeek预计将在未来几周内推出其具有强大编程能力的下一代AI模型。这款名为V4的新模型是DeepSeek在2024年12月发布的V3模型的继任者。

7 天

DeepSeek近日发布论文，阐述了一种更为高效的人工智能开发方法。该论文由创始人梁文锋参与撰写，提出了名为“流形约束超连接”（mHC）的框架。作者称，该框架旨在提升可扩展性，同时降低训练先进人工智能系统的算力和能源需求。DeepSeek下一代旗舰系 ...

作者｜周一笑邮箱｜[email protected]年的第一天，DeepSeek 在 arXiv 上发布了一篇新论文《mHC: Manifold-Constrained Hyper-Connections》，提出了名为 ...

9 小时

期刊发表后同步更新预印本，在学术界是常规操作。但从22页扩到86页、内容量翻近四倍，这种幅度的更新相当罕见。某种程度上，DeepSeek把一篇论文做成了一份技术全书，它想让所有人都能复现R1，而不只是读懂R1。

智东西1月1日报道，昨日晚间， DeepSeek 团队送出一份新年“贺礼”，正式发布新论文《Manifold-Constrained Hyper-Connections》，提出一种能稳定训练并提升大模型可扩展性的残差连接新方案。

2 天

老黄主旨演讲上，中国大模型Kimi K2、DeepSeek V3.2，以及Qwen赫然上屏，位列全球开源大模型前列，性能正在逼近闭源模型。而且，DeepSeek-R1、Qwen3 和 Kimi K2 ...

7 天

在被AI连续轰炸的5月，DeepSeek一跃成名。起因是他们发布的一款名为DeepSeek V2的开源模型，提供了一种史无前例的性价比：推理成本被降到每百万token仅 1块钱，约等于Llama3 70B的七分之一，GPT-4 Turbo的七十分之一 ...

DeepSeek引发的冲击波仍在持续：不仅多个平台宣布接入DeepSeek，各个行业也密集搭上这趟“快车”。尽管DeepSeek通过优化算法显著降低算力需求，但因其高性价比助推AI普及，使得算力需求反而呈现指数级膨胀。对于国内算力产业而言，DeepSeek的创新带来了一个可以 ...

InfoQ中国 on MSN

DeepSeek发布DeepSeek-V3.2，这是一个开源的推理和代理AI模型家族。在多项推理基准测试中，其高性能计算版本DeepSeek-V3.2-Speciale表现优于GPT-5，与Gemini-3.0-Pro相当。

近日，国内通用大模型DeepSeek以燎原之势在全球各个领域迅猛发展，也为教育行业的高质量发展带来了新的巨大机遇。目前，清华大学、浙江大学、上海交通大学、华中科技大学、武汉大学、北京航空航天大学等国内多所高校纷纷宣布，已经完成DeepSeek系列大 ...

DeepSeek此次招聘的薪酬待遇极为优厚，正式员工岗位大多采用“14薪”模式，起薪普遍超过2万元，部分高端岗位年薪可达百万元级别。近期，全球爆火的AI应用DeepSeek正在大规模招聘人才，登上热搜。资料显示，DeepSeek运营主体为杭州深度求索人工智能基础技术 ...

一些您可能无法访问的结果已被隐去。