Python and Deepseek - 搜索 News

o3-mini 碾压DeepSeek R1？一条python程序引发近400万围观

AI 圈的头条被 DeepSeek 承包了十几天，昨天，OpenAI 终于坐不住了，推出了全新推理模型系列 o3-mini。不仅首次向免费用户开放了推理模型，而且相比之前的 o1 系列，成本更是降低了 15 倍之多。 OpenAI 也称这是其推理模型系列中最新、最具成本效益的模型：刚刚 ...

腾讯网

DeepSeek还有多少个“郭达雅”？扒完27篇论文，我们发现了一群 ...

79位跨方向骨干、87%的初代留存率，和一套让年轻人围绕问题自由组队的机制。作者｜周悦编辑｜王博过去一年，围绕DeepSeek的人才流动消息一直没有停。从早期罗福莉离职，到初代大模型作者王炳宣、多模态骨干阮翀、R1核心作者郭达雅，相继跳槽。核心作者接连被挖，DeepSeek的技术壁垒会不会松动？我们决定换一种方式来看这个问题。我们用Codex和Python，梳理了DeepSeek近两年发布的27篇 ...

新浪网

网页编程众测排名：DeepSeek-R1超越Claude 4加冕全球第一

编程王者Claude地位不稳了？？大模型竞技场最新战报出炉，DeepSeek新版R1拿下网页编程第一，小胜Claude Opus 4。要知道Claude Opus 4可是公认的“全球最强编码模型”。 so，能在编程上战胜Claude Opus 4，DeepSeek-R1-0528到底啥来头？看名字你可能以为是个小版本更新，但 ...

腾讯网

DeepSeek 本地部署指南（基于 vLLM）

这个指南对新手来说相当详细了，但有几个难点需要特别注意：1. Python 环境配置，尤其是版本选择和验证安装；2. ModelScope 的安装和使用，特别是模型下载的路径设置；3. vLLM 的安装和虚拟环境的使用，以避免包冲突；4. 启动 vLLM 推理服务时的参数设置，特别是 GPU 设备 ID 和最大上下文长度的调整 ...

3 个月

GLM-5架构细节浮出水面：DeepSeek仍是绕不开的门槛

GLM-5即将发布？我似乎又看到了DeepSeek的影子。离春节不到一周，过去两年的经验告诉我们，国产AI新产品的爆发期又要来了。 Kimi K2.5在OpenRouter上一骑绝尘，Minimax也在官网上隐隐约约透露出M2.2的版本代号。

8 个月

DeepSeek突然拥抱国产GPU语言，TileLang对标CUDA替代Triton，华为昇腾Day0官 ...

首先，TileLang是一种专门用来开发GPU内核的领域专用语言，性能上可以对标英伟达CUDA ，DeepSeek官方推荐使用此版本做实验，在方便调试和快速迭代上有优势。

凤凰网

DeepSeek V4最全解读：首发华为芯片，超高性价比！国产AI打破英伟达垄断

星期五中午，本该是盘算周末去哪嗨的黄金时段。但没想到 DeepSeek 突然正式发布并开源了 V4 系列模型预览版。即日起可在官网 chat.deepseek.com 或官方 App 体验，API 服务同步上线。 DeepSeek V4 登场，Agent 玩家迎来大狂欢 Agent 能力是此次升级最核心的方向。 V4-Pro 已 ...

13 天

打破偏见！Java做AI不是不行，是2026年最被低估的红利

长久以来，行业里一直有个固有认知：AI是Python的主场，Java做AI笨重、生态弱、落地难。很多Java企业团队看着AI浪潮席卷各行各业，要么束手观望，要么被迫切换Python技术栈重构系统，不仅成本高昂，还面临技术断层、人才适配等诸多风险。但进入2026年，随着Spring生态正式接入DeepSeek，这个刻板印象被彻底打破。这不仅是一次简单的技术适配，更是Java生态全面AI化的标志性信 ...

电子工程专辑

DeepSeek技术之GRPO算法（附面试问答题几则）

导读：DeepSeek的训练用到了自研的强化学习算法GRPO，它由OpenAI发明的强化学习算法PPO发展而来。DeepSeek的GRPO算法和OpenAI的PPO算法有何区别？这两种算法相比有何优缺点？为什么DeepSeek要使用GRPO算法而不是PPO算法？本文对这些问题进行解答。本文先简要回顾PPO算法 ...

搜狐

DeepSeek-V4发布，黄仁勋的担忧成真了

“如果顶尖的AI模型被优化在华为芯片上运行，对美国而言将是‘可怕的后果’。” 这是英伟达CEO黄仁勋近期在一档播客节目中发出的警告。让他发出警告的对象，是即将发布新模型的中国AI公司DeepSeek。让黄仁勋警惕的，并不是某个具体的模型能力，而是另一 ...

电子工程专辑

为什么说 DeepSeek V4 不一样？看完你就懂了

DeepSeek（深度求索）是一家成立于2023年的中国AI研究公司，总部位于杭州，由对冲基金幻方科技创始人梁文锋领导。在短短三年内，这家公司从一个鲜为人知的研究团队成长为撼动全球AI格局的核心力量。 DeepSeek V3作为671B参数的MoE模型，凭借极低的训练成本（约 ...

爱范儿

一文看懂 DeepSeek 刚刚开源的 FlashMLA，这些细节值得注意

使用微信扫码将网页分享到微信今天开始，我们正式进入 DeepSeek 开源周。 DeepSeek 开源项目第一弹 FlashMLA，已经在极短的时间内发酵到全网了，短短几个小时，该项目就已经收获了超过 3.5K Star，且还在不断飙升。虽然 FlashMLA 里的每个字母都认识，连在一起就看 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果