“基座模型的性能,就是模型厂商的竞争力。”DeepSeek的掀桌,让模型行业迅速拉齐了这一共识。其中,颇具火药味的一幕发生在2025年7月。为了争夺全球开源模型的SOTA的位置,各个玩家都使出了浑身解数。
2026年AI界的开年大戏,不是来自硅谷的某次发布会,而是来自中国金融圈最神秘的角落——量化私募。 就在元旦期间,量化巨头九坤投资(Ubiquant)突然甩出一张王炸,宣布开源旗下的代码大模型 ...
钛媒体APP on MSN

DeepSeek上新mHC,R2还远吗?

实际上,此前DeepSeek推迟R2发布时,即有分析称缺少英伟达芯片是原因之一。如果这种架构规模化铺开,英伟达的生态短期内会得到优势强化,国产芯片则需着力强化编译层的适配。而长期来看,供应mHC架构的AI芯片需要提升存储带宽,并转向更加精细化的设计。
作者实践经验证明结合这两个工具,通过OpenCV实验大师工作流的精准专业提示词以后,DeepSeek Code Lite 14B模型生成的代码无论是C++ 还是Python语言,几乎都不用修改,直接使用。 如果不用OpenCV实验大师工作流的精准专业提示词 直接自然语言描述,则生成的代码多数 ...
🚀在单卡A100-40G上,可达每秒约2500 Token,跑得飞快。 🧠在保持97% OCR准确率的前提下,可将视觉上下文压缩至原来的1/20 ...
昨天,DeepSeek 发布了一个新模型DeepSeek-OCR。 这是一个专门为 OCR(文字识别)微调的 6.6GB 模型,主要贡献在于首次量化 “视觉 - 文本 token 压缩比”,验证 10× 近无损压缩、20× 仍保有 60% 精度的可行性;提出 DeepEncoder,解决现有编码器 “高分辨率 - 低内存 - 少 ...
2025 年 1 月 27 日,除夕凌晨 1 点,当中国人都在准备迎接农历新年时,大洋彼岸的美国却发生了一件让硅谷震惊的事 —— 一款来自中国的 AI 应用 DeepSeek 突然登顶美国 App Store 免费榜,超越了 ChatGPT、Google Gemini 等美国科技巨头的产品。这个看似不起眼的中国应用 ...
轻松使用 DeepSeek 网页版,快速稳定、不卡顿,支持 DeepSeek R1 满血版 以及 ChatGPT o1、o3 大模型 本指南提供最全面的 DeepSeek 使用指南,包含 DeepSeek 官网入口、DeepSeek 网页版、deepseek 下载、DeepSeek 平替网站,助您顺畅使用 DeepSeek~ DeepSeek 是由深度求索(DeepSeek)自主 ...
最新发布的 DeepSeek R1 满血版不仅在性能上媲美了 OpenAI 的 o1、o3,且以对手 3% 的超低成本实现了这一突破。