自建成本的确可以快速下降。“对比官方可以降大概七成,相当于打了三折。”与此同时,错误率也有明显降低。夏达说,即便是官方调用也有对应的错误率,而中转站据他们测算普遍调用错误率在15%-20%,经团队自己调校后,可以控制在5%左右。
在DeepSeek首次官宣降价的次日(4月26日), DeepSeek-V4-Flash的调用量为814亿Token,较前日环比增长62.2%。DeepSeek-V4-Pro的调用量为96亿Token,不及前日。
国家数据局数据显示,我国Token日均调用量从2024年初的1000亿,一路跃升至2025年末的100万亿,到今年3月底已突破140万亿,两年间增长超千倍。Token调用规模的飞速增长,标志着AI产业正式进入了应用兑现阶段。
这类第三方AI中转站的Token往往比Kimi、智谱、DeepSeek的官方价格便宜一半以上,看起来相当有竞争力。然而世界上没有天上掉馅饼的好事,第三方AI中转站的Token很烫手。 日前,来自加州大学圣芭芭拉分校和圣地亚哥分校的研究团队发现,市面上的第三方AI中转站安全性堪忧。
如果你正在使用 Claude Code 却未加优化,你可能正在浪费高达 80% 的上下文窗口。上下文窗口是 AI 时代的 RAM,浪费它不仅意味着账单激增,更意味着 AI 逻辑能力的过早衰退。 以下是 10 个能够拯救你 API ...
近期,中国大模型周Token调用量连续多周领先全球,国产模型凭借显著的价格优势在全球开发者市场获得关注,“Token出海”正成为中国AI产业的热门议题。然而,作为Token在云端流动的物理根基,算力基础设施的出海路径选择呈现出差异化特征,折射出中国云厂商在全球化进程中的战略分野与深层考量,是重资产持有算力基础设施,还是轻资产输出算力服务能力?两种路径的选择,正在塑造截然不同的出海图景。 过去一年, ...
全球最大人工智能(AI)模型API聚合平台OpenRouter最新数据显示,3月16日至3月22日,全球AI大模型总调用量为20.4万亿Token,环比增长20.7%。 科技日报记者注意到,上榜前十的AI大模型中,中国AI大模型的周调用量为7.359万亿Token,较此前一周上涨56.9%;美国AI大模型周 ...
什么值得买社区频道 on MSN
GPT-5.5来了,Token成本降35倍!AI助手时代真要来了?
OpenAI今天凌晨发布了GPT-5.5,标题一个比一个吓人——"迄今最强""全榜第一""碾压C ...
小米MiMo模型API平台开放充值!国内输入仅0.7元/M tokens,新老用户可领免费额度。专为AI智能体设计的309B MoE模型,推理成本低至Claude 4.5的2.5%,速度提升2倍! 小米 MiMo API 平台今天开放了充值功能,近期将上线计费系统。 输入(命中缓存):0.01 美元 / M tokens 输出 ...
梁文锋又出手了,而且还是二连降价。 4月25日,DeepSeek-V4-Pro开启限时2.5折优惠,输入价格(缓存命中)降至0.25元/百万tokens。 业内还没反应过来呢,结果4月26日晚间,DeepSeek就再次降价。
智谱管理层在电话会议中明确提到,当前API服务ARR约为2.5亿美元,预计年底可以达到10亿美元。未来,公司也将更加侧重标准化API服务。到2026年,API服务与本地化部署预计各占一半;再往后2-3年,重心将进一步向API倾斜。
14 天on MSN
DeepSeek API升级百万Token上下文 知识库同步更新至2025年5月
DeepSeek近日完成了一项关键技术升级,其API服务正式支持百万Token级别的上下文处理能力。这一突破性进展使得模型能够处理更长的文本序列,显著提升了对话的连贯性和信息承载量。此前该系统的上下文窗口仅能容纳128k tokens,此次升级后用户可体验到更流畅的长文本交互效果。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果