Python 2 vs Python - 搜索 News

19 小时

对比了 Gemini 和 Sonnet 4.5，我才知道 MiniMax M2.1 写代码这么强

MiniMax-M2.1 在 VIBE 综合榜单中表现卓越，以平均 88.6 分的成绩展现了接近Claude Opus 4.5的全栈构建能力，并在几乎所有子集上都显著优于Claude Sonnet 4.5。很多模型都是能写 Java，也能写 ...

12 小时

致敬经典！手搓3D版《Attention Is All You Need》，M2.1只用了3分钟

我们决定不写一行代码，仅凭自然语言，让 M2.1 手搓一个 3D 交互版的《Attention Is All You Need》论文主页。同时，为了验证它是否真的具备从视觉审美到工程硬实力的全栈能力，我们还准备了两道硬核关卡：Zotero 智能学术中台与 Go 语言高并发 arXiv 论文雷达。

15 小时

大模型智障检测+1：Strawberry有几个r纷纷数不清，最新最强Llama3.1也傻了

单个字符对大模型来说意义有限，使用GPT系列的Llama系列的tokenizer就会发现， 20个字符的问题，在不同AI眼中是10-13个token。

腾讯网

GPT-5争议、开源追赶、能力飞跃：Epoch AI年终报告揭示AI能力加速

顶尖国际模型如GPT、Gemini在专家级数学难题FrontierMath上表现优异，但在真正高难度问题面前仍未满分，显示出推理能力仍有提升空间。与此同时，AI推理能力和强化学习的进步让增长速度几乎翻倍，成本大幅下降，许多模型已能在消费级硬件上运行。

腾讯网

字节Seed发布最强数学模型：一招“打草稿”，IMO银牌变金牌

这一成绩与7月官方认证的IMO金牌“选手”谷歌Gemini打平。而字节自己的前代模型，当时的成绩是3天完成了6道题目中的4道，以及一道题的部分证明，达到银牌成绩。值得关注的是，Seed Prover ...

9 小时

利用BLE和Wi-Fi三角定位进行实时室内追踪

为了实现这一点，我们可以使用小型、紧凑的BLE或Wi-Fi板。一个很好的例子是 Indusboard ，它内置了Wi-Fi，还有加速度计和磁力计。这不仅有助于追踪移动，还提供实时方向信息。

13 小时

6个月收入狂揽700万，17岁高中生开发一个新AI应用爆火，网友：别 ...

相较而言，Blake Anderson 的经历更为丰富，一年前他还不懂编程，便用零资金建立了一个价值 700 万美元的应用程序帝国。2023 年，Blake Anderson 经历过一系列失败之后，他决定全力投入移动应用，为此他还剃了头让自己变得更丑，以消除社交干扰……并学习使用 ChatGPT 编码。