Andrej Karpathy 又放大招了! 他刚刚发布了一个名为 nanochat 项目,用 8000 行代码实现了 ChatGPT 的完整训练流程。 在一个 8xH100 节点上跑 4 小时,花费约 100 美元,你就能拥有一个能对话、写故事、答题的 AI 助手。 这个项目延续了 nanoGPT 的极简哲学,但覆盖范围更广 ...
这句话之所以流行,其实不难理解。 在图像生成这类任务上,扩散模型确实交出了更好看的结果,细节更丰富,也更稳定。在大模型、大数据成为常态之后,这种优势就被进一步放大了。 但如果你真的去看现实世界里的产品,会发现事情没这么简单。 像 Stable ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果