cot - 搜索 News

3 天

全面超越CoT，Meta田渊栋团队新作：连续思维链

针对大语言模型的推理任务，近日，Meta田渊栋团队提出了一个新的范式：连续思维链，对比传统的CoT，性能更强，效率更高。近日，Meta田渊栋团队提出了针对LLM推理任务的新范式：Coconut（ Chain of Continuous ...

腾讯网

刚刚，OpenAI发布CoT监控，增强AI Agent自主能力

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！今天凌晨，OpenAI发布了最新技术论文思维链（CoT）监控，用来监督AI Agent等AI系统使得它们的自主性更强。

20 天

让大模型不再过度思考！上海AI Lab后训练新范式重塑CoT，推理又快又好

近年来，随着o1、DeepSeek-R1等模型的爆发，Long Chain-of-Thought（Long CoT）已成为提升LLM复杂推理能力的标配。然而，“长思考”并非总是完美的。我们常发现模型会陷入 “过度思考”（Overthinking）的陷阱：为了得出一个简单的结论，模型可能会生成数千个冗余Token，甚至在错误的路径上反复横跳（Backtracking）。这不仅浪费了宝贵的算力，还增 ...

腾讯网

为什么你用AI编程总拿不到想要的结果？北航研究揭秘：50%问题来自 ...

现在几乎所有主流的代码生成工具都在用CoT。但问题来了：这些"思考步骤"真的可靠吗？来自北京航空航天大学的研究者们发现，虽然CoT提升了性能，但关于这些中间推理步骤的质量，学术界竟然没有系统性的研究！为此他们分析了1,023个AI生成的代码案例，结果 ...

36氪

生图加入CoT，性能提升80%，微软港中文打造天才画手

微软港中文ImageGen-CoT技术通过思维链推理提升AI绘画性能80%。【导读】AI绘画总「翻车」，不是抓不住重点，就是细节崩坏？别愁！微软和港中文学者带来ImageGen-CoT技术，让AI像人一样思考推理，生成超惊艳画作，性能提升高达80%。 AI绘画火爆的当下，大家都有过 ...

新浪网

将思维链（CoT）引入具身世界，哪种路径能真正打通机器人的“知行 ...

大模型处理复杂问题时，它越来越倾向于生成一个推理链条。这条链，把一个复杂问题，拆解成多个推理环节，一步步得出结论。支撑这种推理能力的，是一种被反复验证的技术路径：思维链（Chain of Thought，简称 CoT）。这项技术并不新，本质上是一种提示工程 ...

来自MSN

最强o1也刚刚及格！中科大等团队测试视频CoT推理能力：多数模型不及格

视频理解的CoT推理能力，怎么评？中科大等团队提出了评估基准——VCR-Bench，里面包含七个独立评估维度的任务框架，每个维度针对性地考察模型的不同能力（如时空推理、因果推断等）。为确保评估的全面性和可靠性，每个维度都设计了100余条高质量样本。

来自MSN

数学视觉推理新突破：CUHK多媒体实验室的MINT-CoT如何让AI更好地理解 ...

2025年6月5日，香港中文大学多媒体实验室（CUHK MMLab）的研究团队发表了一项突破性研究。由陈欣燕和张仁瑞共同第一作者领导的团队提出了MINT-CoT，一种全新的方法，旨在改进人工智能在处理数学视觉问题时的推理能力。这项研究已在arXiv上发布（arXiv:2506.05331v1 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果