给 Code Agent 一个明确的数据文件,它往往能写出正确的分析代码。但如果把它放进一个包含 1000 + 文件的真实数据目录,只告诉它一句自然语言问题,不给文件名、不告诉路径、不提供 schema,它还能完成任务吗?中国人民大学的研究团队提出 ...
在人工智能领域,用“链式推理”训练小模型曾被视为提升其推理能力的突破口。这种方法的逻辑看似无懈可击:通过让模型学习大模型或程序生成的详细解题步骤,小模型便能“继承”推理能力,逐步掌握解题技巧。然而,一项独立研究通过精心设计的实验发现,这一方法存在根本性缺陷,尤其在处理需要回溯搜索的复杂问题时,小模型的表现会彻底“撞墙”。
针对这一问题,清华大学教授、上海人工智能实验室主任周伯文团队及其合作者提出了跨学科基准 NatureBench,用于评估 AI coding Agent 在 Nature 系列论文核心实验中的复现与改进能力。 结果显示,即使是实验中表现最强的 ...
2026申请季,美国留学竞争格局正在经历深刻变化。总申请人数达到1,429,747人,同比增长2%,申请总量突破940万份,人均提交6.59份申请。中国申请者约17,898人,同比仅微降3%,仍为最大国际生来源国。然而,TOP30早申平均录取率已降至13.1%,藤校整体早申录取率仅7.9%,创近五年新低。 更值得关注的是录取逻辑的转变。哈耶普斯麻对中国学生发放164枚录取,同比增长10.81%,创 ...
近日,《宝可梦》官方频道发布了一则全新视频。视频开篇并未展示任何宝可梦相关内容,而是罗列了围棋、国际象棋、将棋等品类的AI挑战案例,片尾抛出提问:AI是否准备进军宝可梦集换式卡牌(PTCG)领域。
谷歌DeepMind发布了Gemma 4 12B,把原本需要高端服务器才能跑的多模态智能,装进你的笔记本电脑里。 刚刚,谷歌DeepMind发布了Gemma 4 12B。 一句话概括这个模型的定位:把原本需要高端服务器才能跑的多模态智能,装进你的笔记本电脑里。 它填补的是Gemma家族里一个 ...
新华社客户端重庆4月12日电(戴好、杨文艳)近日,全球知名数据科学竞赛平台Kaggle举办的一项挑战赛落下帷幕。重庆邮电大学本科生王世成、刘洋携手美国算法工程师杰克组建的团队脱颖而出,获得赛事金牌,在全球2673支参赛队伍中位列第六。 据悉,Kaggle ...
4月10日,记者从两江新区获悉,日前,在ICDAR 2026-CircleID:Writer Identification(圆圈书写者身份识别)全球挑战赛上,两江新区企业重庆亲笔签数字科技有限公司(以下简称亲笔签)团队在113支队伍的角逐中脱颖而出,获得世界第一。 本次赛事在全球顶级数据科学 ...
仅凭“一个圈”就能识别书写者身份 重庆亲笔签团队斩获全球挑战赛第一 4月10日,记者从两江新区获悉,日前,在ICDAR 2026-CircleID:Writer Identification(圆圈书写者身份识别)全球挑战赛上,两江新区企业重庆亲笔签数字科技有限公司(以下简称亲笔签 ...
人民网重庆4月10日电 (刘政宁、周小平)近日,在全球顶级数据科学竞赛平台Kaggle与Deep Past Initiative团队联合举办的“Deep Past挑战赛”中,重庆邮电大学人工智能学院2023级本科生王世成、刘洋携手美国IGS Energy公司算法工程师Jack Van Dyke组成的“M&J&M”团队,从 ...
近日,在全球顶级数据科学竞赛平台Kaggle与Deep Past Initiative团队联合举办的“Deep Past 挑战赛——将古阿卡德语(楔形文字)翻译成英语”赛事中,重庆邮电大学人工智能学院2023级本科生王世成和刘洋携手美国IGS Energy公司算法工程师Jack Van Dyke组成的团队摘得金牌 ...