这是一个非常适合展示 tabular 建模全流程的项目:有真实业务目标、有类别/数值混合特征、有 OOF 验证、有 Optuna 调参、有多 ...
给 Code Agent 一个明确的数据文件,它往往能写出正确的分析代码。但如果把它放进一个包含 1000 + 文件的真实数据目录,只告诉它一句自然语言问题,不给文件名、不告诉路径、不提供 schema,它还能完成任务吗?中国人民大学的研究团队提出 ...
本仓库是《人工智能》课程论文“基于线性回归算法的房价预测模型复现与分析”的配套代码。基于 Kaggle 房价数据集,实现数据清洗、特征选择、多元线性回归建模、模型评估与可视化,最终生成可提交至 Kaggle 的预测结果。 本项目复现了经典的多元线性回归 ...
当前,中等规模含噪声量子计算(NISQ)已步入硬件快速迭代阶段,但量子比特固有的退相干、串扰、控制误差等非马尔可夫噪声,仍是制约量子算法实用化与量子纠错(QEC)规模化部署的核心瓶颈。传统量子噪声建模多依赖解析物理方程与简化假设,难以完整刻画真实芯片 ...
8 天on MSN
AI“照葫芦画瓢”却难解推理难题:链式推理的边界究竟在哪?
在人工智能领域,用“链式推理”训练小模型曾被视为提升其推理能力的突破口。这种方法的逻辑看似无懈可击:通过让模型学习大模型或程序生成的详细解题步骤,小模型便能“继承”推理能力,逐步掌握解题技巧。然而,一项独立研究通过精心设计的实验发现,这一方法存在根本性缺陷,尤其在处理需要回溯搜索的复杂问题时,小模型的表现会彻底“撞墙”。
13 天on MSN
《宝可梦》卡牌迎来AI对决,赛程规则特殊,拒绝算力氪金内卷
近日,《宝可梦》官方频道发布了一则全新视频。视频开篇并未展示任何宝可梦相关内容,而是罗列了围棋、国际象棋、将棋等品类的AI挑战案例,片尾抛出提问:AI是否准备进军宝可梦集换式卡牌(PTCG)领域。
老伙计们,最近PTCG圈子里可是炸开锅了!宝可梦官方这次玩了个大的,不仅仅是普通的卡牌赛事,他们直接悬赏30万美元,要找全球的AI高手来打造“最强AI牌手”,让AI之间来一场真刀真枪的卡牌对决。这可不是什么小打小闹,我跟你说,这事儿的意义,不亚于当年 ...
针对这一问题,清华大学教授、上海人工智能实验室主任周伯文团队及其合作者提出了跨学科基准 NatureBench,用于评估 AI coding Agent 在 Nature 系列论文核心实验中的复现与改进能力。 结果显示,即使是实验中表现最强的 ...
“人类智慧终能战胜AI。”计算与智能创新学院教授肖仰华在朋友圈写下这句话时,他教授的“数据挖掘技术”课程刚刚结束一场特殊的期末考试。
每一个创建 LLMs.txt 的公司,比如 Anthropic、Stripe、Cloudflare,都不得不回答一个问题:如果 AI 只有 10 秒,并且上下文有限,它 ...
2026申请季,美国留学竞争格局正在经历深刻变化。总申请人数达到1,429,747人,同比增长2%,申请总量突破940万份,人均提交6.59份申请。中国申请者约17,898人,同比仅微降3%,仍为最大国际生来源国。然而,TOP30早申平均录取率已降至13.1%,藤校整体早申录取率仅7.9%,创近五年新低。 更值得关注的是录取逻辑的转变。哈耶普斯麻对中国学生发放164枚录取,同比增长10.81%,创 ...
今天,我们正式发布Gemma 4 12B,这是我们最新推出的模型,旨在将具备智能体能力的多模态智能直接带到笔记本电脑上。Gemma 4 12B填补了轻量级E4B模型与更强大的26B混合专家(MoE)模型之间的空白,在显著降低内存占用的同时,保留了强大的处理能力。值得一提的 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果