首页 > 百姓社区 > 百姓社区 > 首个全自动AI科学家诞生!西湖大学最新成果,性能超越人类

首个全自动AI科学家诞生!西湖大学最新成果,性能超越人类

发布时间:2025-10-09 16:49:12来源: 13899775532

人类科学家三年的工作量,如今AI两周就能轻松搞定!

最近,来自西湖大学的自然语言处理实验室发布了DeepScientist系统,这也是首个具有完整科研能力,且在无人工干预下,展现出目标导向、持续迭代、渐进式超越人类研究者最先进研究成果的AI科学家系统。



△对比DeepScientist与人类专家的研究进展

在AI文本检测任务中,DeepScientist仅用两周时间就实施和验证了超过1000种不同的假设,在此期间取得了相当于人类三年的进展。

在RAID数据集测试中,DeepScientist设计的方法实现了7.9%的AUROC提升,成功超越了人类现有SOTA方案

另外DeepScientist还在智能体失败归因、LLM推理加速等任务上也分别达成了新的SOTA。



下面是更多详细内容介绍。

 

从“科研助理”到“首席科学家”:AI科研模式的变革

 

过去的AI Scientist系统,如果不给定一个清晰明了的科研目标,就很容易陷入对现有知识的机械组合与无效试探的窠臼中,最终形成的科研产出在人类专家看来缺乏焦点,科学价值不高。

它们更像是能力超群的科研助理,而不是能独立指引方向的科学家。

DeepScientist的出现改变了这一现状,它不再等待人类告诉它“研究什么”,而是开始主动思考“什么值得研究”,它可以:

 

  • 主动识别前沿研究的根本性局限,
  • 提出全新的科学构想以解决局限性问题,
  • 自动编写代码、执行实验、设计分析实验,整理实验结果,
  • 撰写结构完整的科研论文,开源可重现代码。

 

简而言之,这种从“随机发现”到“长期主动式探索”的角色转变,标志着AI已经正式涉足以往只有顶尖人类心智才能胜任的、最具创造性的科学发现过程。

百姓社区更多>>

一场81-60,全运会男篮首枚奖牌诞生,辽宁第四,四川登上领奖台 高校保洁阿姨手搓银杏叶周边,校园秋景美出圈! 再破纪录!全运会男子200自:张展硕夺金,潘展乐摘铜,孙杨犯规 微信视频通话藏3个“神仙功能”!90%的人都没用过,实用到哭 离婚证背面竟印着“囍”字?网友炸锅:这是祝福还是讽刺? 五菱之光 EV 电动房车现身工信部,外观内饰证件照公布 当双十一娱乐营销开始降级,淘宝京东们该往哪砸钱? 特斯拉准备扩建工厂,拟年产1000万台人形机器人!高手怎么看? 谷歌前 CEO 施密特:大多数国家最终可能使用中国的 AI 模型 “AI才女”罗福莉发文宣布加入小米 国地中心首席科学家:人形机器人未来收入主要是这两方面 1499元还带全向避障,大疆是真想把这台无人机卖给你 大众与众08申报图,造型看不懂,但是和小鹏合作 数智领航,5G筑梦——南昌移动以新质生产力绘就英雄城转型新图景 Viwoods推出AiPaper Reader电纸书,6.13英寸墨水屏配AI阅读助理 5G-A携手AI激活低空经济动能 新能源车销量首超燃油车!10月渗透率51.6%! 太炸裂!张子宇首秀13中11砍26+3,山东28分大胜轻松开门红! 全运会大乌龙:笑死了徐海东提前倒地庆祝,转头被叫回来继续比赛 18岁小将掀翻奥运冠军,孙杨潘展乐后浪来了! 奶皮子价格每日变动,从7元涨至40元引发市场热议 13.6亿起拍零报名:“最丑建筑”广州圆大厦的三次流拍困局 2026年起,广州新房全都要“拼”出来?你敢住吗 地表最难!全运会乒乓球比赛:世界冠军的内卷修罗场 孙颖莎:全运会是“地表最难”的乒乓球赛场,每一场都要全力以赴 Kimi K2 Thinking 模型发布并开源,全面提升 Agent 和推理能力 别再被误导!AI真的会取代人类工作吗?答案让你大跌眼镜! 杭州 “六小龙” 首聚乌镇 周国辉:乌镇峰会见证中国科创 “有效” 发声 一边喊“玩不下去” 一边吃野猪流油 荒野求生戳中多少人的现实困境 网友吐槽高铁票买到19排但车厢只有17排