|

惠安生活网
2000活跃值=1葫芦

首页 > 百姓社区 > 百姓社区 > 首个全自动AI科学家诞生！西湖大学最新成果，性能超越人类

首个全自动AI科学家诞生！西湖大学最新成果，性能超越人类

发布时间：2025-10-09 16:49:12来源： 13899775532

人类科学家三年的工作量，如今AI两周就能轻松搞定！

最近，来自西湖大学的自然语言处理实验室发布了DeepScientist系统，这也是首个具有完整科研能力，且在无人工干预下，展现出目标导向、持续迭代、渐进式超越人类研究者最先进研究成果的AI科学家系统。

首个全自动AI科学家诞生！西湖大学最新成果，性能超越人类

△对比DeepScientist与人类专家的研究进展

在AI文本检测任务中，DeepScientist仅用两周时间就实施和验证了超过1000种不同的假设，在此期间取得了相当于人类三年的进展。

在RAID数据集测试中，DeepScientist设计的方法实现了7.9%的AUROC提升，成功超越了人类现有SOTA方案。

另外DeepScientist还在智能体失败归因、LLM推理加速等任务上也分别达成了新的SOTA。

首个全自动AI科学家诞生！西湖大学最新成果，性能超越人类

下面是更多详细内容介绍。

从“科研助理”到“首席科学家”：AI科研模式的变革

过去的AI Scientist系统，如果不给定一个清晰明了的科研目标，就很容易陷入对现有知识的机械组合与无效试探的窠臼中，最终形成的科研产出在人类专家看来缺乏焦点，科学价值不高。

它们更像是能力超群的科研助理，而不是能独立指引方向的科学家。

DeepScientist的出现改变了这一现状，它不再等待人类告诉它“研究什么”，而是开始主动思考“什么值得研究”，它可以：

主动识别前沿研究的根本性局限，
提出全新的科学构想以解决局限性问题，
自动编写代码、执行实验、设计分析实验，整理实验结果，
撰写结构完整的科研论文，开源可重现代码。

简而言之，这种从“随机发现”到“长期主动式探索”的角色转变，标志着AI已经正式涉足以往只有顶尖人类心智才能胜任的、最具创造性的科学发现过程。

【返回列表】

特别声明：以上内容(如有图片或视频亦包括在内)为“惠安生活网用户上传并发布"，本平台仅提供信息存储服务。

下一篇:量子技术还在攻坚期，诺奖为何要“提前认可”？

上一篇:大疆回应部分产品降价：为“双十一”常规促销，线上线下统一退换货有难度，将协同优化

百姓社区更多>>

Meta超轻薄头显渲染图流出：高端市场的新挑战者 iPhone 18标准版外观曝光：晃眼一看iPhone17Pro iOS26.3正式版即将发布！这3类情况适合升级！ 2026 年第一台新 iPhone：国补后不到 4000，但不推荐买 “爱马仕橙”iPhone 17 Pro助苹果终结三年销售颓势，中国市场猛增38% 华为Pura X2最新爆料：电池容量预计达5500mAh！鸿蒙手机不会用？试试负一屏的“玩机助手” 2025年中国手机市场出货量3.07亿部，同比下降2.4% iQOO 15 Ultra图赏硬核科技风格蜂窝能量矩阵硅谷甘愿“裸奔”，中国大厂连夜“铺路”：Moltbot凭什么横扫中美？高并发业务如何兼顾稳定与弹性？华为云TaurusDB给出“存算分离”新解姚顺雨现场颁奖，吉嘉铭、董冠霆等15位青年人才获腾讯青云奖学金抖音：“年货节”期间品牌礼盒成交额同比增长22% 大模型听懂语音却变笨？港中深与微软联合解决语音大模型降智问题 Anthropic一夜震撼升级：Claude获得「永久记忆」！全球打工人变天每经热评｜1200亿元大单不可戏言容百科技董事长从头到尾真不知情？ “深山林下灵芝第一品牌”，什么来路？有哪些疑点？北京将迎空中花园！副中心六环高线公园启动段预计今年五一开放巨人网络：《超自然行动组》推出AI大模型玩法，AI与真人玩家对局数超2500万次华西证券：首予八马茶业“买入”评级高端茶企的发展现状与增长密码 Laraki Borac：摩洛哥超跑梦想的未竟之作 XSKY发布AIMesh，想帮AI工厂打通数据“任督二脉” 2026款睿蓝8焕新，续航、动力、舒适、安全全维升级既有传统，也有NK风格？全新宝马5系长这样，你会喜欢吗？智谱成为全球大模型第一股，外国人这么看三大指数开盘涨跌不一 AI概念多股高开追觅电视斩获CES媒体大奖，Aura Mini LED与AI技术实力获国际认可微言 | “死了么” APP爆火，戳中独居群体最痛的安全感缺口全员Pro Max？多款旗舰手机阵容要变！小米17 Pro系列背屏支持查看股票行情：需升级至澎湃OS 3.0.40.0

Copyright 2013-2025 惠安生活网版权所有京ICP备2025131429号-1