首页 > 百姓社区 > 百姓社区 > 性能超DeepSeek-V3.2!国产大模型又开源了,限时免费用

性能超DeepSeek-V3.2!国产大模型又开源了,限时免费用

发布时间:2025-10-28 17:23:36来源: 13899775532

10月27日报道,刚刚,MiniMax发布并开源MiniMax-M2,一款为Max可视化编程和智能体工作流构建的轻量级模型。

▲MiniMax-M2在Hugging Face的开源界面截图

MiniMax-M2聚焦智能体的效率提升,是一款总参数达2300亿个的MoE(混合专家)模型,其中活跃参数达100亿个,兼顾编程和智能体任务以及通用智能。

在权威基准测评中,MiniMax-M2的测试成绩赶超Gemini 2.5 Pro、DeepSeek-V3.2等领先模型,接近GPT-5(thinking)模型性能,据称可提供匹敌这些模型的端到端工具使用性能,同时部署和扩展更便捷

▲MiniMax-M2的基准测试概况

具体来看,MiniMax-M2有以下几大亮点:

1、智能提升。根据知名分析机构Artificial Analysis的基准测试,MiniMax-M2在数学、科学、指令遵循、编程和智能体工具使用方面展现出具竞争力的通用智能。其综合得分在全球开源模型中排名第一。

2、高级编程。MiniMax-M2专为端到端开发人员工作流程而设计,擅长多文件编辑、编码-运行-修复循环以及测试验证修复。在Terminal-Bench和(Multi-)SWE-Bench风格的任务中展现了其在跨语言终端、IDE和CI中的实用有效性。

3、智能体性能。MiniMax-M2能够规划并执行跨Shell、浏览器、检索和代码运行器的复杂、长周期工具链。在类似BrowseComp的评估中,它能够持续定位难以发现的漏洞来源,保持证据的可追溯性,并优雅地从不稳定的步骤中恢复。

4、高效设计。MiniMax-M2拥有100亿个激活参数,可为交互式智能体和批量采样提供更低的延迟、更低的成本和更高的吞吐量,这与向高度可部署的模型转变契合,这些模型在编程和智能体任务中仍然表现出色。

以下更全面的评估测试了端到端编程和智能体工具的使用情况,涉及编辑真实的代码库、执行命令、浏览网页以及交付实用的解决方案等方面。MiniMax-M2在Multi-SWE-Bench、Terminal-Bench、ArtifactsBench、BrowseComp等多项测试中超越了Claude Sonnet 4、Gemini 2.5 Pro、DeepSeek-V3.2等顶尖模型。

▲MiniMax-M2的基准测试具体情况

Artificial Analysis统计的基准测试如下,MiniMax-M2在LiveCodeBench(LCB)、IFBench、AA Intelligence等多项测试中超越了Claude Sonnet 4、Gemini 2.5 Pro、DeepSeek-V3.2等顶尖模型。

▲Artificial Analysis基准测试具体情况

目前,用户可以在MiniMax Agent上体验MiniMax-M2,在限定时间内免费用

百姓社区更多>>

Meta超轻薄头显渲染图流出:高端市场的新挑战者 iPhone 18标准版外观曝光:晃眼一看iPhone17Pro iOS26.3正式版即将发布!这3类情况适合升级! 2026 年第一台新 iPhone:国补后不到 4000,但不推荐买 “爱马仕橙”iPhone 17 Pro助苹果终结三年销售颓势,中国市场猛增38% 华为Pura X2最新爆料:电池容量预计达5500mAh! 鸿蒙手机不会用?试试负一屏的“玩机助手” 2025年中国手机市场出货量3.07亿部,同比下降2.4% iQOO 15 Ultra图赏 硬核科技风格蜂窝能量矩阵 硅谷甘愿“裸奔”,中国大厂连夜“铺路”:Moltbot凭什么横扫中美? 高并发业务如何兼顾稳定与弹性?华为云TaurusDB给出“存算分离”新解 姚顺雨现场颁奖,吉嘉铭、董冠霆等15位青年人才获腾讯青云奖学金 抖音:“年货节”期间品牌礼盒成交额同比增长22% 大模型听懂语音却变笨?港中深与微软联合解决语音大模型降智问题 Anthropic一夜震撼升级:Claude获得「永久记忆」!全球打工人变天 每经热评|1200亿元大单不可戏言 容百科技董事长从头到尾真不知情? “深山林下灵芝第一品牌”,什么来路?有哪些疑点? 北京将迎空中花园!副中心六环高线公园启动段预计今年五一开放 巨人网络:《超自然行动组》推出AI大模型玩法,AI与真人玩家对局数超2500万次 华西证券:首予八马茶业“买入”评级 高端茶企的发展现状与增长密码 Laraki Borac:摩洛哥超跑梦想的未竟之作 XSKY发布AIMesh,想帮AI工厂打通数据“任督二脉” 2026款睿蓝8焕新,续航、动力、舒适、安全全维升级 既有传统,也有NK风格?全新宝马5系长这样,你会喜欢吗? 智谱成为全球大模型第一股,外国人这么看 三大指数开盘涨跌不一 AI概念多股高开 追觅电视斩获CES媒体大奖,Aura Mini LED与AI技术实力获国际认可 微言 | “死了么” APP爆火,戳中独居群体最痛的安全感缺口 全员Pro Max?多款旗舰手机阵容要变! 小米17 Pro系列背屏支持查看股票行情:需升级至澎湃OS 3.0.40.0