月之暗面重返基模战场:发布首个开源万亿模型,押注“模型即Agent”
炒股就看,权威,专业,及时,全面,助您挖掘潜力主题机会!

蓝鲸新闻7月12日讯(记者 朱俊熹)时隔半年,“大模型六小龙”之一的月之暗面终于推出新一代基座模型Kimi K2。据官方介绍,Kimi K2是一款具备更强代码能力、更擅长通用Agent任务的MoE架构基础模型,总参数达1万亿,激活参数为320亿。
7月11日发布并同步开源的新模型包括两个版本:基础模型Kimi-K2-Base、更适合通用聊天和智能体任务的后训练模型Kimi-K2-Instruct。在自主编程、工具调用和数学推理相关的能力评测中,Kimi K2均取得了较优的表现。以SWE-bench Verified、AIME 2025等评测集为例,Kimi-K2-Instruct的得分超过了同为开源模型的DeepSeek-V3、阿里Qwen3,逼近甚至能够反超OpenAI GPT-4.1、Anthropic Claude 4 Opus等领先闭源模型。
结合6月底开启内测的新Agent“Kimi-Researcher”不难看出,月之暗面的思路正转向“模型即Agent”。模型自身就集成了自主决策和执行任务的能力,能够作为智能体解决复杂任务。
在官方释出的用例中,用户要求Kimi K2帮忙规划参加Coldplay乐队巡演的行程。该模型通过17次工具调用,涵盖搜索、日历、邮箱、航班、餐厅预订等环节,制定出一份完整的机酒与旅游规划,并形成可视化报告。
智能体能力正在成为国内外大模型厂商竞相押注的进化方向。本周,马斯克旗下的人工智能初创公司xAI发布新一代大模型Grok 4,包括单智能体、多智能体两个版本,具备工具使用、实时搜索等功能。Anthropic在推出Claude 4系列模型时也强调,在编程、推理和Agent方面“树立了全新标准”,能够处理复杂且长时间运行的任务。
月之暗面在Kimi K2的技术博客里分享了对构建开放智能体智能的看法。其指出,预训练是智能体智能的关键基础,它让模型拥有基本的知识、理解和推理能力,从而在后续的强化学习中更有效地学习。但“人类数据就像是有限的‘化石燃料’”,因此如何在预训练阶段提升对有限数据的利用效率,成为当前AI扩展的关键挑战。
而在后训练阶段,大模型不再只依赖人类数据,开始从自己的行为和结果中获得奖励、进行自我优化,以实现超越人类能力的可能。
“Kimi K2正是在这些洞见之上锻造而成的。”月之暗面表示。其同时强调,Kimi K2是构建通用Agent能力的坚实基础,但通用Agent还需要更高级的能力,比如思考和视觉理解,计划未来为该模型加入这些能力。此外,长文本处理能力曾是Kimi的核心优势,此次Kimi K2的上下文长度为128k,不及部分新发布的模型。
值得注意的是,Kimi K2是国内首个开源的万亿参数级别模型。此前虽有其他大模型厂商训练出万亿参数模型,如腾讯混元Turbo、MiniMax abab 6.5等,但都采取了闭源路线。
在训练Kimi K2这样的万亿参数级别的大模型时,月之暗面采用了自主创新的Muon优化器。与传统的Adam优化器相比,Muon在token利用效率上表现更优,能让大模型学得更快、更有效率。同时为解决Muon在超大规模训练时遇到的不稳定问题,团队还提出了MuonClip这一稳定性增强技术,支撑Kimi K2顺利完成15.5万亿tokens的预训练,未出现训练损失值的异常峰值。
自年初DeepSeek横空出世以来,月之暗面虽然陆续释出了一些技术或产品上的更新,但始终未能重拾外界对其的热切期待,一度表现得颇为低调沉寂。而此次Kimi K2的发布,让这家明星创企终于重回基模舞台的聚光灯下,这场牌局仍未见定论。
- • 骐达汽车:引领绿色出行新潮流
- • 沧州疫情最新进展:严密防控,共筑防线
- • 16薪:揭秘企业员工福利中的隐藏福利
- • 六年级学生制作关于爱国的手抄报,传承红色基因
- • 唐崇荣圣诞节讲章:信仰之光在圣诞节的闪耀
- • 亚冠抽签:悬念重重,众望所归
- • 南非兰特兑美元下跌1%
- • 浙商银行:制定稳外贸专项支持政策,2025年对民企跨境融资投放总额要达170亿美元
- • 财政部重磅发声,正在抓紧建立实施育儿补贴制度
- • 相知无远近,万里尚为邻——友谊的跨越与永恒
- • 头脑风暴法的经典案例:苹果公司如何激发创新思维
- • 《暗黑破坏神2合成公式:探索游戏中的神秘炼金术》
- • 邱晨的感情世界:揭秘他的女朋友是谁?
- • 原上汽名爵高管周钘确认入职领克,曾短暂加盟小米汽车
- • 上海官宣启动不动产信托登记,多个创新亮点值得关注
- • 首批银行间科创债发行主体亮相 工商、兴业、杭州银行合计250亿
- • 孟晚舟被加拿大逮捕背后的真相:揭开华为高管引渡事件的神秘面纱
- • “H+A”新路开启,红筹企业回深上市“遥遥在望”
- • 《温馨祝福,美好祝愿——主婚人讲话稿精选》
- • “一正四副”架构落定!鑫元基金高管团队扩容:张鹏飞、杨晓宇升任副总,固收基因持续强化
- • 捷克斯洛伐克美女:优雅与美丽的完美结合
- • 中美最终加征多少关税?降了多少?我们做了道数学题
- • 5月20日保险日报丨一季度险企偿付能力保持充足,财险公司头部承包八成净利润,代理人面临终局之战
- • 浙江绍兴疫情最新情况:严密防控,共筑安全防线
- • 入市长钱稳步进 A股资金“蓄水池”效应撑起市场底线
- • 美联储研究学者:白宫在为鲍威尔的下台制造法律理由
- • 通用汽车因需求和贸易压力削减加拿大卡车装配厂班次
- • 欧洲天然气价格延续涨势 关注美国在以色列与伊朗冲突中的动向
- • 兴业银行一季度净赚超237亿降逾2%,营收降逾3%
- • 康辉:新闻界楷模的离世,一段传奇人生的终结
- • 四川航空网上准备系统:提升航班安全与效率的新利器
- • 【特写】120岁的中国电影在上海重新思考未来
- • 向总书记汇报具身智能发展的“稚辉君”:从期待到兴奋再到备受鼓舞
- • 涉延安必康财务造假案,时任董事长谷晓嘉被罚500万元、十年市场禁入
- • 日本央行行长称通货膨胀仍低于目标 此番发言加速日元走贬
- • 揭秘“他的后台比较硬”:权力背后的神秘力量
- • 《落花有意,流水无情——浅析托物言志的散文之美》
- • 两股东高位减持!最新8股发布股东减持计划!下周28股面临解禁
- • 《天之炽》小说笔趣阁:探寻热血青春的奇幻之旅
- • 周三热门中概股多数下跌 阿里巴巴跌3.47%,极氪涨11.51%
- • 江西庐山暑期推出“学生餐桌” ,凭学生证可享五折优惠
- • 班组长培训心得范文:提升自我,助力团队发展
- • 国科大校长与毕业生定下“十年之约”:希望你们带着成就回归
- • 【携手奔赴现代化的明天】这么一“升级”,吉林农业真的变了!
- • 如何科学有效地教育11岁孩子
- • 复旦大学陈果:一位博学多才的学者与教育家
- • 一BU难求!知情人士称泡泡玛特年初已扩产能,但需求远超供应链反应速度
- • 亚洲杯八强对阵图解析:精彩对决即将上演
- • 《冰雪奇缘》主题曲英文版:一曲动人心弦的冬日颂歌
- • 昨夜今晨国际财经热点一览_2025年7月10日_财经新闻
- • 银行倒车接人?银行ETF(512800)近5日狂揽15亿元!算力硬件股走强,创业板人工智能ETF华宝劲涨1.75%
- • “治国有常而利民为本”:古人的治国智慧与现代启示
- • 高峰枫丨当莎士比亚撕裂美国
- • 土耳其伊斯坦布尔:四季分明,气候宜人的美丽都市
- • 北京新增本土8例,疫情防控形势依然严峻
- • 华南城网:助力华南地区电商发展的新引擎
- • 盘后突发,688568,暂停资格!批量涨停,无人驾驶,多重利好来了
- • 锗价驱动2024年业绩暴增,云南锗业如何破解现金流负增长困局?
- • 流感疫苗出现八元/支的历史新低价
- • 揭秘12生肖顺序口诀:传承千年的智慧结晶
- • 300多万元商铺征收补偿仅189万,台州男子起诉区政府一审败诉后已上诉
- • 《同桌的你》电影下载:重温青春记忆,感受纯真情感
- • 上海天洋热熔粘接材料股份有限公司:引领行业创新,打造高性能粘接解决方案
- • 新冠疫苗志愿者不幸离世,疫苗安全引发社会关注
- • 摩根大通:美股5月的强劲反弹势头或因滞胀风险而终结
- • 六月券商金股出炉:转向价值风格,青岛啤酒等4股最热
- • 厦门六中夜空中最亮的星——那颗照亮青春的伴奏
- • 陈吉宁会见华平投资集团主席蒂莫西·盖特纳
- • 雷军:第二代玄戒芯片考虑上车应用
- • 华控赛格董事长、董秘、副总经理三高管同日辞职
- • 航空航天港:未来城市发展的新引擎
- • 法治面|芜湖律师被曝因“诋毁司法机关”或遭停业处罚,本人:已妥善处理
- • 【深度】合并中的OA:国联民生离头部券商还有多远?
- • 超31万亿!银行理财规模重回高位
- • 超70亿元!沪硅产业拟收购三家亏损子公司股权,自身业绩也遭“滑铁卢”
- • 为什么新加坡的新零售空间这么好逛?
- • 泽连斯基:与特朗普的通话“富有成果”
- • “战网不是有效的Win32应用程序?教你轻松解决此问题”
- • 美国有多少个州和特区:探索美利坚合众国的地理版图
- • 核心分歧仍难消除之际 美国与伊朗开启第四轮核谈判
- • “军工+无人机”双轮驱动,通用航空持续活跃!
- • 洛杉矶奥组委确认2028年奥运会和残奥会开闭幕式场地
- • 美联储官员警告关税可能引发长期通胀
- • 儿童兴趣班:培养孩子全面发展的摇篮
本文 快租网 原创,转载保留链接!网址:https://kuaizu.me/post/19056.html