DeepSeek R2有望8月下旬发布?内部人士:不属实
近日有市场传言称,国产大模型公司深度求索旗下DeepSeek R2有望在8月15日至30日期间发布。
8月13日,DeepSeek内部人士向澎湃新闻记者表示,上述消息不属实。
早在今年4月,就有传言称,深度求索可能将在5月推出下一代AI大模型DeepSeek-R2。当时有报道称,DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE),其结合更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。
不过,上述内部人士曾向记者坦言,该传言真实度不高。
此后,DeepSeek官宣推出R1新版本,业内普遍认为这是取代了R2的发布。
5月29日,据DeepSeek公告,DeepSeek R1模型已完成小版本升级,当前版本为DeepSeek-R1-0528。用户通过官方网站、APP或小程序进入对话界面后,开启“深度思考”功能即可体验最新版本。API也已同步更新,调用方式不变。
公告指出,DeepSeek-R1-0528使用2024年12月所发布的DeepSeek V3 Base模型作为基座,但在后训练过程中投入了更多算力,显著提升模型的思维深度与推理能力。更新后的R1模型在数学、编程与通用逻辑等多个基准测评中取得当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如o3与Gemini-2.5-Pro。
相较于旧版R1,新版模型在复杂推理任务中的表现有显著提升。例如在AIME2025测试中,新版模型准确率由旧版的70%提升至87.5%。这一进步得益于模型在推理过程中的思维深度增强:在AIME2025测试集上,旧版模型平均每题使用12K tokens,而新版模型平均每题使用23Ktokens,表明其在解题过程中进行了更为详尽和深入的思考。
大模型行业的内卷正在加剧。7月31日,据国际开源社区Hugging-Face最新趋势热榜显示,前十名模型中,有9个是国产大模型,其中排名第一的是智谱最新发布的新一代旗舰大模型GLM-4.5,排名第二的是阿里旗下通义千问模型Qwen3,而腾讯混元最新发布的3D模型则排行第三。
但据排名数据显示,DeepSeek R1在Hugging-Face趋势热榜中并不靠前,不过其依然是目前点赞最多的大模型,DeepSeek R1收到了1.25万个赞(like),远超其他国产大模型。
在年初成为大模型产业王炸黑马后,DeepSeek成为国内大模型厂商的集体竞标对手,包括MiniMax、月之暗面等知名大模型公司或明或暗都提出了对标DeepSeek的目标,且在更新迭代上进展迅速。作为中国开源大模型的“风向标”,DeepSeek正在面临更激烈竞争。
- • 杨钰莹不穿奶罩图片引发热议:公众人物隐私与媒体伦理的边界探讨
- • 美国特使抵达莫斯科,俄罗斯或考虑与乌克兰达成空中停火
- • 河北法院网上立案平台:便捷高效的法律服务新体验
- • 深度解析老K游戏官网:娱乐与社交的完美结合
- • 法师单刷暗影之眼:传奇英雄的孤独征程
- • 辽宁省学前教育学籍管理系统的创新与实践
- • 焊接龙头瑞凌股份主业陷瓶颈,原始股东计划高位套现
- • 攀登者投资方:共筑高峰,共创辉煌
- • 台湾高雄市海域发生4.0级地震,震源深度13千米
- • 《野狼Disco简单舞蹈视频:跟随节奏,释放自我!》
- • 消息人士称泽连斯基已启程前往土耳其
- • 大华继显:升翰森制药目标价至40港元 评级“买入”
- • 地震减灾知识:守护生命,共筑安全防线
- • 5月2日美股成交额前20:苹果跌3.7%,财报凸显关税与增长阴霾
- • 上海官宣启动不动产信托登记,多个创新亮点值得关注
- • 养元青洗发水:守护秀发健康,焕发青春光彩
- • 苹果放弃自研折叠iPhone,决定采用三星的方案
- • 戒指戴在小拇指上的含义:揭秘神秘的文化密码
- • 收盘:美股周二收跌 标普指数结束六连涨
- • 沟通从心开始——家长会,构建和谐家校关系的新篇章
- • 甲状腺球蛋白抗体高:揭秘其潜在危害及应对策略
- • 温网:辛纳3-1逆转阻止阿卡3连冠首夺温网冠军+大满贯第4冠
- • 以军袭击伊朗国家电视台大楼,已致2人死亡
- • “大而美”法案或增加美国财政脆弱性,加剧社会政治极化
- • 吃喝板块重挫!“茅五泸汾洋”集体回调,食品ETF(515710)收跌1.28%!机构:食饮需求有望边际企稳
- • 罗马仕充电宝被北京多所高校禁用,旗舰店专员回应:正在核查中
- • 媒体:美国政府效率部拟在特朗普就职一周年之前取消50%联邦法规
- • Instagram现要求用户至少拥有1000名粉丝才能进行直播
- • 受中美经贸利好提振,港股三大指数尾盘爆发
- • 全球文明对话部长级会议:外国嘉宾最想要什么中国礼物?
- • 卡塔尔投资局拿下华夏基金10%股权背后,这家欧洲私募巨头成赢家
- • 新势力5月榜单出炉:零跑三连冠,理想、鸿蒙智行重回4万辆
- • 探索MC中的灭火道具:游戏世界的消防英雄
- • 中金:换个视角看汇率
- • 《影音先锋不撸321:揭秘网络影视平台的崛起与影响》
- • 冷凝管的种类及其应用探讨
- • 落地逾7个月,支持资本市场的两项新工具有何进展?
- • 江铃福特否认并入长安福特:没有相关重组计划
- • 工程量验收单:确保工程质量的关键环节
- • 演讲稿模式的构建与优化:提升演讲效果的关键
- • 小米以旧换新,绿色环保新风尚
- • 西南联大的故事:风雨飘摇中的学术圣地
- • 《我就是演员巅峰对角:一场关于梦想与坚持的视听盛宴》
- • 《君为下txt下载:探寻古典文学的魅力之旅》
- • 杨德龙:中美在科技领域呈现出你追我赶 各有千秋的格局
- • 龙光集团:21笔境内债券重组方案全部通过
- • 湖北省博物馆镇馆之宝:见证历史的璀璨瑰宝
- • 中国男女平均寿命2018:健康生活与国家发展的见证
- • 北京升级发布暴雨橙色预警,丰台房山等6区暴雨红色预警
- • 美国证券交易委员会结束对摩根士丹利现金清算计划的调查,未采取任何执法行动
- • 优步营收超预期,宣布200亿美元股票回购计划
- • 《沉浸式体验,模拟经营页游带你领略商业帝国风采》
- • 高铁商务车厢内现一等座被调侃“低人一等座”,铁路12306回应
- • 腺周口疮:揭秘这种口腔疾病的成因、症状及防治方法
- • 攀登者投资方:共筑梦想,共创辉煌
- • 男童输液管内现虫子:医疗安全警钟长鸣
- • CBA季后赛赛程表2023:激情四溢的篮球盛宴即将开启!
- • 普通扑克牌怎么认牌:轻松掌握扑克牌识别技巧
- • “高效办成一件事”常态化,将给企业和个人带来哪些便利?
- • 公文紧急程度:高效沟通的“加速器”
- • 纽约汇市:彭博美元指数跌至2023年以来低点 关税风险上升
- • 中国全景相机在美国被抢购
- • 狡猾的比修在森林中的冒险之旅
- • 荣昌生物的创新药出海交易为何带崩股价?
- • 《GTA5女鬼:揭开神秘面纱的虚拟幽灵》
- • 《揭秘十字军东征秘籍:中世纪欧洲的军事传奇与信仰之旅》
- • 日经225指数收涨1.1% 日元汇率创近三周来最低水平
- • 观点综述:城堡经济学家力促欧洲加大联合发债 IMF警示英国增长承压
- • 聆听地球的心声,梁皓一为“树”写的交响诗首演了
- • 阿玛尼素颜霜:肌肤的自然守护者,美丽从“底”开始
- • 网球、体育和赢家精神:前往卓越的定义是如何被重塑和接受?
- • 5月18日增减持汇总:暂无增持 通富微电等16股减持(表)
- • 美国番茄价格最快可能于周一上涨
- • 特朗普:药品和芯片关税将于“未来一周左右”宣布
- • 天舟九号货运飞船发射任务取得圆满成功
- • 诺诚健华首次实现季度盈利
- • 甲骨文将收购TikTok美国业务?字节跳动:信息不实
- • 北京银行一季度净赚超76亿降逾2%,不良贷款率微降
- • 轻松掌握GTA5账户注册步骤,畅享游戏乐趣!
- • 翟鸿燊:一位影响深远的演讲家与教育者
- • 越南一艘倾覆游船确认35人死亡、4人失踪,船上没有外籍人士
- • 美股三大指数涨跌不一,英伟达跌超2%,科技股业绩成焦点
- • 张全蛋:网络时代的另类“网红”
- • 揭开南京大屠杀的真相:历史记忆与警示
本文 快租网 原创,转载保留链接!网址:https://kuaizu.me/post/26299.html