欢迎访问南京市某某电子官网!

梁文锋唤醒了杨植麟!Kimi发布新模型K2,参数量达1T,开源并全面领先

时间:2025-07-12 作者:AB模板网 3

新盛公司客服电话18187197192梁文锋唤醒了杨植麟!Kimi发布新模型K2,参数量达1T,开源并全面领先自DeepSeek冲击波事件后,Kimi在深夜悄然作出回应。

全新Kimi K2基础大模型采用MoE架构,参数总量达1T,激活参数32B,尤其在代码、Agent和数学推理任务上展现出领先能力。

Kimi引用多项基准评测数据,实现了开源模型的全新SOTA成就。

是的,Kimi K2,此次发布即实现开源。

同时,Web端、App和API服务也同步上线,可供使用。

作为DeepSeek R1发布后的主要竞争者,Kimi在过去半年里面临了全方位的质疑:技术领先性是否依然存在?营销策略的价值如何?以及之前围绕非技术话题的争议——Kimi是否依然坚守技术信仰?

172天后,Kimi在深夜通过K2大模型给出了低调而坚定的回应:游戏尚未结束,Kimi不打算退出,也不打算认输。

杨植麟仿佛被广东的梁文锋从沉睡中唤醒。

Kimi K2:1T参数MoE基础模型

让我们先来详细了解Kimi K2的具体情况。

作为Kimi最新MoE架构的基础模型,Kimi K2着重于代码能力和通用Agent任务能力。

其参数总量高达1T,虽然对本地部署者来说是一大挑战,但激活参数仅为32B,支持128K上下文。

Kimi在SWE Bench Verified、Tau2、AceBench等基准性能测试中,均取得了开源模型中的SOTA成绩。

在Agent和编程能力方面:

工具调用能力是指个体或系统在执行任务时,有效地使用和操作各种工具的能力。这种能力包括以下几个方面:

1. **工具识别**:能够识别和区分不同类型的工具,了解它们的用途和功能。

2. **工具选择**:根据任务需求,选择最合适的工具或方法。

3. **工具操作**:掌握工具的正确使用方法,包括组装、调整和操作。

4. **工具维护**:了解如何保养和维护工具,以保证其长期有效使用。

5. **工具创新**:在必要时,能够创造性地使用工具,或者对现有工具进行改进。

以下是对“工具调用能力”的改写:

- **工具应用技能**:指个体在执行工作时,对各类工具的应用技巧和能力。

- **工具运用效能**:评估个体在使用工具时的效率和效果。

- **工具操控技巧**:涉及个体操控工具的专业性和熟练度。

- **工具保养知识**:对工具保养和维修的了解和掌握程度。

- **工具革新能力**:在工具使用中展现出的创新思维和改进实践。

数学等科学能力通常指的是个体在数学和自然科学领域内所展现的认知技能和解决问题的能力。以下是对这一概念的文本分析和改写:

**原文**:

数学等科学能力是指个体在数学、物理、化学、生物等自然科学领域中表现出的理解、分析和解决复杂问题的能力。

**改写**:

个体在数学、物理学、化学、生物学等自然科学范畴内所具备的解析复杂问题、理解概念以及应用知识解决难题的能力,即所谓的数学及其他科学能力。

官方展示的Demo中,清晰呈现了目前大家最关注的模型功能。

代码能力方面,Kimi K2在前端开发任务中表现卓越,支持粒子系统、可视化以及3D场景等多种展示形式。

它能够创建出具备昼夜循环的山川峡谷3D景观:

此外,3D粒子星系模拟的效果同样令人印象深刻:

Kimi K2工具的调用功能增强

作者:Kimi

K2版本拥有出色的复杂指令解析功能,能够将用户需求自动分解成一系列格式规范、可直接执行的ToolCall结构。例如,它能够一站式帮助用户实现追星(以doge为例):

全年追星计划、演唱会门票和旅行安排,甚至还能生成日历,以HTML格式概述整个行程规划,并通过邮件发送给用户。

立即开源

Kimi K2最引人注目的讨论点之一是Kimi公司决定采取开源策略。

开源的模型版本包括两种:

遵循的是修改版的MIT协议(Modified MIT License)。

MIT协议被认为是极为宽松的协议(几乎等同于自由使用)。Kimi的修改规定,如果基于Kimi K2开发的产品或服务的月活跃用户超过1亿,或者月收入超过2000万美元,那么该产品和服务的用户界面上必须显示“Kimi K2”。

技术细节

此外,Kimi官方还透露了一些技术细节。其中,关键的技术创新包括以下三点:

Kimi K2放弃了传统的Adam优化器,转而创新性地采用Muon优化器。

为了减轻大规模训练中attention logits过大的问题,他们提出了MuonClip技术,并将其扩展至万亿参数规模,从而提高了训练的稳定性和token的使用效率。

Kimi K2成功完成了15.5T token的平稳训练,整个过程没有出现loss spike。

Kimi K2构建了一个能够大规模生成多轮工具使用场景的合成pipeline,覆盖了数百个领域和数千种工具。经过LLM评估筛选的高质量样本被用于训练。

Kimi K2

K2不仅在可验证任务(如代码和数学)中强化学习,还通过引入自我评价机制(自我判断),有效解决了不可验证任务中奖励稀缺的问题。通过持续优化critic,K2在泛化任务上的表现得到了显著提升。

实际测试

随着K2模型一正式发布,Kimi官网和App已成功部署。然而,其效果是否如官方所述那样出色?我们亲自进行了实际测试以验证其性能。

首先,我们让Kimi为K2制作一个宣传网页。提示词非常简单,只需同时开启联网搜索:

审美的倾向偏向简约。值得一提的是,页面上的“立即体验”和“下载开源模型”按钮确实能够正确地链接到相应的网址。

再尝试加入一些物理模拟的元素:

该用户界面设计得相当出色。此外,即便在未明确指定具体要求的情况下,Kimi K2的贴心设计自动提供了调整行数和小球数量的滑动条功能。

然而,小球下落动画的改进仍有潜力。

尽管提示词十分简洁,Kimi K2依然能够准确把握其含义,并生成质量上乘的代码。

那么,如果将Kimi K2设定为个人助理,协助制定日程安排,其表现又将如何呢?

提示词:

初看之下似乎很明确,然而,等等……

挑选的都是已经过期的场次,因此并不具备实际的参考意义。


官方解释可能是因为工具调用功能尚未正式推出。尽管如此,K2的表现和用户体验仍然体现了Kimi昔日惊艳的实力。Kimi,那个曾经的明星,正在回归。

在DeepSeek冲击波后的172天,Kimi以K2的形式作出了回应。种种迹象显示,K2带着诚意,同时也带着王者归来的复仇之心。

在2025年春节前,Kimi曾是国产基础大模型中最受瞩目的存在,其团队展现出的青春活力和产品的优雅体验备受赞誉。根据量子位智库的数据统计,在2024年全年,AI智能助手Web端市场格局已相对稳定,尤其是头部市场,形成了Kimi智能助手、豆包AI和文心一言的TOP 3格局,三者合计占据了70%的市场份额。

Kimi以其创业独角兽的形象,展现出青春活力,势不可挡。尤其在APP领域,豆包与Kimi智能助手的表现尤为突出,几乎以压倒性的优势领先于其他竞争者,市场份额在各个维度上占比高达80%,几乎形成了双寡头的局面。

然而,这种数据优势在2025年1月20日遭遇了重大打击。就在这一天,DeepSeek R1横空出世,迅速在全球范围内引发轰动,并在春节期间成为全民热议的话题。在此背景下,一直暗中布局AI领域的巨头腾讯也迅速行动,借助DeepSeek开源的契机,如同猛虎下山,一夜间打破了稳定的格局。

半年之后,AI智能助手市场究竟如何?根据量子位智库最新发布的2025年上半年数据,Web端和App端的头部竞争格局已经转变为DDKT,占据了90%的市场份额。所谓DDKT,指的是字节豆包、DeepSeek、Kimi和腾讯元宝。尽管Kimi依然身处牌桌,但危机的警报已经响起,不仅增长面临挑战,留存和活跃度也变得岌岌可危。

Kimi的数据增长与其先前依赖巨额融资进行烧钱投流的策略密切相关。然而,若DeepSeek和腾讯元宝凭借先进模型能迅速突破,这样的壁垒又从何而来?这种烧钱投流的合理性又在哪里?

更不用说在DDTK中,Kimi是唯一一家没有现金奶牛支撑的创业公司。

在数据层面,这恐怕只是Kimi和月之暗面在过去半年中面对宏观压力所受到的质疑之一……

更根本的质疑直接关系到生死存亡——

在DeepSeek之后,是否还需要重复造轮子,继续自研基础大模型?

DeepSeek的冲击,不仅是先进技术模型的冲击,更是开源对闭源的冲击。

既然市面上已经有了如此全面的开源领先模型,为什么其他公司,尤其是创业公司,还有合理的融资理由去推进自研基础大模型的故事?

至少在DeepSeek之后,曾经包括Kimi在内的AI大模型“六小龙”创业格局一夜之间瓦解,已有至少2家公司放弃了自研大模型。

在这172天里,Kimi及其CEO杨植麟不断被问及这个质疑:

Kimi将如何回应?Kimi的未来方向是什么?

现在,杨植麟在舆论中消失172天后,Kimi通过开源K2基础大模型给出了最明确的回应——

Kimi不会认输,Kimi不会放弃自研大模型。

Kimi的路径也已明确——

打造更强大的开源大模型,实现全维度SOTA,重新证明技术的领先性。

从某种意义上说,梁文锋不仅唤醒了老乡小弟杨植麟,还帮他找回了追求AGI的初心。


返回列表