美团在5月2日正式发布LongCat-2.0-Preview大模型,官方宣称这是业内首个完全使用国产芯片训练的大模型,英伟达算力占比为零。目前已开启受邀内测,每日提供1000万token额度供开发者体验。
核心亮点
1. 纯国产芯片训练
LongCat-2.0从训练源头就绑定了国产算力生态,彻底摆脱了对英伟达CUDA生态的依赖。这意味着国内大模型厂商在算力自主可控方面迈出了实质性一步。
2. 技术规格曝光
根据内测信息,LongCat-2.0定位为万亿参数级别旗舰模型,支持超长上下文窗口,在代码生成、数学推理等任务上表现突出。具体技术细节美团尚未完全公开,但从内测反馈来看能力不弱。
3. 开发者友好
首批开放1000万token/天的免费额度,开发者可通过美团技术通道申请内测资格。这个力度对中小企业和独立开发者来说相当友好。
行业影响
打破算力瓶颈
长期以来,国内大模型训练严重依赖英伟达芯片,算力获取成本和供应链风险居高不下。LongCat-2.0的成功验证了国产芯片在大模型训练场景的可行性,后续可能会有更多厂商跟进。
竞争格局生变
国产大模型战场又添一员猛将。从百度文心、阿里通义、字节豆包到美团LongCat,BAT级别的互联网巨头已经全部入局。这对中小模型厂商来说压力不小,但对开发者而言意味着更多选择。
自主可控提速
在大模型竞争日趋激烈的背景下,算力自主可控已经从"可选项"变成"必选项"。LongCat-2.0的意义不只是多了一个模型选择,更在于证明了国产芯片+国产大模型这条路走得通。
对普通用户来说,这款模型的体验如何还需要等正式上线后再观察。但对整个行业而言,这确实是个值得关注的信号。
评论列表
Loading...