全球最大开源视频生成模型国内首发！阶跃星辰上架阿里云魔搭社区-CSDN.NET

CSDN首页> 业界

订阅业界RSS

全球最大开源视频生成模型国内首发！阶跃星辰上架阿里云魔搭社区

发表于 2025-02-21 21:34:03

2月21日，在今天开幕的全球开发者大会（GDC）上，阿里云魔搭社区首发阶跃星辰最新开源的两款多模态模型，包括全球参数量最大的开源视频生成模型Step-Video-T2V，以及业界首款产品级开源语音交互模型Step-Audio。截至目前，魔搭社区已上架超过4万个开源模型，涵盖LLM、对话、语音、文生图、图生视频等多个领域，是中国最大的AI模型社区。

此次在魔搭社区开源的两款模型，是近期全球多模态领域最热门的开源模型。Step-Video-T2V是基于300 亿参数的文本转视频预训练模型，能够生成高达 204 帧的视频，在指令遵循、运动平滑性、物理合理性、美感度等方面表现均显著超过市面上既有的开源视频模型。

图为 Step-Video-T2V-Eval 测评结果

另一款上架模型Step-Audio ，是业界首个产品级开源语音模型，参数规模多达1300多亿。根据 Llama Question等5 大主流公开测试，Step-Audio 模型性能均位列第一，并在 HSK-6（汉语水平考试六级）的测评中表现尤佳，是最懂中国话的开源语音交互大模型。

图为 5大主流公开评测结果

目前，阶跃星辰的这两款模型均可在魔搭社区下载和体验。有部署及模型微调需求的开发者和企业，还可通过阿里云人工智能平台PAI-Model Gallery实现一键部署，获取包括阶跃星辰新模型在内的200余款开源模型快速部署、训练及评测服务。

据了解，阿里云最早提出MaaS理念（Model as a Service，模型即服务），魔搭社区即为这一理念的具体实践，将AI模型变为直接可用的服务，为AI开发者提供模型体验、下载、调优、训练、推理、部署等一站式服务。截至目前，魔搭社区已上架千问Qwen、DeepSeek-R1、Llama、零一万物等国内外知名模型，服务超过1000万开发者，“找大模型上魔搭”日渐成为越来越多的AI开发者的默契。

附：

模型下载链接

● Step-Video-T2V：

魔搭社区

● Step-Audio：

魔搭社区

「免责声明」：以上页面展示信息由第三方发布，目的在于传播更多信息，与本网站立场无关。我们不保证该信息(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关信息并未经过本网站证实，不对您构成任何投资建议，据此操作，风险自担，以上网页呈现的图片均为自发上传，如发生图片侵权行为与我们无关，如有请直接微信联系g1002718958。

CSDN官方微信

扫描二维码,向CSDN吐槽

微信号：CSDNnews

程序员移动端【订阅下载】

微博关注

【免责声明：CSDN本栏目发布信息，目的在于传播更多信息，丰富网络文化，稿件仅代表作者个人观点，与CSDN无关。其原创性以及文中陈述文字和文字内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本网不做任何保证或者承诺，请读者仅作参考，并请自行核实相关内容。您若对该稿件有任何怀疑或质疑，请立即与CSDN联系，我们将迅速给您回应并做处理。】