RockAI国内首个「非Transformer架构大模型」Yan通过网信办备案
发表于 2024-12-04 15:59:04

近日,上海岩芯数智人工智能科技有限公司(以下简称RockAI)的Yan架构大模型成功通过《生成式人工智能服务管理暂行办法》备案,这是国内首个非Transformer架构大模型通过备案。

image.png

Yan模型简介

Yan架构大模型是国内首个非Transformer架构、非Attention机制的大模型。传统的Transformer架构和Attention机制对算力要求较高,而Yan架构大模型以MCSD、类脑激活机制为基础原理,大幅提升模型性能与效率,以3B参数量可达到Llama3 8B的水平,还可在CPU上运行部署。MCSD架构具有快速训练、推理能力,实现更高效的特征提取,类脑激活机制则模拟大脑中的神经元激活模式,在计算时选择性激活部分参数,减少算力冗余,更高效地解决问题。Yan架构大模型在保证性能的同时,有效降低了对算力的依赖。这不仅有助于提高模型的运行效率,还能降低成本,为更多企业和开发者提供了触手可及的AI解决方案。

备案通过的价值

因此,Yan架构大模型通过备案对于RockAI以及行业发展均具有重要价值。

· 为行业发展开辟新的技术路径

作为国内首个非Transformer架构、非Attention机制大模型完成网信办备案,为行业发展开辟了新的技术路径。

· 证明非Transformer技术路线的潜力

证明在算力受限的情况下,非Transformer架构技术路线的可行性和潜力,从而能够鼓励更多企业探索多元化的技术发展方向。

· 业内唯一一家同时拥有双机制模型

RockAI成为唯一一家非Attention机制大模型和Attention机制大模型均备案通过的厂商,彰显了其在AI技术研发方面的创新能力。

Yan落地情况

技术突破之外,商业落地层面Yan架构大模型也取得了显著成果。依托低算力要求、本地部署、无损运行等优势,RockAI已与机器人、无人机、手机、电脑等领域的设备厂商建立深度合作,并在上述领域落地多个项目。

RockAI在大模型领域以“群体智能”的理念构建通用人工智能技术,以“让世界上每一台设备拥有自己的智能”为使命,致力于打造群体智能单元大模型,实现AI普惠。Yan架构大模型的备案通过是RockAI践行使命的重要里程碑,未来,我们期待Yan架构大模型在更多设备单元部署应用,让群体智能引领走向通用人工智能,与合作伙伴一起,领先一步开拓更加广阔的市场空间。


「免责声明」:以上页面展示信息由第三方发布,目的在于传播更多信息,与本网站立场无关。我们不保证该信息(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关信息并未经过本网站证实,不对您构成任何投资建议,据此操作,风险自担,以上网页呈现的图片均为自发上传,如发生图片侵权行为与我们无关,如有请直接微信联系g1002718958。 

CSDN官方微信
扫描二维码,向CSDN吐槽
微信号:CSDNnews
微博关注
【免责声明:CSDN本栏目发布信息,目的在于传播更多信息,丰富网络文化,稿件仅代表作者个人观点,与CSDN无关。其原创性以及文中陈述文字和文字内容未经本网证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本网不做任何保证或者承诺,请读者仅作参考,并请自行核实相关内容。您若对该稿件有任何怀疑或质疑,请立即与CSDN联系,我们将迅速给您回应并做处理。】