国家超算互联网AI算力体验-对chatglm3-6b进行微调-CSDN.NET

CSDN首页> 业界

订阅业界RSS

国家超算互联网AI算力体验-对chatglm3-6b进行微调

发表于 2024-11-07 14:58:30

这段时间看到了国家超算互联网（www.scnet.cn）发起的活动：国家超算互联网「AI跃升季」：谁是下一个“AI”跃人 - AI算力体验活动

（https://www.scnet.cn/home/subject/modular/index272.html），正好需要一些算力来做一些大模型方面的训练工作，也借此机会体验一下此次活动的重点部分——国产异构加速卡。

1、参与活动
进入活动后，点击【AI计算】即可进入平台页面。

在平台页面中我们可以看到国产异构加速卡相关信息

可以看到使用国产异构加速卡搭建的算力服务器租赁费用只需要0.01元每小时，几乎可以算是免费了。

点击异构加速卡，如果之前未登录则会进入登录页面，注册登录之后便可以看到如下界面

点击去使用之后便可以进行算力服务器的配置，整个服务器的搭建过程非常简单，官方已经提前准备好了环境镜像，甚至一些常用的模型镜像也一并具有，这样在选择了想要的模型镜像之后，就可以省去下载模型的时间，非常方便。比如我这次使用到的大模型是chatglm3-6b，因此我选择了pytorch2.10，python3.10，centos7.6的镜像，后面的dtk为异构加速卡的架构版本，如果选择了像A800、L20的显卡，则会显示cuda。

点击右下角的创建后就可以跳转到如下界面

点击JupyterLab后可以进入到我们熟悉的Lab界面。工具面板可以监控gpu的使用情况。自定义服务可以实现向外暴露端口，使得我们本地可以访问服务器上已经开放的API。下图是点击JupyterLab后跳转的页面。

在此我们就可以进行chatglm3-6b的微调与推理了。

2、个人体验

在模型微调过程中，我选择了AdvertiseGen广告词数据集来进行微调

AdvertiseGen 的部分数据如下：

使用AdvertiseGen 中的问题，对模型进行提问“类型#裤*风格#英伦*风格#简约”。

预期回答为“裤子是简约大方的版型设计，带来一种极简主义风格而且不乏舒适优雅感，是衣橱必不可少的一件百搭单品。标志性的logo可以体现出一股子浓郁的英伦风情，轻而易举带来独一无二的<UNK>体验。”

可以看到模型回答并不像预期那样，下面进行微调。

现在根据AdvertiseGen 数据集进行微调，首先把数据转为微调需要的对话格式。转换后的格式如下：

接下来使用转换后的数据进行lora微调，微调完成后如下：

整个微调过程包含训练和预测两个部分，一共使用52分钟。

读取微调后的模型，使用相同的问题对其提问

可以看到模型的回答符合预期，且对训练集之外的提问有良好的泛化能力。

至此，整个微调与推理过程结束，可以看出异构卡在模型训练方面支持的还是很不错的，在训练过程中没有遇到错误，用起来也没有感觉到与cuda版本的pytorch有什么区别。后面我也针对异构卡的性能与L20进行了对比，发现异构卡的性能能够达到L20的60%左右，还是很有性价比的，0.01元每小时的卡，还要啥自行车啊。

3、领取更多算力
算力不够的小伙伴可以参与此活动可领取更多算力：AI算力不够用？参与谁是下一个“AI”跃人 -AI体验推介活动，赢取千元算力券！（https://www.scnet.cn/home/subject/modular/index270.html）

CSDN官方微信

扫描二维码,向CSDN吐槽

微信号：CSDNnews

程序员移动端【订阅下载】

微博关注

【免责声明：CSDN本栏目发布信息，目的在于传播更多信息，丰富网络文化，稿件仅代表作者个人观点，与CSDN无关。其原创性以及文中陈述文字和文字内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本网不做任何保证或者承诺，请读者仅作参考，并请自行核实相关内容。您若对该稿件有任何怀疑或质疑，请立即与CSDN联系，我们将迅速给您回应并做处理。】