速度2.6倍提升,TencentOS 支持满血版DeepSeek
TencentOS Server AI全面支持满血版DeepSeek R1,在双机16卡的硬件环境上,分别在短输入场景(如知识问答)以及长输入场景(如企业私有信息的检索增强生成)均获得超过2.6倍的推理性能提升!
本性能评估采用2台8卡服务器,显存总量共1536GB,部署TencentOS Server AI版,2台服务器采用RDMA高速网络互联,测试样本采用通用的数据集。分别测试输入200tokens/输出500tokens以及输入6144tokens/输出1024tokens下的吞吐能力,测试结果如下:
TencentOS Server AI是腾讯云发布的一款针对AI场景的操作系统,提供了从基础架构到AI框架以及模型的全栈式AI环境,一方面简化部署,另一方面通过高性能的AI框架,实现大模型如DeepSeek推理效率成倍的增加。
「免责声明」:以上页面展示信息由第三方发布,目的在于传播更多信息,与本网站立场无关。我们不保证该信息(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关信息并未经过本网站证实,不对您构成任何投资建议,据此操作,风险自担,以上网页呈现的图片均为自发上传,如发生图片侵权行为与我们无关,如有请直接微信联系g1002718958。

CSDN官方微信
扫描二维码,向CSDN吐槽
微信号:CSDNnews
程序员移动端【订阅下载】
微博关注
最新文章
聊一款“仅需三千多元”的微单芯讯通闪耀2025德国嵌入式展,5G+AIoT助推全球数智化转型华为云开年采购季进行中,实测华为云协同办公产品有多值!AI耳机AIxFU来了!基于阿里云通义大模型深度打磨,性能、智能、价格重新定义行业标准 | AI火花集深度探索 智享同行,由长江鲲鹏联合华为云共同举办的共话AI·DeepSeek专场私享会在光谷成功举办海信新风空调小氧吧X7Pro:一场关于“呼吸自由”的进化即将揭晓?鸿蒙原生版同程旅行体验大有不同,松弛感出行轻松拿捏AI引领,生态赋能,施耐德电气创赢计划第五季结营仪式举行鸿蒙原生版云闪付下载量破百万!一个App即可绑定近2000家银行卡晴数智慧新品发布!高品质 SFT 双工自然对话数据打造超一流交互大模型
【免责声明:CSDN本栏目发布信息,目的在于传播更多信息,丰富网络文化,稿件仅代表作者个人观点,与CSDN无关。其原创性以及文中陈述文字和文字内容未经本网证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本网不做任何保证或者承诺,请读者仅作参考,并请自行核实相关内容。您若对该稿件有任何怀疑或质疑,请立即与CSDN联系,我们将迅速给您回应并做处理。】