那么,当前主流的大语言模型对于算力的需求急剧上升,预计需要多少服务器方能满足其算力需求?
根据AI专家Tom Goldstein,30亿参数大模型使用单个A100 GPU生成一个token所需要的时间是6ms,以此估算175b参数规模的模型利用单一A100生成一个单词的时间为350ms,约为2.86词每秒。成都联想代理
根据路透社报道, Chat GPT在2023年3月15日的日度活跃用户为5837万人,假设人均提问数为10次,每次平均生成30个词。OpenAI用户遍布全球,美国用户只占15%,不同时区用户活跃高峰时段错开的前提下,假定 Chat GPT每日活跃运行时间为24h且每时段用户访问数量稳定,在不考虑API接口调用情况下,全球大语言模型渗透率在2023~2027年分别为5%/10%/20%/25%/30%,对应用户数为2.58/5.36/11.13/17.31/20.93亿;每台服务器售价参考英伟达DGX A100 640GB(19.9万美元)。https://www.lenovohs.com/
以联想的智能计算平台——深腾X9000来看,通过去离子化纯净水带走CPU、GPU上热量,温水水冷散热系统可以提供数倍于传统风冷的散热效率,能把数据中心PUE值降低到1.1,实现每年超过42%的能耗降低,远高于国家1.4-1.8区间标准,采用模块化设计思路,深腾X9000为GPU、ASIC等当前以及未来各种形式的计算留出了足够的空间和接口,以适应多种任务负载,可以在 HG、SR、SE 多个服务器硬件产品系列的基础上,配置联想 CPU/GPU/Xeon Phi/FPGA/ 寒武纪等多种异构硬件平台。
【公司名称】成都鸿盛广达科技有限公司
【代理级别】成都联想服务器总代理
【销售经理】成都鸿盛广达科技有限公司
【联系方式】座机:028-85952921 手机:13981931555
【公司地址】成都市武侯区人民南路四段一号时代数码广场A座17楼