焦点

ChatGPT有多烧钱?大模型训练一次200-1200万美元

时间:2010-12-5 17:23:32  作者:时尚   来源:综合  查看:  评论:0
内容摘要:来源:IT之家 IT之家 2 月 19 日消息,ChatGPT 风靡全球后,科技巨头们纷纷入局,生成式 AI 其背后以大模型为基础的人工智能成为业界投入的方向。IT之家了解到,所谓“大模型”,通常是在

来源:IT之家 

IT之家 2 月 19 日消息,多烧ChatGPT 风靡全球后,模型美元科技巨头们纷纷入局,训练生成式 AI 其背后以大模型为基础的次万人工智能成为业界投入的方向。

IT之家了解到,多烧所谓“大模型”,模型美元通常是训练在无标注的大数据集上,采用自监督学习的次万方法进行训练。之后在其他场景的多烧应用中,开发者只需要对模型进行微调,模型美元或采用少量数据进行二次训练,训练就可以满足新应用场景的次万需要。

然而,多烧训练通用大模型非常“烧钱”。模型美元据国盛证券报告《ChatGPT 需要多少算力》估算,训练GPT-3 训练一次的成本约为 140 万美元,对于一些更大的 LLM(大型语言模型),训练成本介于 200 万美元至 1200 万美元之间。以 ChatGPT 在 1 月的独立访客平均数 1300 万计算,其对应芯片需求为 3 万多片英伟达 A100 GPU,初始投入成本约为 8 亿美元,每日电费在 5 万美元左右。

如果将当前的 ChatGPT 部署到谷歌进行的每次搜索中,需要 512820.51 台 A100 HGX 服务器和总共 4102568 个 A100 GPU,这些服务器和网络的总成本仅资本支出就超过 1000 亿美元。

国盛证券认为,在公有云上,对于以谷歌等全球科技大企业而言,百万至千万美元级别的训练成本并不便宜,但尚在可接受范围内、并非昂贵。

copyright © 2025 powered by 寄雁传书网   sitemap