路透:字节跳动拟用华为晶片研发新AI大型语言模型
来源:倍可亲(backchina.com) 专题:华为最新动态!Exclusive: ByteDance plans new AI model trained with Huawei chips, sources say https://t.co/ESH14sFMcE pic.twitter.com/s1Agckd3WF
— Reuters (@Reuters) September 30, 2024
(中央社华盛顿30日综合外电报导)路透社引述3名知情人士说法报导,受到美国制裁影响,短影音平台TikTok的中国母公司「字节跳动」计划採用华为晶片进行训练,以研发新的人工智慧(AI)模型。
路透社报导,美国2022年开始限制辉达(Nvidia)等先进AI晶片出口以来,字节跳动(ByteDance)转向发展国内AI晶片供应商多元化,并加速研发自有技术。
AI已成为科技产业核心。游戏、电子商务等领域的企业都透过整合客製化AI模型,即採用模式识别来做决策的程式,以提供与众不同的产品选项。
消息人士说,字节跳动在这场AI竞赛中的下一步,是利用华为的昇腾(Ascend)910B晶片来训练AI大型语言模型。
另名消息人士也称,字节跳动正计划推出新的AI模型,但无法证实是否将採用华为的晶片。
3名知情人士和另名消息人士指出,字节跳动已将昇腾910B晶片用于运算强度较低的推理任务,这些任务採用预训AI模型来进行预测。
然而,训练AI模型所需晶片的要求远高于此,不仅要能处理极大量资料,效能也要极佳,例如辉达的高阶绘图处理器(GPU)。
消息人士透露,依运算参数来衡量,新模型的效能和複杂性将不像字节跳动现有的AI模型「豆包」那么强大。
针对报导内容,字节跳动和华为均未回覆置评请求。TikTok驻华府发言人休斯(Michael Hughes)则代表字节跳动表示:「这裡的整个前提都是错的。(我们)没有在研发新模型。」
一名知情人士说,字节跳动今年已订购至少10万个昇腾910B晶片,但截至7月,仅拿到不到3万个,交货速度显然无法满足字节跳动的需求。
两名知情人士说,由于供应受限,运算能力又不如辉达在中国销售的晶片,导致字节跳动无法为新模型设定时间表。
自今年初以来,聊天机器人这类应用程式使用率愈来愈高,「豆包」已是中国最受欢迎的应用程式之一,每月有超过1000万名活跃用户。
消息人士说,AI日益受到重视,也让字节跳动成为华为AI晶片最大买家之一。
消息人士还说,字节跳动也是辉达H20晶片的最大买家。辉达为遵守美国当局的制裁措施,专为中国市场推出这款晶片。