下载APP | 繁體版 | 发布广告 |常用工具

DeepSeek 新AI模型或因使用中国芯片而推迟发布

京港台:2025-8-14 22:26| 来源:RFI 华语 | 评论( 10 )  | 我来说几句


DeepSeek 新AI模型或因使用中国芯片而推迟发布

来源:倍可亲(backchina.com)

  中国人工智能公司 DeepSeek 因使用华为昇腾系列芯片进行训练受挫而推迟了其第二代模型的发布,凸显了中国政府力推取代美国技术的局限性。

  《金融时报》报道引述据三位知情人士透露,DeepSeek 在 1 月份发布其 R1模型后,受到当局的鼓励,采用华为 ,而不是使用英伟达的处理器。但知情人士表示,这家中国初创公司在使用 华为昇腾系列Ascend 芯片进行 R2 模型训练的过程中遇到了持续的技术问题,促使其使用英伟达芯片进行训练,使用华为芯片进行推理。

  一位知情人士表示,这些问题是该模型发布日期从 5 月推迟的主要原因,导致其落后于竞争对手。

  训练是指模型从大型数据集中学习,而推理是指使用训练好的模型进行预测或生成响应(例如聊天机器人的查询)的步骤。

  《金融时报》分析指出,DeepSeek 的困境表明,中国芯片在关键任务上仍落后于美国竞争对手,凸显了中国在技术自给自足方面面临的挑战。

  有报道称,中国政府已要求中国科技公司解释其订购英伟达H20芯片的合理性,以鼓励它们推广华为和寒武纪的替代产品。业内人士表示,与英伟达的产品相比,中国芯片存在稳定性问题、芯片间连接速度较慢以及软件质量较差等问题。

  据两位知情人士透露,华为派了一个工程师团队前往 DeepSeek 的办公室,帮助该公司使用其 AI 芯片开发 R2 模型。然而,尽管团队在现场,DeepSeek 仍无法在昇腾芯片上成功进行训练。

  知情人士表示,DeepSeek仍在与华为合作,以使该模型与昇腾芯片兼容进行推理。

  DeepSeek创始人梁文锋内部曾表示,他对R2的进展不满意,并一直在努力投入更多时间构建更先进的模型,以保持公司在人工智能领域的领先地位。

  另一位知情人士补充说,R2 的发布也因更新模型的数据标注时间长于预期而被推迟。中国媒体报道称,该模型最早可能在未来几周内发布。

  作为中美地缘政治斗争中心的芯片制造商,英伟达最近同意向美国政府提供其在华收入的一部分,以恢复其 H20 芯片在中国的销售。英伟达在谈到使用其芯片的中国企业时表示:“开发者将在构建制胜的人工智能生态系统中发挥关键作用。放弃整个市场和开发者只会损害美国的经济和国家安全。”

  DeepSeek 和华为尚未回应置评请求。

 

推荐:美国打折网(21usDeal.com)    >>

        更多科技前沿 文章    >>

【郑重声明】倍可亲刊载此文不代表同意其说法或描述,仅为提供更多信息,也不构成任何投资或其他建议。转载需经倍可亲同意并注明出处。本网站有部分文章是由网友自由上传,对于此类文章本站仅提供交流平台,不为其版权负责;部分内容经社区和论坛转载,原作者未知,如果您发现本网站上有侵犯您的知识产权的文章,请及时与我们联络,我们会及时删除或更新作者。

关于本站 | 隐私政策 | 免责条款 | 版权声明 | 联络我们 | 刊登广告 | 转手机版 | APP下载

Copyright © 2001-2025 海外华人中文门户:倍可亲 (http://www.backchina.com) All Rights Reserved.

程序系统基于 Discuz! X3.1 商业版 优化 Discuz! © 2001-2013 Comsenz Inc. 更新:GMT+8, 2025-8-15 08:56

倍可亲服务器位于美国圣何塞、西雅图和达拉斯顶级数据中心,为更好服务全球网友特统一使用京港台时间

返回顶部