下载APP | 繁體版 | 发布广告 |常用工具

下载量超越ChatGPT,DeepSeek究竟何方神圣?

京港台:2025-1-27 22:15| 来源:德国之声 | 评论( 7 )  | 我来说几句


下载量超越ChatGPT,DeepSeek究竟何方神圣?

来源:倍可亲(backchina.com)

  据德国之声报道,中国AI初创公司深度求索(DeepSeek)推出的人工智能助手登顶苹果应用商店免费下载榜单,打败一众AI巨头。其推理模型DeepSeek-R1在多项测试中脱颖而出,训练成本却仅为ChatGPT的几十分之一。

  就在特朗普(专题)宣布5000亿美元投资人工智能领域之际,中国AI初创公司深度求索(DeepSeek)于本周一(1月27日)推出了两个新的AI语言模型:DeepSeek-R1-Zero和DeepSeek-R1。据公司透露,这些模型在某些基准测试中的表现卓越,性能直接对标OpenAI的o1正式版。而其价格仅为o1的几十分之一,且以开源形式向全球开发者开放。

  与大多数传统大型语言模型(LLM)不同,DeepSeek-R1采用了一种被称为“模拟推理”(simulated reasoning)的方法。模拟了类似人类的思维链,采用长链推理(Chain-of-Thought, CoT)技术,能够逐步分解复杂问题,并通过多步骤逻辑推理解决问题。这一过程比典型的语言模型耗时更多,但在处理数学、物理和自然科学领域的任务时,能显著提高结果的准确性。

  OpenAI的o1模型是2024年9月推出,是首个采用此种方法的OpenAI模型。

  令人瞩目的测试成绩

  DeepSeek通过多种基准测试评估了其模型性能。

  在数学测试Aime 2024中,DeepSeek-R1取得了79.8%的成绩,略高于OpenAI的79.2%。

  在Math-500基准测试中,该模型的准确率达到97.3%,超越了所有其他测试系统。

  在编程能力测试SWE-bench Verified中,DeepSeek-R1的得分为49.2%,展现了专家级的编程能力。

  在常识测试MMLU和GPQA Diamond中,该模型的准确率分别为90.8%和71.5%。在写作和问答基准测试AlpacaEval 2.0中,该模型的胜率达到87.6%。

  不过,上述测试结果尚未得到独立验证,因此必须谨慎解读。

  该模型数据库使用截至2024年7月的信息进行训练。与OpenAI当前的模型类似,DeepSeek 还可以根据需要整合来自网络的更新信息。但其并不具备生成图像的功能。

  开放许可

  与硅谷竞争对手开发的专有大语言模型(LLM)不同,DeepSeek是开源的,这意味着任何人都可以访问其应用程序代码,了解其工作原理,并自行进行修改。

  其推理模型DeepSeek-R1遵循MIT License开源协议,允许用户自由使用、修改,包括用于商业目的。

  “我们正处于一个由非美国公司保持OpenAI最初使命的时代——真正开放的、前沿的研究,赋与所有人权力。”英伟达(Nvidia)高级研究经理Jim Fan在社交平台X上写道。

  DeepSeek表示,它“在开源模型中名列前茅”,并且“可与全球最先进的闭源模型相媲美”。

  Scale AI创始人Alexandr Wang在X上写道,“DeepSeek给美国敲响了警钟。”

  性价比高

  DeepSeek-R1的最大版本包含6710亿个参数。公司还提供了多个简化版本,参数范围从15亿到700亿不等,其中最小的版本甚至可以在笔记本电脑上运行。

  在商业领域,DeepSeek以极具竞争力的价格进入市场。相比OpenAI的o1版本每生成100万词元(token)需支付60美元,DeepSeek仅需2.19美元,价格仅为前者的5%。

  但有限制

  然而,DeepSeek-R1在基础配置上受到中国特有的限制。根据中国对互联网服务的规定,人工智能系统需体现“社会主义核心价值观”。

  这就意味着,与百度的“文心一言”(Ernie Bot)等其他中国聊天机器人一样,DeepSeek对政治敏感话题(如天安门事件或台湾(专题)独立国家地位等)有限制。例如,当被问及中国领导人习近平(专题)或北京在新疆的政策时,它会建议“谈论其他事情”。

  测试中,德语版DeepSeek对相关政治敏感问题提供了类似ChatGPT的详细回答。然而,当用英语提问时,AI更倾向于转移话题。

  根据ArsTechnica的报道,通过本地部署而非云端版本运行该系统时,可完全绕过政治过滤功能,这得益于其开源许可模式。

  极低的训练成本

  令人惊讶的是,DeepSeek的开发成本远低于预期。据Jim Fan 称,DeepSeek用了两个月时间,花费 558 万美元训练了其基础模型(V3)。与美国科技巨头在AI领域投入的数十亿美元相比,只能算是九牛一毛。

  另外,据新浪财经报道,DeepSeek购买了1万多块英伟达GPU,随后又扩大到5万块。这与OpenAI、谷歌、Anthropic等领先AI实验室动辄超过50万块GPU相比,投入成本低到惊人。

  而分析人士一直认为,美国在生产高性能芯片上的关键优势,以及阻止中国获取相关技术的能力,将使其在AI竞赛领域占据上风。

  随着DeepSeek的强势崛起,美国和日本(专题)主要科技公司股价纷纷下跌。

  芯片制造巨头英伟达——世界主要人工智能硬件和软件供应商——上周五在华尔街收盘时下跌超过3%。而日本软银公司——该公司是特朗普宣布的一项5000亿美元AI基础设施建设计划的主要投资者之一——周一股价下跌超过8%。

  特朗普的亲密顾问、风险投资家马克·安德森(Marc Andreessen)将其称为“AI的斯普特尼克时刻”(Sputnik moment),指的是当年苏联卫星发射引发美苏太空竞赛。

  “DeepSeek R1 是我见过的最令人惊叹和印象深刻的突破之一,” 安德森在社交平台X(前推特)上写道。

  DeepSeek是谁?

  DeepSeek是一家位于中国杭州市的人工智能技术研究初创公司“深度求索”。杭州以科技公司密集而闻名。其开发的程序DeepSeek既可以作为APP使用,也可以在桌面端运行。它能够完成许多AI助手可以做到的事情,比如编写歌词、制定个人发展计划,甚至根据冰箱里的食材写出一份晚餐食谱。

  它也可以用多种语言进行交流,但DeepSeek向法新社表示,它在英语和中文上的表现最为出色。

  然而,无论是编写复杂的代码还是解决困难的数学问题,业内人士对DeepSeek的能力与竞争对手的接近程度感到惊讶。

  Alexandr Wang在接受CNBC采访时表示:“我们发现,DeepSeek是表现最好的,或者至少与最好的美国模型相当。”

  中美AI领域竞争加剧

  DeepSeek R1的发布正值美国政府加强对中国出口AI技术限制之时。OpenAI等企业已警告称,中国的模型未来可能追赶甚至超越美国。

  北京领导层已誓言到2030年成为人工智能技术的全球领导者,并计划在未来几年内投入数百亿美元支持该行业。

  目前,包括DeepSeek、阿里巴巴以及Moonshot AI在内的至少三家中国实验室,已推出据称可媲美OpenAI o1的模型。

  而DeepSeek的成功也表明,中国企业已经开始克服阻碍其成功的障碍。

  乔治梅森大学(George Mason University)AI研究员迪恩·鲍尔 (Dean Ball)认为,这一趋势表明,中国开发团队正在迅速接近前沿技术水平。他特别指出,DeepSeek的小型版本R1能够在普通家庭电脑上运行,这将有助于推动AI应用的普及与民主化。

  “DeepSeek小型模型的卓越性能意味着强大的推理系统会迅速传播,并能在本地硬件上运行——远离任何集中监管(包括美国的出口管制)的视线。”

  (综合报道)

相关专题:GPT,ChatGPT,DeepSeek

推荐:美国打折网(21usDeal.com)    >>

        更多科技前沿 文章    >>

【郑重声明】倍可亲刊载此文不代表同意其说法或描述,仅为提供更多信息,也不构成任何投资或其他建议。转载需经倍可亲同意并注明出处。本网站有部分文章是由网友自由上传,对于此类文章本站仅提供交流平台,不为其版权负责;部分内容经社区和论坛转载,原作者未知,如果您发现本网站上有侵犯您的知识产权的文章,请及时与我们联络,我们会及时删除或更新作者。

关于本站 | 隐私政策 | 免责条款 | 版权声明 | 联络我们 | 刊登广告 | 转手机版 | APP下载

Copyright © 2001-2025 海外华人中文门户:倍可亲 (http://www.backchina.com) All Rights Reserved.

程序系统基于 Discuz! X3.1 商业版 优化 Discuz! © 2001-2013 Comsenz Inc. 更新:GMT+8, 2025-5-6 04:15

倍可亲服务器位于美国圣何塞、西雅图和达拉斯顶级数据中心,为更好服务全球网友特统一使用京港台时间

返回顶部