下载APP | 繁體版 | 发布广告 |常用工具

登录注册找回密码切换风格

我要发布

下载量超越ChatGPT，DeepSeek究竟何方神圣？

京港台：2025-1-27 22:15| 来源：德国之声 | 评论( 7 )条 | 我来说几句

下载量超越ChatGPT，DeepSeek究竟何方神圣？

来源：倍可亲(backchina.com)

　　据德国之声报道，中国AI初创公司深度求索（DeepSeek）推出的人工智能助手登顶苹果应用商店免费下载榜单，打败一众AI巨头。其推理模型DeepSeek-R1在多项测试中脱颖而出，训练成本却仅为ChatGPT的几十分之一。

　　就在特朗普(专题)宣布5000亿美元投资人工智能领域之际，中国AI初创公司深度求索（DeepSeek）于本周一（1月27日）推出了两个新的AI语言模型：DeepSeek-R1-Zero和DeepSeek-R1。据公司透露，这些模型在某些基准测试中的表现卓越，性能直接对标OpenAI的o1正式版。而其价格仅为o1的几十分之一，且以开源形式向全球开发者开放。

　　与大多数传统大型语言模型（LLM）不同，DeepSeek-R1采用了一种被称为“模拟推理”（simulated reasoning）的方法。模拟了类似人类的思维链，采用长链推理（Chain-of-Thought， CoT）技术，能够逐步分解复杂问题，并通过多步骤逻辑推理解决问题。这一过程比典型的语言模型耗时更多，但在处理数学、物理和自然科学领域的任务时，能显著提高结果的准确性。

　　OpenAI的o1模型是2024年9月推出，是首个采用此种方法的OpenAI模型。

　　令人瞩目的测试成绩

　　DeepSeek通过多种基准测试评估了其模型性能。

　　在数学测试Aime 2024中，DeepSeek-R1取得了79.8%的成绩，略高于OpenAI的79.2%。

　　在Math-500基准测试中，该模型的准确率达到97.3%，超越了所有其他测试系统。

　　在编程能力测试SWE-bench Verified中，DeepSeek-R1的得分为49.2%，展现了专家级的编程能力。

　　在常识测试MMLU和GPQA Diamond中，该模型的准确率分别为90.8%和71.5%。在写作和问答基准测试AlpacaEval 2.0中，该模型的胜率达到87.6%。

　　不过，上述测试结果尚未得到独立验证，因此必须谨慎解读。

　　该模型数据库使用截至2024年7月的信息进行训练。与OpenAI当前的模型类似，DeepSeek 还可以根据需要整合来自网络的更新信息。但其并不具备生成图像的功能。

　　开放许可

　　与硅谷竞争对手开发的专有大语言模型（LLM）不同，DeepSeek是开源的，这意味着任何人都可以访问其应用程序代码，了解其工作原理，并自行进行修改。

　　其推理模型DeepSeek-R1遵循MIT License开源协议，允许用户自由使用、修改，包括用于商业目的。

　　“我们正处于一个由非美国公司保持OpenAI最初使命的时代——真正开放的、前沿的研究，赋与所有人权力。”英伟达（Nvidia）高级研究经理Jim Fan在社交平台X上写道。

　　DeepSeek表示，它“在开源模型中名列前茅”，并且“可与全球最先进的闭源模型相媲美”。

　　Scale AI创始人Alexandr Wang在X上写道，“DeepSeek给美国敲响了警钟。”

　　性价比高

　　DeepSeek-R1的最大版本包含6710亿个参数。公司还提供了多个简化版本，参数范围从15亿到700亿不等，其中最小的版本甚至可以在笔记本电脑上运行。

　　在商业领域，DeepSeek以极具竞争力的价格进入市场。相比OpenAI的o1版本每生成100万词元（token）需支付60美元，DeepSeek仅需2.19美元，价格仅为前者的5%。

　　但有限制

　　然而，DeepSeek-R1在基础配置上受到中国特有的限制。根据中国对互联网服务的规定，人工智能系统需体现“社会主义核心价值观”。

　　这就意味着，与百度的“文心一言”（Ernie Bot）等其他中国聊天机器人一样，DeepSeek对政治敏感话题（如天安门事件或台湾(专题)独立国家地位等）有限制。例如，当被问及中国领导人习近平(专题)或北京在新疆的政策时，它会建议“谈论其他事情”。

　　测试中，德语版DeepSeek对相关政治敏感问题提供了类似ChatGPT的详细回答。然而，当用英语提问时，AI更倾向于转移话题。

　　根据ArsTechnica的报道，通过本地部署而非云端版本运行该系统时，可完全绕过政治过滤功能，这得益于其开源许可模式。

　　极低的训练成本

　　令人惊讶的是，DeepSeek的开发成本远低于预期。据Jim Fan 称，DeepSeek用了两个月时间，花费 558 万美元训练了其基础模型（V3）。与美国科技巨头在AI领域投入的数十亿美元相比，只能算是九牛一毛。

　　另外，据新浪财经报道，DeepSeek购买了1万多块英伟达GPU，随后又扩大到5万块。这与OpenAI、谷歌、Anthropic等领先AI实验室动辄超过50万块GPU相比，投入成本低到惊人。

　　而分析人士一直认为，美国在生产高性能芯片上的关键优势，以及阻止中国获取相关技术的能力，将使其在AI竞赛领域占据上风。

　　随着DeepSeek的强势崛起，美国和日本(专题)主要科技公司股价纷纷下跌。

　　芯片制造巨头英伟达——世界主要人工智能硬件和软件供应商——上周五在华尔街收盘时下跌超过3%。而日本软银公司——该公司是特朗普宣布的一项5000亿美元AI基础设施建设计划的主要投资者之一——周一股价下跌超过8%。

　　特朗普的亲密顾问、风险投资家马克·安德森（Marc Andreessen）将其称为“AI的斯普特尼克时刻”（Sputnik moment），指的是当年苏联卫星发射引发美苏太空竞赛。

　　“DeepSeek R1 是我见过的最令人惊叹和印象深刻的突破之一，” 安德森在社交平台X（前推特）上写道。

　　DeepSeek是谁？

　　DeepSeek是一家位于中国杭州市的人工智能技术研究初创公司“深度求索”。杭州以科技公司密集而闻名。其开发的程序DeepSeek既可以作为APP使用，也可以在桌面端运行。它能够完成许多AI助手可以做到的事情，比如编写歌词、制定个人发展计划，甚至根据冰箱里的食材写出一份晚餐食谱。

　　它也可以用多种语言进行交流，但DeepSeek向法新社表示，它在英语和中文上的表现最为出色。

　　然而，无论是编写复杂的代码还是解决困难的数学问题，业内人士对DeepSeek的能力与竞争对手的接近程度感到惊讶。

　　Alexandr Wang在接受CNBC采访时表示：“我们发现，DeepSeek是表现最好的，或者至少与最好的美国模型相当。”

　　中美AI领域竞争加剧

　　DeepSeek R1的发布正值美国政府加强对中国出口AI技术限制之时。OpenAI等企业已警告称，中国的模型未来可能追赶甚至超越美国。

　　北京领导层已誓言到2030年成为人工智能技术的全球领导者，并计划在未来几年内投入数百亿美元支持该行业。

　　目前，包括DeepSeek、阿里巴巴以及Moonshot AI在内的至少三家中国实验室，已推出据称可媲美OpenAI o1的模型。

　　而DeepSeek的成功也表明，中国企业已经开始克服阻碍其成功的障碍。

　　乔治梅森大学（George Mason University）AI研究员迪恩·鲍尔（Dean Ball）认为，这一趋势表明，中国开发团队正在迅速接近前沿技术水平。他特别指出，DeepSeek的小型版本R1能够在普通家庭电脑上运行，这将有助于推动AI应用的普及与民主化。

　　“DeepSeek小型模型的卓越性能意味着强大的推理系统会迅速传播，并能在本地硬件上运行——远离任何集中监管（包括美国的出口管制）的视线。”

　　（综合报道）

下载量超越ChatGPT，DeepSeek究竟何方神圣？

下载量超越ChatGPT，DeepSeek究竟何方神圣？

推荐：美国打折网(21usDeal.com) >>

更多科技前沿文章 >>

下载量超越ChatGPT，DeepSeek究竟何方神圣？

下载量超越ChatGPT，DeepSeek究竟何方神圣？

推荐：美国打折网(21usDeal.com) >>

更多科技前沿 文章 >>

更多科技前沿文章 >>