登顶美国APP排行榜 DeepSeek大模型强在哪?

京港台：2025-1-27 22:08| 来源：ETtoday | 评论( 4 )条 | 我来说几句

来源：倍可亲(backchina.com)

　　（取自App Store）

　　（北京27日讯）中国AI新创公司DeepSeek近期接连发表两款大模型，还冲上了美国APP Store免费APP下载排行榜的第一名，受到大量关注。

　　中媒《澎湃新闻》指出，DeepSeek-R1凭着“物美价廉”引起轰动，费用比OpenAI o1便宜九成，并有着不俗的性能表现。

　　报道提到，DeepSeek于20日正式发表推理大模型DeepSeek-R1，作为一款开源模型，R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版，并采用MIT许可协议，支持免费商用、任意修改和衍生开发等。

　　据DeepSeek介绍，R1的预训练费用只有557.6万美元，在2048块英伟达H800 GPU（针对中国市场的低配版GPU）集群上运行55天完成，只要OpenAI GPT-4o模型训练成本的不到十分之一。

　　DeepSeek表示，R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。

　　同时，DeepSeek不只将R1训练技术全部公开，还蒸馏了6个小模型向社区开源，允许用户借此训练其他模型。

　　DeepSeek-R1凭其“物美价廉”的特性在开发者社群中受到关注，在API定价方面，DeepSeek R1服务对每百万输入token收取0.55美元，对每百万输出token收取2.19美元/百万，而OpenAI最新版o1模型的相应收费分别为15美元/百万和60美元/百万。

　　小有名气的研究者Shubham Saboo表示，作为一款100%开源的模型，R1比OpenAI o1便宜96.4%，同时提供类似的性能，建议已经订阅ChatGPT的开发者“放弃沉没成本”。

　　英伟达高级研究科学家Jim Fan表示，DeepSeek-R1可能是“首个展示了RL（强化学习）飞轮可以发挥作用且能带来持续增长的OSS（开源软件）项目”，其中，“飞轮”用来形容AI系统中自我强化、正向循环的过程。

　　DeepSeek的论文显示，不同于过去AI模型往往依赖于监督微调（SFT，指AI模型通过已标注的数据进行训练），R1完全由强化学习驱动，证明直接强化学习是可行的。

　　Jim Fan指出，“我们正处于一个奇特的时间线上，一家非美国公司正在践行OpenAI最初的使命，即实现真正开放的前沿研究并让所有人受益。这种情况简直无法理解。最有娱乐性的结果却是可能性最大的结果。”

　　中国360创办人周鸿禕更表示，DeepSeek这家公司最近的表现简直逆天，相信将来如果要对抗美国的AI技术霸权，中国大模型技术复仇者联盟战队裡一定有DeepSeek的一份，“因为这家公司和它的创始人非常低调，他们技术能力和未来前景被市场严重低估了。”

　　新闻来源：ETtoday