下载APP | 繁體版 | 发布广告 |常用工具

登顶美国APP排行榜 DeepSeek大模型强在哪?

京港台:2025-1-27 22:08| 来源:ETtoday | 评论( 4 )  | 我来说几句


登顶美国APP排行榜 DeepSeek大模型强在哪?

来源:倍可亲(backchina.com)

  

  (取自App Store)

  (北京27日讯)中国AI新创公司DeepSeek近期接连发表两款大模型,还冲上了美国APP Store免费APP下载排行榜的第一名,受到大量关注。

  中媒《澎湃新闻》指出,DeepSeek-R1凭着“物美价廉”引起轰动,费用比OpenAI o1便宜九成,并有着不俗的性能表现。

  报道提到,DeepSeek于20日正式发表推理大模型DeepSeek-R1,作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等。

  据DeepSeek介绍,R1的预训练费用只有557.6万美元,在2048块英伟达H800 GPU(针对中国市场的低配版GPU)集群上运行55天完成,只要OpenAI GPT-4o模型训练成本的不到十分之一。

  DeepSeek表示,R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。

  同时,DeepSeek不只将R1训练技术全部公开,还蒸馏了6个小模型向社区开源,允许用户借此训练其他模型。

  DeepSeek-R1凭其“物美价廉”的特性在开发者社群中受到关注,在API定价方面,DeepSeek R1服务对每百万输入token收取0.55美元,对每百万输出token收取2.19美元/百万,而OpenAI最新版o1模型的相应收费分别为15美元/百万和60美元/百万。

  小有名气的研究者Shubham Saboo表示,作为一款100%开源的模型,R1比OpenAI o1便宜96.4%,同时提供类似的性能,建议已经订阅ChatGPT的开发者“放弃沉没成本”。

  英伟达高级研究科学家Jim Fan表示,DeepSeek-R1可能是“首个展示了RL(强化学习)飞轮可以发挥作用且能带来持续增长的OSS(开源软件)项目”,其中,“飞轮”用来形容AI系统中自我强化、正向循环的过程。

  DeepSeek的论文显示,不同于过去AI模型往往依赖于监督微调(SFT,指AI模型通过已标注的数据进行训练),R1完全由强化学习驱动,证明直接强化学习是可行的。

  Jim Fan指出,“我们正处于一个奇特的时间线上,一家非美国公司正在践行OpenAI最初的使命,即实现真正开放的前沿研究并让所有人受益。这种情况简直无法理解。最有娱乐性的结果却是可能性最大的结果。”

  中国360创办人周鸿禕更表示,DeepSeek这家公司最近的表现简直逆天,相信将来如果要对抗美国的AI技术霸权,中国大模型技术复仇者联盟战队裡一定有DeepSeek的一份,“因为这家公司和它的创始人非常低调,他们技术能力和未来前景被市场严重低估了。”

  新闻来源:ETtoday  

 

相关专题:美国,DeepSeek

推荐:美国打折网(21usDeal.com)    >>

        更多科技前沿 文章    >>

【郑重声明】倍可亲刊载此文不代表同意其说法或描述,仅为提供更多信息,也不构成任何投资或其他建议。转载需经倍可亲同意并注明出处。本网站有部分文章是由网友自由上传,对于此类文章本站仅提供交流平台,不为其版权负责;部分内容经社区和论坛转载,原作者未知,如果您发现本网站上有侵犯您的知识产权的文章,请及时与我们联络,我们会及时删除或更新作者。

关于本站 | 隐私政策 | 免责条款 | 版权声明 | 联络我们 | 刊登广告 | 转手机版 | APP下载

Copyright © 2001-2025 海外华人中文门户:倍可亲 (http://www.backchina.com) All Rights Reserved.

程序系统基于 Discuz! X3.1 商业版 优化 Discuz! © 2001-2013 Comsenz Inc. 更新:GMT+8, 2025-5-6 01:42

倍可亲服务器位于美国圣何塞、西雅图和达拉斯顶级数据中心,为更好服务全球网友特统一使用京港台时间

返回顶部