下载APP | 繁體版 | 发布广告 |常用工具

地表最强?测试发现马斯克的新AI模型不如OpenAI

京港台:2025-2-19 13:54| 来源:凤凰网科技 | 评论( 7 )  | 我来说几句


地表最强?测试发现马斯克的新AI模型不如OpenAI

来源:倍可亲(backchina.com) 专题:抄底还是跑路?美股最新动态

  北京时间2月19日,埃隆·马斯克(Elon Musk)在周一发布了旗下xAI公司的最新大模型Grok 3,号称“地表最强AI”。然而,据《商业内幕》报道,初步测试显示,尽管Grok 3性能出众,但是在一些重要指标上依旧落后于OpenAI的模型。

  马斯克声称,新Grok 3模型在数学、科学和编程关键指标测试上超越了OpenAI的旗舰模型GPT-4o,以及来自谷歌、DeepSeek和Anthropic的AI竞品。

  一些AI研究人员和专家对Grok 3进行了初步测试,但是结果喜忧参半。计算机科学家安德烈·卡帕西(Andrej Karpathy)是OpenAI的联合创始人,曾领导特斯拉的AI业务,他提前体验Grok 3。

  还差点火候

  卡帕西周一在X上发帖称,Grok 3成功完成了从训练论文中查找复杂信息等任务,推理能力是“最先进的”,并强调了它解决复杂编码问题的能力。然而,与OpenAI的o1-pro模型一样,它在解决“棘手”的井字棋棋盘时遇到了困难。“我的总体印象是,这个模型的能力大约与o1-pro相当,领先DeepSeek-R1。当然我们还需要进行实际、真实的评估来进一步判断。”卡帕西称。

  对于Grok 3新推出的深度搜索工具,卡帕西表示,它的深度搜索能力“大致相当于Perplexity公司的深度搜索功能,虽然很棒,但还没有达到OpenAI最近发布的深度搜索功能,后者依旧感觉更全面和可靠”。

  宾夕法尼亚大学沃顿商学院专门研究AI的教授伊桑·莫利克(Ethan Mollick)表示,尽管xAI的技术进步迅速,但Grok 3并不是明显的领跑者。“这是一个非常稳定可靠的前沿模型,但无法让你停止使用当前的前沿模型。”莫利克在领英上发帖称。

  莫利克指出,尽管Grok 3在某些基准测试上超过了一些OpenAI模型,但它并没有明显超越OpenAI的o3。他表示,虽然Grok 3是一个稳定可靠的模型,但OpenAI 在行业合作和企业采用方面仍然保持着强大优势。“我不确定Grok是否有很大机会成功。”他写道。

  几何智能(Geometric Intelligence)创始人、长期批评AI炒作的加里·马库斯(Gary Marcus)对于Grok 3的质疑声更大。“马斯克承诺Grok 3将是史上最聪明的AI。剧透一下:它并不是。”马库斯在自媒体平台Substack上称。

  马库斯表示,Grok 3发布会是在“照搬”之前的技术演示。尽管Grok 3在技术上有所进步,但与OpenAI模型相比,其表现并没有带来“颠覆性变化”。

  他认为,OpenAI目前不需要担心Grok 3。“奥特曼可以暂时松一口气。Grok 3没有取得什么重大突破。”马库斯表示。他还补充说,OpenAI在算力获取和研究规模方面的主导地位仍然是该公司的一个重要护城河。

  这家最好!股市开户分批买入大盘股指基金

相关专题:SpaceX,美股动态

推荐:美国打折网(21usDeal.com)    >>

        更多科技前沿 文章    >>

【郑重声明】倍可亲刊载此文不代表同意其说法或描述,仅为提供更多信息,也不构成任何投资或其他建议。转载需经倍可亲同意并注明出处。本网站有部分文章是由网友自由上传,对于此类文章本站仅提供交流平台,不为其版权负责;部分内容经社区和论坛转载,原作者未知,如果您发现本网站上有侵犯您的知识产权的文章,请及时与我们联络,我们会及时删除或更新作者。

关于本站 | 隐私政策 | 免责条款 | 版权声明 | 联络我们 | 刊登广告 | 转手机版 | APP下载

Copyright © 2001-2025 海外华人中文门户:倍可亲 (http://www.backchina.com) All Rights Reserved.

程序系统基于 Discuz! X3.1 商业版 优化 Discuz! © 2001-2013 Comsenz Inc. 更新:GMT+8, 2025-5-7 03:36

倍可亲服务器位于美国圣何塞、西雅图和达拉斯顶级数据中心,为更好服务全球网友特统一使用京港台时间

返回顶部