OpenAI握DeepSeek盗用模型证据? "搭便车很常见"
来源:倍可亲(backchina.com)中国大陆AI新创公司「深度求索」(DeepSeek)本周发布最新模型DeepSeek-R1,冲击目前世界领头羊OpenAI旗舰产品GPT-4,震撼全球AI圈,美国硅谷如临大敌,股价摆盪。英国《金融时报》周三(29日)报导,OpenAI声称有证据显示,DeepSeek在违反OpenAI服务条款的情况下,利用业界「蒸馏」技巧让ChatGPT模型训练DeepSeek-R1。业界人士指出,美国、中国的小公司为省成本「搭便车」情况很常见,难以完全杜绝。
美国财经媒体彭博社(Bloomberg)先前报导,OpenAI与微软(Microsoft)正在调查DeepSeek是否使用OpenAI的应用程式介面(API),把OpenAI的AI模型整合到DeepSeek自有模型。消息人士说,微软资安研究人员去(2024)年底侦测到大量数据资料经由多个OpenAI开发者帐号外洩,而且微软认为这些帐号与DeepSeek有关。
OpenAI未详述证据 微软不置评
总部位于美国旧金山(专题)的OpenAI向《金融时报》表示,已找到证据显示DeepSeek涉及业界常用来训练AI模型的「蒸馏」(distillation)技术,亦即从更大、更强的模型之中抓取数据输出成果。这种技术用来训练小型模型非常有效,如此操作,API开发成本可能只佔1亿美元打造的GPT-4的一小部分。不过,OpenAI尚未向外界说明证据详情。微软拒绝置评此事,DeepSeek也尚未回应。
微软与OpenAI持续调查ChatGPT模型数据资料外洩情况。
「满满讽刺」
开发人员可以使用OpenAI的API把OpenAI的人工智慧与自家开发应用程式相结合,但由此建立的竞争模型违反了OpenAI服务条款。条款规定,OpenAI的用户不能「复制」平台任何服务或以蒸馏方式开发与OpenAI竞争的模型。美国科技新闻网站The Verge报导此事时以「满满讽刺」(rich with irony)形容,因为OpenAI就是在未经同意的情况下吸收整个网际网路的书面资料,让ChatGPT取得惊人飞越进展。
OpenAI向彭博社表示,该公司明白中国与其他国家的业者正不断尝试借镜美国AI领先业者的模型:「身为人工智慧的领导业者,我们设法採取保护自家智慧财展的因应措施,包括谨慎处理先端技能以纳入已发佈的模型,我们也相信,在自身持续前进的过程中,与美国政府紧密合作以针对最强大模组提供最佳保护是极为重要的,以防对手与竞争者窃走美国开发的技术」。
业界:小公司常搭便车
外号「AI沙皇」的白宫AI与加密货币负责人塞克斯(David Sacks)周二(28日)向福斯新闻(Fox News)表示,有大量证据显示DeepSeek从OpenAI模型中提取知识,「我认为OpenAI很不乐见这种情况」。然而业界不少人士表示,中、美两国的AI实验室常用OpenAI等大公司的开发成果,这些公司花钱请人指导自家模型如何取得进展。模型开发成本高昂且劳力密集,小公司往往会「搭便车」。
加州(专题)大学柏克莱分校正在攻读人工智慧博士的古普达(Ritwik Gupta)说,新创公司与学界使用锁定人类感官思绪的大型语言模型(LLM,例如ChatGPT)输出数据去训练新的模型,这种情形很常见,等于省下人类回馈步骤成本,「若说DeepSeek会这么做,我不觉得有什么奇怪的,但倘若真是如此,要彻底杜绝这种手段恐怕很难」。