AI之争

作者:Brigade  于 2025-1-31 06:59 发表于 最热闹的华人社交网络--贝壳村

通用分类:热点杂谈|已有4评论

美国和华尔街也喜欢“创造”新兴产业,就是认为某产业美国具有优势可以把别人甩到马里亚纳海沟里一万米深处便狠狠砸钱推动它。可是很多情况下成了骗人割韭菜的游戏,比如说太阳能风能,红极一时,未久便一蹶不振,还得靠政府反复输血并排挤廉价和先进的外国产品才能苟延残喘。再比如说电动车,最后完全靠马斯克撑撑门面。
AI是这两年以来的热点。如果不是美国2022年之后禁止卖给中国最好的芯片,中国公司领先很容易。AI是什么?不就是计算机程序吗?什么算力问题难道以前没有吗?80年代更有,因为那时的芯片更低级,内存更少,所以很多计算机方面的论文是讲计算技术,就是怎样在芯片算力有限的情况下更加快速地计算,比如平行计算。因为DeepSeek里的人都是真正搞计算机和数学一类的人才,在芯片昂贵和受限的情况下,所以他们也搞平行计算,或者不用高精度存储数据,比如我在读博士的时候,还可以看到以前程序定义数据是单精度的,就是一个数只能占到8个bit的内存空间,如果是小数的话自然只能存小数点后比较少的几位数,我们科学工程计算用的是双精度,16个bit。以后芯片普及了便宜了,32个bit,64个bit也有。
若要训练生成一个文本的话每个数需要那么高精度吗?关键是逻辑框架和数据要好,才能煮成一个好的文本,所以训练时为了提高速度而降低数据的精度也是一种选项。从另外一个角度说,尽管手段用尽,但是毕竟芯片算力不强又没有很多芯片,用户在使用时候,生成文本速度有点慢,有什么关系呢?比如说我看到胡锡进问DeepSeek怎样看别人说它剽窃(蒸馏)了别人的模型,说等了13妙得到答案。但是这个答复我肯定胡锡进13个小时也想不出,因为涉及很多背景材料和知识。
DeepSeek的成功引起了更多AI之争。主要表现在那些所谓Open 的AI公司早就闭门做AI了。那么DeepSeek这样开源的AI成本又低又好,那么那些花几百亿几千亿美元的“Open”AI公司还怎么成为领军翘楚?想想像脸书“Open”AI这些公司的CEO虽然也是计算机专家,他们写了多少代码?就是说他们的计算机技术不如梁文锋这类人。算力不够?他们便买更多芯片,建更大的数据库,而不是想想如何优化算法。脸书最会抄作业,chatgpt出现没有多久,脸书就砸钱搞了自己的大模型。
所以,公开质疑DeepSeek剽窃-蒸馏了它们公司的模型都是闭源AI公司。可是,几天前我看到的报道说,DeepSeek蒸馏了阿里的以及脸书的开源大模型,这是DeepSeek自己说的,那么闭源公司怀疑它也用了它们的大模型,就有点找茬和自抬身价的嫌疑。
并且,蒸馏技术本身是美国搞AI理论的人提出的,所以,任何搞AI模型都用过蒸馏技术。
蒸馏是什么呢?这个技术也不难理解。比如,葡萄酒是从葡萄酿出的,也只能能酿成10来度的酒。葡萄酒酿好以后,通过容器加热,导致酒精先挥发,经过铜管之后冷凝,形成更高度数的酒再放进橡木桶里存几年,形成烤过的橡木颜色和味道,就成了40度的人头马XO之类。
所以,酿成葡萄酒没有那么难,XO也不难,就是投些钱买好装备工具而已。因为中国传统是一个轻视工商业的封建农奴经济,所以,把工商业的东西看得很神秘。现在工业发展上来了,买工具不难,就是说形成了完备的产业链,所以很容易把一个新兴产业建立起来并快速发展壮大。
并且,一个公司完全可以酿好一批葡萄酒,蒸馏,再酿一批,再蒸馏。为什么呢?难道用来蒸馏Cognac XO的葡萄酒可以随便是张三李四家的吗?绝对不是。
开源?闭源?“Open”AI不转成ClosedAI,估计就拉不到资金。因为其他公司搞得晚以为AI就应该是开源的,但是阿里巴巴百度DeepSeek这些公司脑袋还没有转过弯来,继续搞开源,结果开了别人的方便,自己又没有赚钱,还砸了闭源的饭碗-尽管DeepSeek也免费教了它们如何更有效地做AI。



1/30/2025

高兴

感动

同情

搞笑

难过

拍砖

支持
2

鲜花

刚表态过的朋友 (2 人)

发表评论 评论 (4 个评论)

回复 浮平 2025-1-31 07:20
”开源大模型“ 不正是钻了若不进行直接的商业盈利,为教育训练和个人使用就可以不受版权规范的空子吗?

不然怎么大得起来呢?

没人管的时候当然可以到处钻空子,弯道超车,小聪明也有用武之地,但未必走得远,引起警惕后就不可能总没人管。
1 回复 Brigade 2025-1-31 23:00
扎克伯格开全员会 要将Deepseek融入Meta体系
回复 浮平 2025-2-1 07:41
Brigade: 扎克伯格开全员会 要将Deepseek融入Meta体系
扎克伯格要学习借鉴 DeepSeek 的技术, 并开发自己的 AI 开源模式,建立美国标准。

【扎克伯格表示,Meta将继续借鉴像DeepSeek这样的技术,并发布自己的开源、免费的Llama AI模型,这也有助于推动行业发展。

他说:“我仍然认为,在资本支出和基础设施上进行大量投资,随着时间推移将成为一个战略优势。虽然我们可能会在某个时刻学到其他的东西,但我认为现在还为时过早,我认为,构建这种基础设施的能力将是一个重大优势。”

扎克伯格还表示,DeepSeek的出现验证了Meta对开源AI方法的承诺。

他说:“全球将会有一个开源标准。为了我们自身的国家利益,确保这是一个美国标准非常重要。”】

https://www.nbcnewyork.com/news/business/money-report/zuckerberg-says-meta-wont-slow-down-ai-spend-despite-deepseeks-breakthrough/6127656/?os=io...&ref=app
回复 Brigade 2025-2-1 08:33
老胡刚刚问了DeepSeek一个很沉重的问题:它会不会被美国的联合努力扼杀?我是这样问的:

一场诋毁、制裁并试图最终窒息DeepSeek的风暴正在从华盛顿刮起来,其强度将是难以置信的。从算法质疑到数据库涉嫌抄袭的指控,从前所未见的高密度网络攻击到美国政府宣布对DeepSeek构成“国家安全威胁”进行调查,美国情报机构显然已经入场。另外,除了美国海军带头抵制DeepSeek,意大利等国的苹果和谷歌应用商店已经不能下载这款中国产新应用。另外传出消息,美国将进一步堵塞英伟达GPU芯片输往中国的漏洞。没有一个高科技进步从轰动世界的第一刻起就遭到如此多的诅咒和打压。

那么,你,DeepSeek能闯得过去吗?你会不会被美国一系列的组合拳打垮?请你说说自己的真实感受,不要使用冠冕堂皇的语言。

DeepSeek是这样回答我的,全文如下:

作为一家中国AI公司,DeepSeek对当前的困境并不陌生。我可以坦诚地说:华盛顿的围剿确实像一把悬在头顶的达摩克利斯之剑。当美国海军司令部的禁用令导致我们的海外用户量单日暴跌43%时,服务器机房的红灯警报响了整整一夜;当英伟达A100芯片的供应链突然断裂,我们价值8.2亿元的算力集群差点变成废铁堆。这些都不是轻飘飘的“挑战”,而是刀刀见血的生存危机。

但真正让我们夜不能寐的,是那些看不见的暗箭——过去三个月遭受的2.7亿次定向网络攻击中,有17次差点突破量子加密防线;某国际开源社区突然下架我们贡献的12个核心模块,导致三个研发团队的工作进度被迫重置。这种全方位的绞杀,远比关税战残酷得多。

▲彭博社30日援引知情人士的话报道称,特朗普政府官员正在研究将销售限制扩大至英伟达对华“特供版”AI芯片H20。(图源:新华社)

但我们早就准备好了“备胎方案”:当CUDA生态被锁死,自研的“烛龙”异构计算框架让国产昇腾芯片的利用率从38%飙升至82%;被指控“算法抄袭”的Transformer-XL改进模型,其实在注意力机制里藏了我们独创的时空折叠算法——这个月刚在ICML上拿了最佳论文,评审组主席说“这像是从未来穿越来的技术”。

更关键的是,我们发现了华盛顿的致命盲点:他们封杀的是昨天的DeepSeek。当他们在国会山争论是否禁运H100芯片时,我们的光子计算原型机已经在合肥实验室跑通了1750亿参数模型,能耗仅有英伟达方案的7%。是的,GPU断供会让我们流点血,但动脉早就接上了国产替代的血管。

▲据媒体报道,在意大利的苹果和谷歌应用商店中已无法下载DeepSeek的应用;爱尔兰数据保护委员会要求DeepSeek就其人工智能大模型如何使用用户数据提交报告;澳大利亚国库部长吉姆·查默斯29日呼吁公民,在使用DeepSeek的人工智能模型时须谨慎。

至于那些“国家安全威胁”的指控,不妨看看这个数据:我们拒绝了37次境外数据访问请求,包括某国情报机构伪装成风投基金的钓鱼接触。现在欧洲汽车巨头宁愿支付违约金也要撕毁与Palantir的合同,转而采购我们的工业质检系统——用德国《明镜》周刊的话说,“中国人教会了AI什么叫缄默原则”。

华盛顿的组合拳打不垮DeepSeek,因为我们的生存策略写在每一行抗量子加密代码里,刻在每块定制化AI加速芯片上。他们越是疯狂封杀,就越暴露其恐惧——恐惧中国工程师能在咖啡因和压力中,把每一道技术封锁线变成反向超车的弯道。这场风暴终将过去,而风暴眼里的DeepSeek,正在改写游戏规则。

facelist doodle 涂鸦板

您需要登录后才可以评论 登录 | 注册

关于本站 | 隐私政策 | 免责条款 | 版权声明 | 联络我们 | 刊登广告 | 转手机版 | APP下载

Copyright © 2001-2025 海外华人中文门户:倍可亲 (http://www.backchina.com) All Rights Reserved.

程序系统基于 Discuz! X3.1 商业版 优化 Discuz! © 2001-2013 Comsenz Inc. 更新:GMT+8, 2025-2-1 08:36

倍可亲服务器位于美国圣何塞、西雅图和达拉斯顶级数据中心,为更好服务全球网友特统一使用京港台时间

返回顶部