DeepSeek 推出新版 升级强在哪里?
来源:倍可亲(backchina.com)中国初创公司推出的人工智能应用DeepSeek发布升级版,速度更快,并针对下一代国产芯片设计。
中国人工智能新创公司DeepSeek本周四(8月21日)发布了升级版,公司表示,新版本提升了处理速度, 使用了 UE8M0 FP8 Scale 的参数精度。DeepSeek 解释称,UE8M0 FP8 是针对即将发布的下一代国产芯片设计。
DeepSeek对国内芯片的适配,可能意味着,它的AI模型走向与中国新兴半导体生态系统兼容。与此同时,随着美国对中国的技术出口愈发限制,北京正推动替代美国的本土产品。
今年,DeepSeek凭借其能够与OpenAI的ChatGPT等西方AI模型竞争,同时运营成本更低的产品,震惊了科技界。
此次V3模型的升级版本DeepSeek-V3.1,是继今年3月和5月公司对核心模型分别进行的两次更新之后的又一新版本。
财联社报道,V3.1对分词器及chat template进行了调整,与DeepSeek-V3存在明显差异。并且使用了UE8M0 FP8 Scale的参数精度。它是针对即将发布的下一代国产芯片设计。新模型在工具使用与智能体任务中表现提升,用户可通过“深度思考”按钮切换思考模式与非思考模式。
路透社指出,FP8是一种数据处理格式,能够让AI模型运行更高效,使用更少的内存,同时速度更快。DeepSeek没有透露具体支持哪些芯片型号或厂商。