最近两天,DeepSeek又引发了新一轮的讨论热潮——微信搜一搜和百度搜索接连宣布接入DeepSeek,选择同时调用混元大模型/文心大模型。这意味着,DeepSeek距离我们的生活更进了一步。

随着DeepSeek对AI行业的冲击波持续蔓延,它不仅影响到了云,更是进一步促进了端侧AI的发展。最近,花旗分析师Laura Chen团队就表示,别光盯着云端AI看,DeepSeek的出现推动了AI技术更加普及和高效,其崛起将推动小型化模型即边缘AI的推广。云端和边缘处理的混合AI模型会是AI未来的发展方向。

与上述预测相对应的是,越来越多AI芯片、AI模组和一体机厂商开始宣布适配DeepSeek。

端侧AI芯片多点开花

有了云端AI,为什么我们还需要边缘AI?用《韩非子·说林上》中的一句话来解释,便是“失火而取水于海,海水虽多,火必不灭矣,远水不救近火也”。云端AI相当于是大海,虽然水多、能力强,但对于特殊的场景终究远水解不了近渴。

这几年,大模型领域可以说是“百模大战”,也可以说是“群模乱舞”。实际上,我们不需要这么非常多的大模型,因为它们非常浪费电力能源,因此根据芯原CEO戴伟民的预测,端侧AI将会成为市场的大趋势,并且到2028年,用于端侧微调卡和推理卡的销售额将超过用于云侧的训练卡。此外,端侧AI还能减轻云端服务器的计算负担,降低对中心化计算资源的依赖,从而降低成本。

随着算法技术不断进步,包括模型量化、剪枝、蒸馏等模型压缩算法,以及专为端侧部署设计的软硬件平台的出现,AI大模型在端侧设备部署正在变得更加高效便捷。

之所以DeepSeek火爆全球,源于其在模型架构、蒸馏技术以及强化学习等方面突破性创新。更重要的是,DeepSeek-R1除了完整版的671B模型,还开发了系列小尺寸蒸馏模型,参数范围覆盖1.5B至70B,简化后的小模型从大模型中继承了强大的AI能力,尽管参数量减少,但性能依然出色。这进一步推动了端侧AI的商业化应用。

从春节至今,就有许多厂商接连宣布适配DeepSeek。

1.阿里巴巴玄铁:玄铁团队已顺利完成 DeepSeek-R1 系列蒸馏模型在搭载玄铁 C920 处理器芯片的相关适配,全程耗时约 1 小时,持续助力未来智能终端算力实现新一轮稳健提速。蒸馏后的Qwen 1.5b模型在某些数据集下的表现超过了GPT-4o和Claude 3.5 Sonnet claude。充分证明了 DeepSeek 在优秀性能的加持下,使得规模较小的大模型也能拥有媲美大模型的性能表现,间接降低了对推理算力的需求,使得高性能大模型在 RISC-V CPU 上高效运行指日可待。

2.安谋科技:预计今年上半年,安谋科技最新一代“周易”NPU处理器将正式亮相市场,该产品在Emulation平台上完成了部署与优化,并在FPGA平台上成功实现了端到端应用的演示。经过严苛测试验证,在标准单批次输入、上下文长度为1024的测试环境中,其在首字计算阶段的算力利用率突破40%,解码阶段的有效带宽利用率高达80%以上。其带宽利用率呈现高线性特性,能够灵活适配16GB/s至256GB/s的系统带宽需求。目前,新一代“周易”NPU软件栈已支持Llama、Qwen、DeepSeek、ChatGLM和MiniCPM等多种主流大模型,提供与Hugging Face模型库的对接工具链,在硬件层面将对外带宽提高至256GB/s,有效解决了大模型计算的带宽瓶颈问题。

3.瑞芯微:瑞芯微RK3588助力香橙派5成功本地运行deepseek-r1 1.5B语言大模型,展现出卓越的性能与适配性。端侧运行时,RK3588凭借自身架构和NPU算力,可流畅运行1.5B模型,生成速度每秒十几token,其能力范围可以覆盖6B、7B模型。RK3588是瑞芯微电子推出的一款高性能处理器,采用先进的8nm制程工艺,集成了四核Cortex-A76和四核Cortex-A55 CPU、Mali-G610 MP4 GPU以及6TOPS的独立NPU。

4.全志科技:宇芯成功在全志T527 Linux系统上本地部署并运行了DeepSeek-R1 1.5B模型。全志T527是一款面向AI计算的8核Cortex-A55 SoC,广泛应用于物联网、智能家居、边缘计算等领域。此外,经测试,Deepseek-R1-Distill-Qwen-1.5B可以在全志A733芯片平台的平板电脑上较流畅地运行的,并且可以让Deepseek拥有中学生级别的逻辑推理能力。

5.开芯院:“香山”开源高性RISC-V处理器核成功适配并本地部署DeepSeek-R1-Distill-Qwen-1.5B大模型,此次成功不仅验证了RISC-V架构处理复杂AI工作负载的能力,也为开源芯片生态的繁荣发展提供了有力支持。

6.爱芯元智:AX650N、AX630C芯片平台早已在节前完成DeepSeek R1蒸馏版本1.5B、7B、8B适配,并在春节期间,海外开发者已基于AX630C平台顺利复现,DeepSeek端侧部署顺利出海。

通信模组企业也在积极布局

除了AI芯片,通信模组厂商也在积极适配DeepSeek。

事实上,在AI技术的实际应用中,完全依赖云端处理的方式存在诸多局限性,包括较大时延和用户隐私等问题。因此,端侧AI在满足隐私保护、提高可靠性、降低延迟、降低云端计算负担等方面所具有的独特优势。“云+端”的混合AI模式已成为当前AI应用落地的主流趋势,将为企业数字化转型提供强有力的支撑。

市场调查机构Counterpoint Research发布的研究报告,也映射出上述趋势:到2030年,AI蜂窝模组的出货量预计将占物联网模组总出货量的25%,相较于2023年6%的占比,实现了显著增长。

1.美格智能:美格智能凭借其高算力AI模组矩阵与端侧大模型部署经验,结合最新发布的AIMO智能体产品,正加速开发DeepSeek-R1模型在端侧落地应用及端云结合整体方案。美格智能基于高通骁龙高性能计算平台打造的AIMO智能体产品,集成48Tops AI算力,支持混合精度计算(INT4/FP8)与异构计算架构(8核CPU+Adreno GPU+Hexagon NPU),可高效承载7B参数级大模型的端侧推理需求。其板载16GB LPDDR5X内存与256GB UFS 4.0存储,为模型动态加载与实时数据处理提供硬件保障。2025年美格智能将推出单颗模组算力达到100Tops的高阶AI硬件,远期规划AI模组算力超过200Tops。

2.广和通:广和通高算力AI模组及解决方案全面支持小尺寸的DeepSeek-R1模型,高效且灵活地构建深度学习体系,不仅保护数据隐私,更大大提升终端推理和运算能力。广和通将积极推动DeepSeek等优质模型在高、中、低算力AI模组及解决方案部署,提供不同参数模型服务,进一步降低端侧AI的门槛,并优化成本,帮助客户快速增强终端AI推理能力,赋能更广泛的物联网设备实现AI化。搭载了DeepSeek-R1的广和通AI模组及解决方案将在自动驾驶(实现路径规划和动态避障)、机器人控制(复杂环境下自主导航和操作)、智能制造(生产线优化与资源调度)、智慧医疗(手术辅助、智能诊断)、AI智能体(自动化办公、智能监控与决策)等场景广泛应用。

3.移远通信:移远通信基于边缘计算模组SG885G,已成功实现DeepSeek模型的稳定运行,并完成了针对性微调。在成功实现DeepSeek模型端侧运行的基础上,移远通信还完成了该模型的针对性微调,并应用于自身的大模型解决方案中,为客户提供更精准、更高效的端侧AI服务。这一成果不仅彰显了移远通信在端侧AI领域的技术实力,更体现了其领先的工程化能力,将有力推动AIoT应用的快速发展与落地。

4.芯讯通:芯讯通高算力AI模组SIM9650L已实测跑通DeepSeek R1模型,能够高效地帮助客户终端搭建深度学习体系。该产品采用42.5×56.5×2.95mm LGA封装,搭载Wi-Fi 6E 2×2MIMO,AI算力超过14TOPS。芯讯通所打造的AI模组产品覆盖多阶梯算力能力,应用功能接口丰富,支持多制式网络连接和全球不同地区频段,包括SIM9650L、SIM8965、SIM8973、SIM8970、SIM8950LH、SIM8960、SIM8905、SIM8906、SIM8502、SIM8918、SIM6600等系列模组。

5.有方科技:面对“公司是否针对 DeepSeek 相关模型开展了模型适配及端侧部署工作”的问题,有方科技在投资者关系平台上答复表示,公司依托于自身物联感知体系“云-管-端”架构建立的优势,积极融合物联网与人工智能技术,在 Deepseek 模型上,公司一方面正在云侧基于模型融合公司运管服云平台开发城域物联感知模型,另一方面也正在端侧开展模型与模组的适配工作,但目前还处于在研状态,尚未产生收入。

6.比邻智联:中移物联网有限公司旗下专业模组公司比邻智联宣布,Cat.1模组接入DeepSeek与九天大模型,让万物会思考。

大模型一体机,开始爆发

AI技术正以“一体机”形态加速渗透至千行万业。

为什么“一体机”突然火了?根据京东云的介绍,所谓的大模型一体机,能够让企业无需纠结于“造轮子”,而是聚焦于“用AI创造价值”。通过将复杂的AI工程化过程封装为标准化产品,让客户能像使用水电一样便捷地调用大模型能力,无论是金融行业的交易风控,还是政府部门的政务审批,均能实现“数据本地化、模型私有化”,更好地进行AI智能化转型。

科创板日报报道中则显示,目前DeepSeek大模型一体机分为推理一体机和训推一体机。其中,推理一体机内置DeepSeek-R1 32B、70B、671B等不同尺寸模型,价格在几十万~数百万元,面向对数据安全、数据隐私较为敏感的企业用户;训推一体机价格就达到数百万元,用于DeepSeek-R1 32B模型预训练和微调。

1.中科曙光:发布全国产DeepSeek大模型超融合一体机。这一创新产品将为政府和企业的数字化、智能化转型按下“加速键”。其不仅全面适配DeepSeek系列模型,如DeepSeek V3、DeepSeek R1和DeepSeek Janus Pro,还支持全系列量化蒸馏版本。同时,对QWen2.5、LLama3.2、ChatGLM等主流大模型也全面兼容,满足各种业务场景需求。

2.联想:与国产GPU领军企业沐曦股份今日联合发布基于DeepSeek大模型的首个国产一体机解决方案。该方案以“联想服务器/工作站+沐曦训推一体国产GPU+自主算法”为核心架构,配合联想AI Force智能体开发平台,推出智能体一体机与训推一体服务器双产品形态,率先实现从千亿参数大模型训练到场景化推理落地的全链条覆盖,为企业破解算力部署复杂、技术门槛高、安全可控难三大核心痛点提供了国产化新路径。

3.中国电信:为了满足企业的私有化、国产化部署需求天翼云正式推出息壤智算一体机-DeepSeek版为各行各业提供性能卓越、安全可控的智能算力解决方案。息壤智算一体机-DeepSeek版集国产算力国产模型和国产云服务于一身深度融合了DeepSeek-R1/V3系列大模型实现了从芯片、推理引擎到模型服务的全栈国产化。其拥有全栈自主可控、卓越性能、灵活高效、经济适用四大特征且无需“云”上接入、开箱即用。

4.中国移动:移动云发挥自身强大的技术优势,推出智算一体机-DeepSeek版,帮用户一站式搞定自主可控的DeepSeek模型应用。

5.中国联通:联通云宣布推出DeepSeek一体机+GPU云服务器“软硬一体”解决方案,加速行业客户适智化转型。

6.华为:昇腾DeepSeek一体机深度融合昇腾高性能算力底座与DeepSeek全系列大模型能力,覆盖语言理解、图像分析、知识推理等全场景需求,为企业提供了一站式的AI解决方案。昇腾推出从服务器、推理卡、到加速模组等丰富的一体机产品形态,全面适配 DeepSeek V3/R1 满血版 / 蒸馏版本全系列模型,涵盖智能对话、智能编程、文档分析、开发板等全场景应用,能够满足各类用户在不同场景下的 AI 需求。

7.浪潮:推出基于DeepSeek模型的“推理一体机”NF5468H7,深度融合DeepSeek全系列模型与国内AI加速卡,打造“开箱即用”的智算解决方案。全面兼容DeepSeek V3(通用底座)、R1(推理优化)、Janus Pro(多模态)等系列模型,支持智能客服与对话、文本分析、工业质检、医疗影像识别等场景快速适配。搭载国内AI算力产品支持基于DeepSeek的量化及分布式推理,满足对DeepSeek系列多类型模型的多并发推理业务需求。

8.新华三:紫光股份旗下新华三集团重磅发布基于DeepSeek大模型的一体机UniCube,全面搭载DeepSeek V3、R1模型,并实现671B DeepSeek大模型单机推理及单机训推一体服务,以强大的变革力,加速百行百业智能进化。

9.紫光云:紫光云公司推出的紫鸾大模型一体机,现已全系优化适配并预制DeepSeek R1系列推理模型,支持英伟达、天数、昆仑芯、燧原科技等异构芯片的统一调度。通过一体化开箱即用私域部署,紫鸾大模型实现了DeepSeek的无忧部署,为政企用户提供高性价比的生产级AI解决方案,打造安全高效的智能方舟。

10.京东云:发布DeepSeek大模型一体机,基于“本地化开箱即用”的理念,提供从底层算力、模型服务、推理能力、应用开发的全栈解决方案,为金融、政府及企业客户打造“数据不出域、性能更高效”的AI服务新范式。

11.中兴通讯:浙江大学上海高等研究院、一蓦科技、壁仞科技、中兴通讯联合打造的智海AI教育一体机,快速实现了国产算力与DeepSeek的适配及知识课程、实训课题、智能体等教学工具的设计开发,形成了包含AI通识课、专业课、实践实训在内的一体化解决方案,让学校能以更低成本、更高效率利用AI技术,加速人工智能教育的普及与实现。

12.中科通量:在SmarCoAI大模型一体机产品中成功完成DeepSeek R1模型与国产RISC-V智能芯片适配,为国产AI大模型落地再添“芯”动力。SmarCoAI是中科通量推出的基于RISC-V国产智能芯片的高通量大模型系列产品。此次适配,中科通量技术团队选用了国产自研的RISC-V智能芯片,针对RISC-V架构和AI加速部件,对DeepSeek R1蒸馏的1.5B-70B模型进行了适配工作。测试数据显示,DeepSeek在SmarCoAI上的性能优异,在RISC-V生态的表现处于业界领先水平。

13.丽台科技:Leadtek AI一体机适配DeepSeek,它集成了高性能计算、智能资源管理、MLOps 自动化等核心功能,提供高效、灵活、安全的 AI 计算解决方案,帮助各行业突破技术壁垒,推动 AI 创新的快速落地。

14.云天励飞:云天天书大模型训推一体机成功适配DeepSeek。该一体机由云天励飞与华为联合推出,可以部署在华为昇腾服务器上,支持私有化部署,实现开箱即用,满足本地化、专属化的业务需求。此次适配成功,标志着云天天书大模型训推一体机对边缘AI场景的应用支持可以进入实际落地阶段。在春节期间,云天励飞官宣DeepEdge10已完成DeepSeek R1系列模型适配。未来,DeepEdge10芯片平台将在端、边、云全面支持DeepSeek全系列模型。

端侧AI的新时代

随着该DeepSeek凭借低成本训练和卓越性能超越ChatGPT登顶中美应用商店榜首,其开源特性与本地部署优势正深刻影响端侧AI产业格局。本地部署在保障数据隐私、提升响应速度和增强定制灵活性方面表现突出,但存在技术门槛高、硬件资源受限等挑战。

当前,智能手机、自动驾驶等场景已实现端侧AI落地,但处理复杂任务时仍面临生成准确性不足的技术瓶颈,所以过去几年一直处于不温不火的状态。随着DeepSeek的出现,金融、医疗、教育及电商等行业已经开始出现智能化转型,尤其在电商领域显著提升了其市场分析、精准营销和内容生成效率。

专家预测,DeepSeek下一步可能会聚焦多模态融合(文本/图像/语音/视频)和专业领域模型开发,此举将进一步加速国内AI产业链创新,吸引更多资本投入并推动硬件研发,从而彻底颠覆端侧AI行业格局。返回搜狐,查看更多


点击扫码分享至微信