来源:环球网

【环球网科技综合报道】6月12日,2026第八届北京智源大会在京举办。作为端侧大模型领域的先行企业,面壁智能在本次大会上展示了全栈技术体系、多场景落地成果,并联合发起智能体与硬件创新孵化计划,全面呈现端侧AI的发展全景。会议期间,面壁智能联合创始人兼CEO李大海与环球网记者进行了深度沟通,围绕端侧AI技术演进、算力生态协同、产业落地路径与行业未来方向等话题,分享了企业实践与行业观察。

技术深耕:能力密度持续跃升 算力生态协同突破

早在2024年,行业曾有预测认为,到2026年底端侧模型的智能水平有望达到GPT-4级别。如今距离该时间节点尚有半年,这一目标已提前实现。李大海介绍,面壁智能近期发布的MiniCPM5-1B端侧模型,仅以1B参数规模,就在国际权威榜单Artificial Analysis上取得17.9分的成绩,与2024年5月发布的200B参数GPT-4o榜单得分仅相差零点几分,印证了大模型密度定律的实践价值。该模型由面壁智能自主研发的AI训练框架ForgeTrain完成预训练,训练效率相比传统框架具备明显优势。


面壁智能联合创始人兼CEO李大海

在模型压缩与量化方向,行业持续探索更低比特的技术路径。李大海表示,1.58bit的三值量化已接近当前技术可触及的压缩极限,行业的核心攻关方向,是在高压缩比下尽可能降低模型性能损失。面壁智能将低比特量化感知训练(QAT)贯穿预训练全流程,从训练初始阶段就完成精度对齐,有效控制了量化带来的效果损耗。此前发布的BitCPM-CANN模型,是国内首个完全基于国产算力平台实现端到端训练并开源的三值大模型,全链路均在华为昇腾平台原生开发完成。相比传统BF16精度,该模型在推理阶段可释放约6倍显存红利,同时将模型能力保留率维持在90%至97.2%区间,为低算力、低功耗场景的稳定运行提供了支撑。

针对业界关注的训练效率话题,李大海进一步澄清,业内提及的95%效率,指的是极低位宽量化感知训练相对普通全精度训练的效率水平。量化器本身会不可避免地带来计算开销与性能损失,经与华为深度协同优化,目前这部分开销已被控制在较低水平,验证了低位宽训练链路在国产算力平台的可行性。

随着行业逐步将大模型训练从传统海外芯片平台向国产算力集群迁移,软硬件生态适配成为核心课题。李大海介绍,面壁智能正从两个维度推动算力生态建设:一方面与国产芯片厂商、智算中心紧密协作,依托自身算子适配与开发积累,通过模型缩放技术在小模型阶段完成训练精度对齐,排查底层技术问题,为大规模训练扫清障碍;另一方面深度参与智源研究院主导的FlagOS软件生态建设,以顶层规划的方式统筹芯片适配工作,推动全行业生态完善。

除国产算力平台外,面壁智能还与高通等海外芯片企业达成了全球战略合作,双方协作深度已延伸至协同设计层面。李大海认为,这种深度的芯片厂商与模型厂商的协同,能够为终端设备打造更优的软硬件整合方案,也是终端厂商选择合作伙伴时的重要考量因素。

产业落地:场景边界不断拓展 端云协同成主流路径

2025年被视作端侧AI的落地元年,进入2026年,端侧模型的落地速度持续加快。针对公众感知中端侧模型存在感不强的疑问,李大海坦言,当前制约端侧AI规模化落地的核心因素,仍是模型与芯片的结合效率。他同时表示,随着一众国产存算一体端侧AI芯片陆续完成流片,其在功耗、算力与带宽层面的竞争力将逐步显现,有望推动端侧应用迎来集中爆发。

在落地形态上,李大海认为端云协同是端侧AI的合理发展路径:上下文管理与高频推理任务在端侧完成,云端承担补充性的算力与能力支撑,二者形成协同关系。按照这一模式,今年将有大量端侧AI应用实现落地。

目前,面壁智能的端侧模型已在多个领域实现规模化应用。智能座舱领域,搭载面壁智能量产级多模态模型的座舱,无需依赖云端即可完成“感知-记忆-推理-执行”的完整闭环,可根据环境与乘客状态自动调节车窗、空调等功能,在车辆事故场景下还能完成状态识别、情绪安抚与理赔流程引导,打通事故处理全链路服务。以吉利银河M9车型为例,相关端侧AI功能需用户主动开启,而实际用户的主动启用比例较高,直接体现了用户对端侧智能体验的认可。

除车载场景外,面壁智能的端侧模型已部署至国内外多家头部手机厂商的产品中,同时在无人机、潜水器等特种智能终端实现落地应用,覆盖多元终端场景。

针对近期苹果推出端侧大模型引发的行业讨论,李大海表示,苹果的云端协同战略早在2024年6月就已对外公布,当前落地进度晚于行业预期,且其大模型业务与谷歌存在深度合作,这一现状恰恰凸显了第三方专业大模型企业的产业价值。国内端侧AI的布局起步更早,面壁智能从2024年便明确端侧战略并与国内终端厂商展开深度合作,行业内各厂商对端侧AI的技术理解与产品布局整体差距并不大,并不会因系统阵营差异形成单边市场挤压。

在李大海看来,终端厂商选择端侧大模型合作伙伴的核心考量集中在三个维度:一是模型厂商持续迭代领先端侧基础模型的能力;二是模型企业与上游芯片厂商的深度协同水平,能够为终端提供更成熟的软硬件整合方案;三是推理优化能力,在手机、汽车等对功耗高度敏感的场景,同等效果下更低的推理功耗,将形成显著的竞争优势。

生态共建:开源赋能创新活力 平衡自主与开放

不久前,面壁智能刚刚结束技术开源周,密集开放了模型、框架与数据等多项技术成果。谈及坚持技术开源的考量,李大海称,开源是一种高效的商业模式,能够大幅降低潜在客户的技术验证成本与内部决策成本,提升技术影响力构建与商务合作的整体效率。

针对开源是否会培育竞争对手这一问题,李大海认为,已开源的内容并非企业的核心竞争力。企业真正的长期壁垒在于持续快速的技术迭代能力,通过保持领先的创新节奏,不断构建多维、复杂的竞争优势,才是企业保持竞争力的核心路径。


“智能体+硬件创新加速孵化器”开启招募

为进一步打通技术创新与产业落地的闭环,面壁智能在本次智源大会上联合北京智源人工智能研究院、OpenBMB开源社区,正式发起“智能体+硬件创新加速孵化器”招募计划。孵化器聚焦AI智能体、下一代AI硬件、AI垂直场景应用三大核心赛道,面向高校科研团队、新锐创业者、跨界创新人才开放招募,重点扶持软硬结合、端侧智能、具身智能领域的早期创新项目。

据介绍,孵化器打造了全链条的孵化支持体系,将为优质早期项目提供单项目最高500万元的综合投资支持,涵盖现金投资、专属GPU算力、大模型Token与API额度、技术支持等核心科创资源,同时配套行业专家指导、办公场地、产业客户对接、投融资对接等全栈服务,针对性破解早期AI创业团队的核心痛点。

谈及国产大模型全球化发展中,技术自主可控与全球开放合作的平衡问题,李大海坦言二者并不冲突。技术自主可控是企业长远发展的内生要求,是构建底层核心能力的基础;在此基础上的开放合作,更多体现在灵活的商业合作模式、对客户与伙伴利益的重视,以及对海外文化需求的尊重等层面。他同时表示:“技术输出与开放合作属于不同范畴,面壁智能将严格遵循国家技术出口相关指导方针,有序推动海外合作开展。”

未来展望:智能体加速进化 端侧定义交互新范式

当前,智能体技术是行业关注的焦点,但其落地过程中也暴露出稳定性、记忆能力等多方面的局限。李大海表示,智能体技术正处于快速进化阶段,目前在多个维度仍有提升空间,但技术发展有其客观规律,公众对零差错的预期相对当前发展阶段偏高。随着技术持续打磨,智能体的落地场景将不断拓展,这一趋势已经显现。

在李大海看来,智能体向端侧迁移是行业的必然发展方向。端侧模型具备隐私友好、实时性强、可靠性高的天然优势,天然适配人与设备的高频交互场景。他以移动互联网时代的云游戏为例指出,云端渲染虽具备理论上的算力优势,但用户对交互帧率、稳定性的极高要求,只有终端本地算力才能充分满足,这一逻辑同样适用于端侧AI交互。端侧模型与智能体技术的结合,将深刻改变人与设备的交互方式,这是云端方案无法替代的核心价值。

谈及端云协同架构下端侧模型的能力边界,李大海认为,AI技术迭代速度极快,端侧模型可承载的任务占比将持续提升。“今年是智能体概念落地的第一年,行业整体仍处于探索阶段,但长期来看,智能体将成为AI应用的常态,端侧模型的能力也将随技术迭代持续跃升。”

谈及未来发展方向,李大海称,面壁智能将始终定位于端侧模型基础设施提供商:一方面持续迭代领先的端侧基础模型,赋能千行百业的开发者与合作伙伴;另一方面直接服务出货量较大的核心设备厂商;同时也将在AI原生终端设备新物种领域开展探索,持续拓展端侧AI的应用边界。(心月)