端侧大模型 - 即合智能

自然语言视觉问答

用户可用中文直接向设备提问，设备即时返回答案。

100%本地推理

大模型推理完全在设备端完成，无需连接互联网。

检测+理解闭环

传统视觉算法负责"检测"，大模型负责"理解与解析"，两者协作形成闭环。

大模型如何在边缘设备上运行？

大语言模型动辄数十亿参数，如何部署到仅有数GB内存的边缘设备上？我们采用了模型量化、权重剪枝、知识蒸馏等多重优化技术，将模型从数十GB压缩至数百MB，同时在RK3576 NPU上实现推理加速。

端侧大模型并非替代传统视觉检测算法，而是与之互补，解决传统算法难以处理的"开放性问题"。