NPU架构与边缘AI - 即合智能

为什么选择NPU?

当AI推理需在设备端实时完成，且对功耗成本有严格约束时，专用NPU是最优选择。

混合精度推理

同时支持INT4和INT8精度推理，灵活切换，智能调度。

多模型并行

单台设备可同时运行10+种AI模型。NPU算力智能分配，优先保障高优先级任务。

NPU算子深度优化

我们针对RK3576平台的NPU进行了系统性的算子优化工作，将标准YOLOv8-s模型的推理延迟从约180ms降至约85ms——提升超过50%。

我们提供完整的模型部署工具链，支持主流框架训练的模型一键转换为NPU可执行格式，从模型文件到边缘可执行包通常30分钟内即可完成。