崗位職責:
1. 同算法團隊合作進行高質(zhì)量的算法pipeline設(shè)計優(yōu)化;
2. 深度學(xué)習(xí)模型嵌入式ARM+NPU 異構(gòu)架構(gòu)上的量化、剪枝、蒸餾壓縮,保障精度與效率的均衡;
3. 實現(xiàn)特定算子自定義及優(yōu)化,推理引擎適配及性能提升 ;
4. 工具鏈的二次開發(fā)和部署落地。
任職要求:
1. 精通 C/C++編程(5年以上開發(fā)優(yōu)化經(jīng)驗),精通高性能計算優(yōu)化(SIMD 指令集、內(nèi)存對齊),具備 TensorFlow Lite/ONNX Runtime 等推理引擎定制開發(fā)經(jīng)驗;
2. 熟悉常用計算機視覺算法(立體視覺算法優(yōu)先),嵌入式端側(cè)優(yōu)化,熟練掌握模型量化、稀疏化、算子融合等技術(shù);
3. 深入理解 ARM Cortex-A/R 系列、CEVA DSP 或 Cadence Tensilica 處理器架構(gòu),具備異構(gòu)計算(CPU+NPU+GPU)任務(wù)調(diào)度經(jīng)驗;
4. 有車規(guī)級芯片及機器人芯片平臺(如地平線、Orin、瑞芯微等)部署經(jīng)驗優(yōu)先;
5. 良好的團隊合作能力。