【崗位職責(zé)】
1、產(chǎn)品規(guī)劃與設(shè)計(jì)
負(fù)責(zé)面向工業(yè)場(chǎng)景的B端算力集群(分布式訓(xùn)練/推理平臺(tái))及C端AI一體機(jī)(邊緣計(jì)算設(shè)備)的行業(yè)需求分析、核心功能定義與技術(shù)方案設(shè)計(jì),輸出PRD及原型文檔。
主導(dǎo)產(chǎn)品技術(shù)標(biāo)書(shū)撰寫(xiě)(含技術(shù)規(guī)格、適配方案、性能參數(shù))、報(bào)價(jià)方案設(shè)計(jì)與成本核算,聯(lián)動(dòng)供應(yīng)鏈團(tuán)隊(duì)完成硬件定制化開(kāi)發(fā)。
2、行業(yè)場(chǎng)景落地
深入工業(yè)客戶現(xiàn)場(chǎng)(如智能制造、能源監(jiān)測(cè)),挖掘AI推理、實(shí)時(shí)數(shù)據(jù)分析等場(chǎng)景痛點(diǎn),定義算力集群的性能-成本-功耗平衡點(diǎn),設(shè)計(jì)差異化解決方案。
聯(lián)動(dòng)算法團(tuán)隊(duì),將分布式訓(xùn)練框架、模型壓縮技術(shù)轉(zhuǎn)化為可落地的產(chǎn)品功能,推動(dòng)工業(yè)級(jí)AI模型的端到端部署。
3、技術(shù)生態(tài)整合
跟蹤國(guó)產(chǎn)GPU技術(shù)生態(tài)(如沐曦、昇騰、寒武紀(jì)、摩爾線程),制定算力集群與第三方框架(PyTorch、TensorFlow)的適配策略,輸出兼容性驗(yàn)證文檔。
設(shè)計(jì)跨平臺(tái)算力調(diào)度系統(tǒng)(如Kubernetes+Slurm混合架構(gòu)),優(yōu)化資源利用率與任務(wù)排隊(duì)效率。
4、全生命周期管理
制定產(chǎn)品Roadmap,把控從硬件選型、研發(fā)測(cè)試到量產(chǎn)交付的全流程,監(jiān)控BOM成本與供應(yīng)鏈風(fēng)險(xiǎn)(如國(guó)產(chǎn)GPU芯片供貨周期)。
通過(guò)客戶POC測(cè)試數(shù)據(jù)、運(yùn)維日志分析,持續(xù)迭代產(chǎn)品性能與穩(wěn)定性(如故障自愈、功耗動(dòng)態(tài)調(diào)節(jié)功能)。
【任職要求】
1、本科及以上學(xué)歷,人工智能、計(jì)算機(jī)等相關(guān)專業(yè);
2、3年以上B端硬件產(chǎn)品經(jīng)理經(jīng)驗(yàn),主導(dǎo)過(guò)AI服務(wù)器、算力集群或工業(yè)智能設(shè)備的產(chǎn)品落地,熟悉GPU/FPGA等加速卡技術(shù)棧。
3、跨團(tuán)隊(duì)協(xié)同能力,可高效對(duì)接硬件研發(fā)(PCB設(shè)計(jì)、散熱方案)、算法團(tuán)隊(duì)(模型輕量化)與交付實(shí)施團(tuán)隊(duì)。
4、數(shù)據(jù)驅(qū)動(dòng)思維,能通過(guò)運(yùn)維埋點(diǎn)數(shù)據(jù)、集群負(fù)載率分析,量化產(chǎn)品優(yōu)化方向
【優(yōu)先項(xiàng)】
1、參與過(guò)國(guó)產(chǎn)AI芯片(如地平線、黑芝麻)的軟硬件協(xié)同開(kāi)發(fā)項(xiàng)目;
2、主導(dǎo)工業(yè)AI一體機(jī)產(chǎn)品定義,熟悉邊緣計(jì)算設(shè)備(如Jetson AGX Orin)的部署瓶頸;
3、熟悉高性能計(jì)算(HPC)集群運(yùn)維,掌握SLURM/Kubernetes調(diào)度器配置。
4、熟悉InfiniBand/RoCEv2網(wǎng)絡(luò)調(diào)優(yōu),或GPU Direct RDMA技術(shù);
5、了解工業(yè)協(xié)議(如OPC UA、Modbus)與AI推理框架(TensorRT、OpenVINO)的集成方案。