推理引擎研發(fā)?程師
?
崗位畫像:
?
AI專業(yè),AI或計(jì)算機(jī)教育背景
?
能夠利?AI?具快速交付成果
?
思維邏輯強(qiáng)
?
熟悉LLM、Python、PyTorch、Transformer
?
?作內(nèi)容:
?
?
經(jīng)驗(yàn):3年
?
學(xué)歷:碩?及以上
?
薪資范圍:30k-35k
崗位描述
1. LLM與AIGC 推理引擎的開發(fā)與優(yōu)化
2. LLM與AIGC 推理中間件的開發(fā)與優(yōu)化
3. LLM與AIGC 推理引擎在不同芯?上的適配與優(yōu)化
4. LLM與AIGC 先進(jìn)推理技術(shù)的探索與研究
5. LLM與AIGC 模型適配與優(yōu)化
崗位要求
1. 碩?及以上學(xué)歷,??智能、計(jì)算機(jī)科學(xué)、電?信息等相關(guān)專業(yè),應(yīng)屆畢業(yè)?
2. 1-3 年 AI 研發(fā)經(jīng)驗(yàn)。
3. 對(duì)?模型推理引擎、K8s、容器、?絡(luò),分布式、GPU架構(gòu)、云原?AI等??技術(shù)有深?研究;
4. 具備扎實(shí)的?程能?,Go、C/C++、Python等開發(fā)語(yǔ)?,具有豐富的開發(fā)、調(diào)試和性能優(yōu)化等經(jīng)
驗(yàn);
5. 熟悉 LLM 與 AIGC 推理引擎關(guān)鍵技術(shù)、如算?優(yōu)化、模型壓縮與量化 、 分布式并?推理、推理引
擎運(yùn)?時(shí)、模型編譯等
6. 熟悉主流深度學(xué)習(xí)框架(例如PyTorch)、推理引擎框架(vLLM、SGLang),Kubeflow,并對(duì)底層實(shí)
現(xiàn)有?定了解,在模型訓(xùn)練或推理性能優(yōu)化??有實(shí)操經(jīng)驗(yàn)
7. 熟悉 kubernetes?作原理,熟悉調(diào)度器、資源擴(kuò)展機(jī)制、容器運(yùn)?時(shí)、容器?絡(luò)等技術(shù)8. 對(duì)AI系統(tǒng)的性能分析?具、GPU架構(gòu)、?性能?絡(luò)、?性能緩存.?模型原理等技術(shù)有深?理解,
有開發(fā)和優(yōu)化經(jīng)驗(yàn)
9. 熟悉 Transformer / Diffustion / DiT 等模型技術(shù)的原理與實(shí)現(xiàn)
加分項(xiàng)
1. 有完整的推理系統(tǒng)或推理引擎開發(fā)經(jīng)驗(yàn)者優(yōu)先
2. 熟悉主流深度學(xué)習(xí)框架底層原理(如 Transformer 、PyTorch、vLLM、SGLang)者優(yōu)先
3. 有模型蒸餾、剪枝、量化等模型壓縮與部署優(yōu)化經(jīng)驗(yàn)者優(yōu)先
4. 有分布式系統(tǒng)開發(fā)、異構(gòu)計(jì)算資源管理與調(diào)度經(jīng)驗(yàn)者優(yōu)先。