算法研發工程師
1.2-2.4萬元/月一、崗位職責專注大語言模型(LLM)的微調(SFT、RLHF)、模型蒸餾、量化壓縮技術的研發與實際應用,聚焦冷鏈物流核心業務場景,設計適配冷鏈環境的模型微調與蒸餾方案,兼顧模型性能、推理效率與部署成本之間的平衡。
主導大模型微調所需數據集的構建與持續優化,整合冷鏈物流相關業務數據(如訂單、溫控、倉儲、軌跡等),完成數據清洗、標注及增強處理,針對行業典型問題優化微調策略,提升模型在具體應用場景中的適應能力與準確率。
負責模型蒸餾、量化(INT8/INT4等)、剪枝等關鍵技術的研究與實現,降低模型體積并提升推理效率,滿足冷鏈SaaS平臺、邊緣計算設備等多樣化部署需求,控制資源消耗與運行成本。
跟蹤大模型微調與蒸餾領域的最新進展(如低秩適配、增量微調、知識蒸餾框架等),結合冷鏈業務特性開展技術預研與驗證,推動前沿技術在實際業務中落地轉化,助力調度效率提升、貨損率下降和響應速度優化。
協同大模型算法、產品及工程團隊緊密合作,提供微調與蒸餾環節的技術支持,解決模型上線過程中的性能瓶頸、兼容性問題,保障模型穩定高效地部署至生產系統。
總結大模型微調與蒸餾的技術路徑與實踐經驗,建立標準化方法論和技術規范,促進團隊整體技術水平提升,參與技術文檔撰寫與測試標準制定工作。
二、任職要求
1. 核心要求
學歷:本科及以上學歷,計算機科學、人工智能、深度學習、數學等相關專業背景;碩士及以上學歷,或具備頂會論文、開源項目經驗者優先考慮。
經驗:2年以上大模型微調(SFT、RLHF)、模型蒸餾相關工作經驗,具備完整項目從研發到落地的實踐經驗;有物流、供應鏈、冷鏈等行業模型優化經歷者優先。
技術能力:熟練掌握Python編程語言,精通PyTorch、TensorFlow等主流深度學習框架,熟悉常用大模型微調工具(如DeepSpeed、LoRA、QLoRA等)和蒸餾框架(如TinyLlama、DistilBERT等)。
專業知識:深入理解大模型底層機制與Transformer架構,掌握模型微調、蒸餾、量化、剪枝等核心技術,能獨立完成方案設計與實現,有效應對實際技術挑戰。
數據與工程能力:具備處理大規模異構數據的能力,可獨立開展微調數據集的構建與優化工作;了解模型部署技術棧(如Docker、K8s、vllm等),能夠配合工程團隊推進模型上線。
2. 加分項
具有冷鏈物流或供應鏈領域的大模型微調與蒸餾實踐經驗,熟悉倉儲調度、路徑規劃、溫控預警等業務場景,能基于業務需求調整模型優化策略者優先。
有對主流開源大模型(如Qwen、LLaMA、GLM等)進行微調或蒸餾的經驗,熟練使用LoRA、QLoRA等高效微調方法,或具備GPTQ、AWQ等模型量化實戰經驗者優先。
具備模型工程化落地能力,熟悉邊緣端部署流程與推理加速技術,能將優化后的模型高效集成到生產環境中者優先。
曾在NeurIPS、ICML、ICLR等頂級AI會議發表過相關論文,或在重要算法競賽中取得突出成績者優先。
了解冷鏈SaaS系統或物流調度平臺,具備良好的跨團隊協作意識、問題分析能力和技術創新熱情,對模型壓縮與優化有強烈興趣。