職位描述
崗位職責:1、負責開發和優化大模型的AI推理效率,通過算子切片、內存優化、GPU并行計算特性、分布式集群推理等高性能優化技術打造高性能大模型AI推理引擎;2、負責將多模態大模型在Nvidia平臺/國產GPU平臺優化與部署,支撐公司AI方向核心業務的發展;3、設計并實現包括算子融合、模型量化、模型壓縮、蒸餾等在內的推理引擎優化技術;4、負責大規模深度學習推理框架的研發與優化;5、參與針對大模型的訓練與推理加速、模型服務化、GPU資源調度等功能的研發;6、協同上下游團隊,分析并解決模型中遇到的大模型訓練、推理的精度和性能問題,提出性能優化策略達成性能目標。任職資格:1、計算機相關專業本科以上學歷,5年以上Linux C++開發經驗,熟悉C++/Python編程,具備扎實的算法和數據結構功底2、了解CPU/GPU架構與工作原理,熟悉LLM算法算子計算原理,熟悉CUDA編程并有相關開發經驗;3、了解AI加速技術,包括但不限于TensorRT/TVM等,熟悉模型壓縮、模型量化等技術;4、具有推理加速相關,精度、速度,調優分析工具鏈的開發經驗;5.、熟悉GPT/transformer結構的深度優化方法和深度學習量化優化實現;6、良好的團隊溝通能力、技術攻關能力,責任心強,具備一定抗壓能力。
企業介紹
暗物智能科技(以下簡稱“暗物智能”)創辦于2017年,公司匯聚國內外人工智能專家與多元化人才管理團隊,致力于打造新一代強認知人工智能技術平臺,服務國家戰略,提升人類福祉。依托于顛覆性的"小數據、大任務"創新研究范式,公司以強認知人工智能核心技術為主攻方向,致力于構筑以場景認知理解、多模態人機交互、認知智能決策等為核心技術優勢的強認知人工智能技術平臺,深度賦能智慧城市、智慧商業、素質教育等國計民生領域。公司自成立以來屢獲殊榮,先后斬獲德勤中國明日之星、廣州“未來獨角獸”創新企業、國家高新技術企業、中國產學研合作創新示范企業等行業殊榮。暗物智能作為強認知人工智能科技的重要實踐載體,堅持原創科技與市場需求雙輪驅動,未來將持續依托與各省市政府、專業學術機構、知名科研院所、產業龍頭企業等機構的合作勢能,構建融通學、研、產、用的新型創新鏈,深度賦能產業轉型升級與智能社會治理。