職位描述
崗位職責:1. 負責大模型流程加速工具的研發,包括但不限于大模型壓縮、自動混合精度推理、異步并行推理等功能模塊;2. 負責大模型的訓練、調優和部署,確保模型性能保持較佳狀態;3. 深入研究和探索大模型的新技術和新方法,提高模型的效果和效率;4. 協助團隊其他成員理解和應用大模型技術,提供技術支持和培訓;5. 持續關注和研究大模型領域的最新技術和進展,推動團隊的技術創新。6. 深入理解大模型推理的原理和算法,持續優化工具的性能和效率;7. 配合團隊成員進行工具的測試、部署和集成;8. 編寫相關技術文檔,提供技術支持和培訓。任職要求:1. 碩士及以上學歷,計算機科學、人工智能或相關領域專業;2. 三年以上大模型訓練工作經驗 或 三年以上大模型流程加速工具開發經驗;3. 熟練掌握至少一種編程語言(如Python、C++等),具備良好的代碼風格和編程習慣;4. 對大模型推理技術有深入了解,具備相關算法和數據結構的知識;5. 對大模型訓練的原理、算法和技巧有深入了解,具備相關知識和實踐經驗;6. 具備良好的團隊協作和溝通能力,能夠與不同背景的團隊成員有效協作;7. 對新技術充滿熱情,具備快速學習能力和創新思維。
企業介紹
思騰合力(天津)科技有限公司定位于視覺計算推動者,專注于人工智能領域,提供深度學習、GPU高性能計算、虛擬化、分布式存儲、集群管理等產品和整體解決方案,助力和推動各企事業單位不斷發展需求。思騰合力(天津)科技有限公司現成立于天津經濟技術開發區逸仙園科技園,前身為成立于2009年的北京思騰合力科技有限公司,公司自成立之時就致力于發展高性能計算方向,從簡單的CPU計算開始到現在的單機多GPU運算,再到高浮點運算能力的GPU集群方案,經歷了硬件變更和應用技術的更新迭代,公司逐步壯大了銷售板塊和經營的業務模塊,同時在GPU人工智能與高性能計算領域積累多年的技術經驗,更是在2017年營業額突破億元大關,合作客戶包括清華大學,北京大學,北京理工大學,中科院計算所,中科院自動化所,中科院力學所,中科院遙感所,中科院信息工程所,以及國內知名人工智能公司等各企事業單位思騰合力目前分為思騰合力(天津)科技有限公司(以下簡稱為:天津公司)和北京思騰合力科技有限公司(北京公司),天津公司作為制造和生產基地,負責公司產品在產,質檢,物流等功能,北京公司以銷售和售后為主公司主營深思系列“DeepThink”系列GPU服務器,型號包括有 IW4200-2G/4G/8G/10G等多種型號產品,單臺機器可支持2-10顆GPU運算卡,充分滿足不同客戶對算力的需求。人工智能領域的不斷發展也要求公司技術層面的不斷提升,思騰合力在提高產品品質同時也配合客戶需求對所經營深思系列GPU Server產品預裝CUDA、CUDNN及caffe、Tensorflow等主流深度學習框架,同時能夠提供GPU調優,集群搭建等整體解決方案