職位描述
崗位描述1、設計并實現高效的深度強化學習算法,以提升多自由度機器人(包括雙足、四足仿生機器人)的任務執行能力。2、領導和參與深度強化學習模型的復現、開發、調試工作,確保算法在仿真環境和實際機器人上均能穩定運行與驗證。3、與跨職能團隊合作,將先進的機器學習技術集成到機器人控制系統中,提高系統的智能化水平。4、持續跟蹤國際前沿研究和技術發展,為團隊引入創新性解決方案。崗位要求1、計算機科學、機械工程、自動化或相關領域的碩士及以上學歷;具有深厚項目者,學歷要求可放寬至本科。2、具備扎實的機器人學基礎知識,尤其是運動學與動力學方面的能力,能夠理解和解決復雜的機器人控制問題。3、熟練掌握至少一種主流機器人仿真工具(如MuJoCo、Bullet、Gazebo、NVIDIA Isaac),并有通過這些工具進行高級仿真工作的經驗。精通TensorFlow或PyTorch等機器學習框架之一,有能力設計和訓練深度學習模型。4、對常用的深度強化學習算法(如DQN、DDPG、A3C、PPO等)有深入的理解,并能在實踐中靈活應用。5、有使用rllib、baselines或其他深度強化學習平臺的經驗,了解其架構與實踐。6、在機器人領域內有成功的深度強化學習項目實施經驗,能夠展示具體的成果和貢獻。7、良好的英語讀寫能力,能夠快速閱讀和理解最新的科研文獻和技術文檔。
企業介紹
天娛數科(股票代碼:002354.SZ),錨定AI 開拓者定位,致力于為企業數字化轉型和智能化升級全面賦能。公司把“數據要素x”與“人工智能+”結合起來,依托在各類業務場景中積累的海量數據要素資源優勢和人工智能算法技術優勢,自研多個企業級大模型,構筑了AI 營銷 SaaS、移動應用分發 PaaS、空間智能MaaS 三大業務平臺,持續推動零售、工業、金融、文娛等多個行業的數轉智改,形成服務百行千業萬家企業客戶的業務生態。