職位描述
1 工作內容:1 NLP生成模型和對話模型的前沿技術研究追蹤與探索; 2 對GRPO有實際經驗及技術積累;3 基于場景的算法研發,包括不限于對模型及組建的最優組合調試等;4、創造性的提出領先的算法,包括但不限于預訓練、表示學習等應用到核心業務中。任職要求1普適:計算機相關專業碩士及以上學歷;多年深度學習如 TensorFlow/pytorch,Transformer 等;有 spark/hadoop 等大數據分析處理經驗優先;能夠從復雜的業務場景中進行問題抽象、算法選型、算法優化以及不斷提升效果,深入實踐DS等最新工程技術,熟練借助AI編程工具全棧開發,有極強的好奇心與自我驅動力。2 要求:1 有大模型預訓練特征工程及在多個領域有深入的使用多智能體打通落地的經驗。2. 具有優秀的編程基礎及動手能力.熟練使用AI編程工具,良好的工作習慣,豐富的業務落地實戰經驗,優秀的快速學習能力;3. 發表ML/NLP等頂會/期刊論文.取得權威競賽Top名次.ACM編程國際競賽Top成績者優先;4. 對國際國內大模型技術方向及實戰應用充滿激情,具有通過技術解決業務問題.創造產品價值的強烈愿景。對主流大模型如/等的原理和差異有深入的理解; 5. 有多機多卡方案或者蒸餾小模型小算力搭配經驗,有百億/千億NLP大模型訓練和GPU卡調優經驗優先。
企業介紹
我們是一家致力于提供行業領先的自然語言理解技術服務的科 技公司,依托于獨有的HowNet知識庫和文本解析技術,我們可以 為行業提供具有語言學特色的詞法分析、句法分析、語義理解和其 他文本解析等自然語言理解技術服務,為客戶解決自然語言理解難 題,助力客戶構建智能交互機器人、內容與信息抽取、用戶畫像、 輿情分析與監控、大規模自然語言文本自動化處理等方面的應用。