飞猪旅行飞猪-大模型高级算法工程师/专家-大模型训练
任职要求
1,计算机科学、数学或相关领域硕士及以上学历。 2,精通深度学习/机器学习、有良好的实验设计、问题分析和创新研究能力。 3,工程能力出色,能够快速原型和算法验证。 4,有大模型 continual pre…
工作职责
1,设计和实现开创性的 continual pretraining、mid-training/post-training 算法,在 continual learning (on-policy distillation, self distillation, rft, etc)、data mixture modeling等方向上实现基座模型特定能力真实、显著的提升,支持新一代旅行消费应用的诞生。 2,高质量合成数据建设,通过研发自动化数据生产算法和pipeline,支持模型能力持续提升。 3,构建科学、严谨的算法评测体系,量化模型真实能力、建立算法指标和下游应用效果的关联。 4,跟进领域前沿、掌握领域发展趋势。
岗位职责: 该职位通过大模型训练、Agent、RAG、N2SQL、NLP、语音处理等技术创新和突破,构建Agent通用平台、大模型训练平台等工具产品,同时支持对话机器人等垂直应用及智能产品的建设。欢迎敢于接受挑战的候选人加入我们,一起赋能企业客户。我们的研究方向包括但不限于: 1、通用大模型、推理大模型预训练、微调、强化对齐等技术的持续研究创新; 2、多语言大模型、领域大模型的训练技术研究与落地; 3、AI数据清洗、加工、合成、自动标注技术研究与落地; 4、文本机器人、语音机器人、质检机器人等客服域技术的研发与落地; 5、多Agent、RAG、N2SQL、自主决策等技术的研究与落地; 6、入呼大模型机器人、外呼大模型机器人研发经验;熟悉VAD, ASR, TTS等语音相关技术; 以上方向擅长其中1个即可
1、参与LLM方向的新技术研究和落地应用,支持指令微调、强化学习相关算法需求 2、支持通用ai agent在产品业务应用中的落地研发和效果优化,包括但不限于通用ai agent,深入理解大模型和通用ai agent运行原理,明确提升通用ai agent效果的核心技术方向。 3、负责ai agent的框架构建,agent与工具调用的优化,相关场景下大模型的优化,将ai agent框架、工具、大模型有效结合,为通用ai agent效果提供最佳的使用体验。
所在团队负责阿里国际贸易平台上的所有推荐产品,包括猜你喜欢、详情页推荐、个性化楼层等。团队通过大数据和深度学习建模,帮助平台上买卖家快速达成生意。来到这里,你将有机会深度接触到业界的计算平台和深度学习算法,并将算法技术转化为商业价值。具体地,你将有机会负责: 1. 用户画像、召回、排序和策略等模块的技术规划和算法设计,通过技术创新提升买卖家匹配效率。 2. 通过大规模深度学习和图学习,在面对数据稀疏和多国家多行业的情况下对用户实时兴趣、CTR预估、询盘和交易转化预估等问题建模。 3. 通过多样性和发现性策略,拓展用户需求,提升兴趣发现能力,进一步完善和提升推荐侧的产品价值。 4. 探索大语言模型+搜推的创新应用方向,LLM在推荐领域下的全链路建设,包括但不限于大规模的预训练、SFT、LoRA和RLHFL等技术,落地大语言模型+搜推的新的应用落地场景(如生成式推荐等)。