
智能互联飞猪-大模型高级算法工程师/专家-大模型训练
任职要求
1,计算机科学、数学或相关领域硕士及以上学历。 2,精通深度学习/机器学习、有良好的实验设计、问题分析和创新研究能力。 3,工程能力出色,能够快速原型和算法验证。 4,有大模型 continual pre…
工作职责
1,设计和实现开创性的 continual pretraining、mid-training/post-training 算法,在 continual learning (on-policy distillation, self distillation, rft, etc)、data mixture modeling等方向上实现基座模型特定能力真实、显著的提升,支持新一代旅行消费应用的诞生。 2,高质量合成数据建设,通过研发自动化数据生产算法和pipeline,支持模型能力持续提升。 3,构建科学、严谨的算法评测体系,量化模型真实能力、建立算法指标和下游应用效果的关联。 4,跟进领域前沿、掌握领域发展趋势。
1,设计和实现开创性的 continual pretraining、mid-training/post-training 算法,在 continual learning (on-policy distillation, self distillation, rft, etc)、data mixture modeling等方向上实现基座模型特定能力真实、显著的提升,支持新一代旅行消费应用的诞生。 2,高质量合成数据建设,通过研发自动化数据生产算法和pipeline,支持模型能力持续提升。 3,构建科学、严谨的算法评测体系,量化模型真实能力、建立算法指标和下游应用效果的关联。 4,跟进领域前沿、掌握领域发展趋势。
我们正在寻找一位对大模型和agent前沿领域充满热情的大模型算法工程师,重点聚焦于旅行智能体(Agent)技术的研发与训练。我们已经开发了飞猪问一问,也接入了千问,如果你对创造能够自主感知、决策和行动的智能系统感到兴奋,并希望在大模型与强化学习结合的前沿领域大展身手,那么这个职位将非常适合你。你将加入我们的核心算法团队: 1、负责设计和实现下一代具有推理和行动能力的AI智能体,推动其在复杂环境中的应用。 2、研究、设计并实现基于大模型的智能体训练框架,特别是Agentic Reinforcement Learning (Agentic RL) 相关算法,探索和实验多种智能体范式,如ReAct、CoT、ToT 等,并将其与强化学习相结合,开发和优化智能体的推理、规划、工具使用等核心能力。 3、参与大规模语言模型的预训练、有监督微调(SFT)和指令微调。

我们正在寻找一位对大模型和agent前沿领域充满热情的大模型算法工程师,重点聚焦于旅行智能体(Agent)技术的研发与训练。我们已经开发了飞猪问一问,也接入了千问,如果你对创造能够自主感知、决策和行动的智能系统感到兴奋,并希望在大模型与强化学习结合的前沿领域大展身手,那么这个职位将非常适合你。你将加入我们的核心算法团队: 1、负责设计和实现下一代具有推理和行动能力的AI智能体,推动其在复杂环境中的应用。 2、研究、设计并实现基于大模型的智能体训练框架,特别是Agentic Reinforcement Learning (Agentic RL) 相关算法,探索和实验多种智能体范式,如ReAct、CoT、ToT 等,并将其与强化学习相结合,开发和优化智能体的推理、规划、工具使用等核心能力。 3、参与大规模语言模型的预训练、有监督微调(SFT)和指令微调。