logo of aligenie

智能互联飞猪-大模型高级算法工程师/专家-大模型训练

社招全职1年以上地点:杭州状态:招聘

任职要求


1,计算机科学、数学或相关领域硕士及以上学历。
2,精通深度学习/机器学习、有良好的实验设计、问题分析和创新研究能力。
3,工程能力出色,能够快速原型和算法验证。
4,有大模型 continual pre…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1,设计和实现开创性的 continual pretraining、mid-training/post-training 算法,在 continual learning (on-policy distillation, self distillation, rft, etc)、data mixture modeling等方向上实现基座模型特定能力真实、显著的提升,支持新一代旅行消费应用的诞生。
2,高质量合成数据建设,通过研发自动化数据生产算法和pipeline,支持模型能力持续提升。
3,构建科学、严谨的算法评测体系,量化模型真实能力、建立算法指标和下游应用效果的关联。
4,跟进领域前沿、掌握领域发展趋势。
包括英文材料
学历+
深度学习+
机器学习+
还有更多 •••
相关职位

logo of fliggy
社招1年以上

1,设计和实现开创性的 continual pretraining、mid-training/post-training 算法,在 continual learning (on-policy distillation, self distillation, rft, etc)、data mixture modeling等方向上实现基座模型特定能力真实、显著的提升,支持新一代旅行消费应用的诞生。 2,高质量合成数据建设,通过研发自动化数据生产算法和pipeline,支持模型能力持续提升。 3,构建科学、严谨的算法评测体系,量化模型真实能力、建立算法指标和下游应用效果的关联。 4,跟进领域前沿、掌握领域发展趋势。

更新于 2026-03-30杭州
logo of fliggy
社招1年以上

我们正在寻找一位对大模型和agent前沿领域充满热情的大模型算法工程师,重点聚焦于旅行智能体(Agent)技术的研发与训练。我们已经开发了飞猪问一问,也接入了千问,如果你对创造能够自主感知、决策和行动的智能系统感到兴奋,并希望在大模型与强化学习结合的前沿领域大展身手,那么这个职位将非常适合你。你将加入我们的核心算法团队: 1、负责设计和实现下一代具有推理和行动能力的AI智能体,推动其在复杂环境中的应用。 2、研究、设计并实现基于大模型的智能体训练框架,特别是Agentic Reinforcement Learning (Agentic RL) 相关算法,探索和实验多种智能体范式,如ReAct、CoT、ToT 等,并将其与强化学习相结合,开发和优化智能体的推理、规划、工具使用等核心能力。 3、参与大规模语言模型的预训练、有监督微调(SFT)和指令微调。

更新于 2026-03-31杭州
logo of aligenie
社招1年以上

我们正在寻找一位对大模型和agent前沿领域充满热情的大模型算法工程师,重点聚焦于旅行智能体(Agent)技术的研发与训练。我们已经开发了飞猪问一问,也接入了千问,如果你对创造能够自主感知、决策和行动的智能系统感到兴奋,并希望在大模型与强化学习结合的前沿领域大展身手,那么这个职位将非常适合你。你将加入我们的核心算法团队: 1、负责设计和实现下一代具有推理和行动能力的AI智能体,推动其在复杂环境中的应用。 2、研究、设计并实现基于大模型的智能体训练框架,特别是Agentic Reinforcement Learning (Agentic RL) 相关算法,探索和实验多种智能体范式,如ReAct、CoT、ToT 等,并将其与强化学习相结合,开发和优化智能体的推理、规划、工具使用等核心能力。 3、参与大规模语言模型的预训练、有监督微调(SFT)和指令微调。

更新于 2026-03-31杭州
logo of fliggy
社招1年以上

1. 从事多模态大模型的训练,包括预训练、指令微调与对齐,强化学习/RLHF后训练,提升模型在复杂场景下的泛化与生成能力。 2.从事高效多模态数据管线。 3. 将多模态大模型应用于内容生产,拍照讲解,多模态对话等多个旅行行业场景落地。 4.跟踪并实践多模态生成大模型前沿技术,引入新的算法技术及理念,推动业务落地及技术优化。

更新于 2026-03-30杭州