
智能互联飞猪-大模型算法专家/高级工程师-agent算法
任职要求
1、1年及以上机器学习/深度学习相关领域的工作经验。 2、计算机科学、人工智能、数学或相关领域的硕士及以上学历。 3、扎实的编程基础,熟练掌握Python,至少熟悉PyTorch或TensorFlow之一的主流深度学习框架。 4、对大模型技术栈有深入理解,具备LLM的SFT、RLHF等调优经验。 5、…
工作职责
我们正在寻找一位对大模型和agent前沿领域充满热情的大模型算法工程师,重点聚焦于旅行智能体(Agent)技术的研发与训练。我们已经开发了飞猪问一问,也接入了千问,如果你对创造能够自主感知、决策和行动的智能系统感到兴奋,并希望在大模型与强化学习结合的前沿领域大展身手,那么这个职位将非常适合你。你将加入我们的核心算法团队: 1、负责设计和实现下一代具有推理和行动能力的AI智能体,推动其在复杂环境中的应用。 2、研究、设计并实现基于大模型的智能体训练框架,特别是Agentic Reinforcement Learning (Agentic RL) 相关算法,探索和实验多种智能体范式,如ReAct、CoT、ToT 等,并将其与强化学习相结合,开发和优化智能体的推理、规划、工具使用等核心能力。 3、参与大规模语言模型的预训练、有监督微调(SFT)和指令微调。
我们正在寻找一位对大模型和agent前沿领域充满热情的大模型算法工程师,重点聚焦于旅行智能体(Agent)技术的研发与训练。我们已经开发了飞猪问一问,也接入了千问,如果你对创造能够自主感知、决策和行动的智能系统感到兴奋,并希望在大模型与强化学习结合的前沿领域大展身手,那么这个职位将非常适合你。你将加入我们的核心算法团队: 1、负责设计和实现下一代具有推理和行动能力的AI智能体,推动其在复杂环境中的应用。 2、研究、设计并实现基于大模型的智能体训练框架,特别是Agentic Reinforcement Learning (Agentic RL) 相关算法,探索和实验多种智能体范式,如ReAct、CoT、ToT 等,并将其与强化学习相结合,开发和优化智能体的推理、规划、工具使用等核心能力。 3、参与大规模语言模型的预训练、有监督微调(SFT)和指令微调。
1、负责飞猪域内反欺诈、反作弊、账号安全、商品内容风险等全链路风控算法能力建设,搭建风控算法体系,保障业务安全与用户体验平衡; 2、深入理解业务,基于海量用户行为、交易、设备环境数据进行风险分析与挖掘,使用机器学习、深度学习、图模型、大语言模型等方法,构建风险感知、识别、决策、处置闭环,保障业务安全; 3、基于域内多模态数据(行为序列、文本、图关系),搭建风控场景大模型agent,探索任务规划、工具调用、RAG、多Agent协同等技术,实现风险防控的效果和效率提升。

1、负责飞猪域内反欺诈、反作弊、账号安全、商品内容风险等全链路风控算法能力建设,搭建风控算法体系,保障业务安全与用户体验平衡; 2、深入理解业务,基于海量用户行为、交易、设备环境数据进行风险分析与挖掘,使用机器学习、深度学习、图模型、大语言模型等方法,构建风险感知、识别、决策、处置闭环,保障业务安全; 3、基于域内多模态数据(行为序列、文本、图关系),搭建风控场景大模型agent,探索任务规划、工具调用、RAG、多Agent协同等技术,实现风险防控的效果和效率提升。