logo of fliggy

飞猪旅行飞猪-大模型高级算法工程师-agent算法

社招全职1年以上地点:杭州状态:招聘

任职要求


1、1年及以上机器学习/深度学习相关领域的工作经验。
2、计算机科学、人工智能、数学或相关领域的硕士及以上学历。
3、扎实的编程基础,熟练掌握Python,至少熟悉PyTorchTensorFlow之一的主流深度学习框架。
4、对大模型技术栈有深入理解,具备LLM的SFT、RLHF等调优经验。
5、…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


我们正在寻找一位对大模型和agent前沿领域充满热情的大模型算法工程师,重点聚焦于旅行智能体(Agent)技术的研发与训练。我们已经开发了飞猪问一问,也接入了千问,如果你对创造能够自主感知、决策和行动的智能系统感到兴奋,并希望在大模型与强化学习结合的前沿领域大展身手,那么这个职位将非常适合你。你将加入我们的核心算法团队:
1、负责设计和实现下一代具有推理和行动能力的AI智能体,推动其在复杂环境中的应用。
2、研究、设计并实现基于大模型的智能体训练框架,特别是Agentic Reinforcement Learning (Agentic RL) 相关算法,探索和实验多种智能体范式,如ReAct、CoT、ToT 等,并将其与强化学习相结合,开发和优化智能体的推理、规划、工具使用等核心能力。
3、参与大规模语言模型的预训练、有监督微调(SFT)和指令微调。
包括英文材料
机器学习+
深度学习+
学历+
Python+
PyTorch+
TensorFlow+
还有更多 •••
相关职位

logo of aliyun
社招技术类-算法

岗位职责: 该职位通过大模型训练、Agent、RAG、N2SQL、NLP、语音处理等技术创新和突破,构建Agent通用平台、大模型训练平台等工具产品,同时支持对话机器人等垂直应用及智能产品的建设。欢迎敢于接受挑战的候选人加入我们,一起赋能企业客户。我们的研究方向包括但不限于: 1、通用大模型、推理大模型预训练、微调、强化对齐等技术的持续研究创新; 2、多语言大模型、领域大模型的训练技术研究与落地; 3、AI数据清洗、加工、合成、自动标注技术研究与落地; 4、文本机器人、语音机器人、质检机器人等客服域技术的研发与落地; 5、多Agent、RAG、N2SQL、自主决策等技术的研究与落地; 6、入呼大模型机器人、外呼大模型机器人研发经验;熟悉VAD, ASR, TTS等语音相关技术; 以上方向擅长其中1个即可

更新于 2025-06-10北京|杭州
logo of alibaba
社招1年以上技术类-算法

1、参与LLM方向的新技术研究和落地应用,支持指令微调、强化学习相关算法需求 2、支持通用ai agent在产品业务应用中的落地研发和效果优化,包括但不限于通用ai agent,深入理解大模型和通用ai agent运行原理,明确提升通用ai agent效果的核心技术方向。 3、负责ai agent的框架构建,agent与工具调用的优化,相关场景下大模型的优化,将ai agent框架、工具、大模型有效结合,为通用ai agent效果提供最佳的使用体验。

更新于 2025-09-16杭州
logo of oppo
社招3-8年SOFTWARE

智能体方向: 1、负责大模型驱动的AI智能体框架的实现,围绕ICL、CoT、记忆机制设计、自进化机制、多智能体协同机制等,优化提升AI智能体效果。 2、负责大模型的微调、强化学习、适配算法、调优工程方案,结合智能体应用,实现最佳效果与性能。 3、参与智能体的评估与优化,支持并构建产品原型和业务落地,支持小布助手、AI搜索等系统级智能体产品的落地。 4、跟踪与研究AI智能体相关前沿技术,并针对大模型推理与规划、工具使用、结构化输出等提出创新性方案。 AI搜索方向: 岗位职责: 1. 负责大模型相关的后训练技术研发,支持 SFT、DPO 和 RL 相关的技术研发,参与 RAG、Agent、用户意图理解等技术的研发; 2. 负责大模型在 OS、小布助手、AI 搜索等场景的应用,支持摘要总结、检索增强、问答、任务规划等领域的落地; 3. 跟进业界前沿技术,持续提升团队在自然语言处理领域的技术积累。

更新于 2025-12-05北京|深圳
logo of anker
校招

1. 探索研究具身智能领域的多模态大模型、世界模型、生成式模型、AIGC等人工智能前沿技术; 2.探索大规模多模态理解与生成交织的基础模型,并进行极致系统优化;数据建设、指令微调、偏好对齐、RLHF、模型优化;提升数据合成、模型推理、规划能力,构建全面客观准确的评测体系,探索提升大模型能力; 3. 探索突破包括而不限于多模态大模型、端到端VLA模型、视觉COT与Agent在内的多模态模型、世界模型; 4. 通过预训练或SFT,使用生成式模型技术能力对现实世界的各类环境进行建模,提供多模态交互探索的基本能力,推动应用落地,研发以人工智能技术为核心的新技术、新产品。

更新于 2025-08-14深圳