logo of oppo

OPPO高级算法工程师(Agent)

社招全职3-8年SOFTWARE地点:北京 | 深圳状态:招聘

任职要求


任职要求:
1. 硕士及以上学历,计算机科学,统计学,数据挖掘,数学,物理等相关专业。3 年以上 NLP /多模态算法研发经验,在预训练模型,生成式AI, Prompt工程,SFT 微调,对话交互等中的一个或多个领域中具备实践经验。
2.  在高影响力的权威榜单(CLUE、SuperGlue等)中取得优势名次,或在人工智能顶会/期刊上发表研究论文者优先(例如:…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


智能体方向:
1、负责大模型驱动的AI智能体框架的实现,围绕ICL、CoT、记忆机制设计、自进化机制、多智能体协同机制等,优化提升AI智能体效果。
 2、负责大模型的微调、强化学习、适配算法、调优工程方案,结合智能体应用,实现最佳效果与性能。
 3、参与智能体的评估与优化,支持并构建产品原型和业务落地,支持小布助手、AI搜索等系统级智能体产品的落地。
 4、跟踪与研究AI智能体相关前沿技术,并针对大模型推理与规划、工具使用、结构化输出等提出创新性方案。

AI搜索方向:
岗位职责:
1. 负责大模型相关的后训练技术研发,支持 SFT、DPO 和 RL 相关的技术研发,参与 RAG、Agent、用户意图理解等技术的研发;
2. 负责大模型在 OS、小布助手、AI 搜索等场景的应用,支持摘要总结、检索增强、问答、任务规划等领域的落地;
3. 跟进业界前沿技术,持续提升团队在自然语言处理领域的技术积累。
包括英文材料
学历+
数据挖掘+
NLP+
算法+
Prompt+
SFT+
NeurIPS+
还有更多 •••
相关职位

logo of mi
社招A22739A

1.核心算法研发方面:负责大语言模型的核心算法研究与工程化落地,构建小米IoT商品理解、推理和生成能力的智能问答Agent系统。 2.RAG领域知识库体系构建:基于小米IoT生态链说明书知识,构建包括商品参数、功能问答、设置操作说明、故障排查等多源知识库。 3.RAG检索优化:优化改写、粗召、rerank等业务精排模型,提升大模型知识检索准确率。 4.探索IoT问答场景下的模型预训练、指令微调(Instruction Tuning)、对齐优化(Alignment)等关键技术,提升大模型在小米IoT商品问答中的表现。 5.技术前沿探索:跟踪大模型与Agent领域最新进展,推动小米产品领域问答场景下的技术创新与专利沉淀。

更新于 2025-05-30北京
logo of fliggy
社招1年以上

我们正在寻找一位对大模型和agent前沿领域充满热情的大模型算法工程师,重点聚焦于旅行智能体(Agent)技术的研发与训练。我们已经开发了飞猪问一问,也接入了千问,如果你对创造能够自主感知、决策和行动的智能系统感到兴奋,并希望在大模型与强化学习结合的前沿领域大展身手,那么这个职位将非常适合你。你将加入我们的核心算法团队: 1、负责设计和实现下一代具有推理和行动能力的AI智能体,推动其在复杂环境中的应用。 2、研究、设计并实现基于大模型的智能体训练框架,特别是Agentic Reinforcement Learning (Agentic RL) 相关算法,探索和实验多种智能体范式,如ReAct、CoT、ToT 等,并将其与强化学习相结合,开发和优化智能体的推理、规划、工具使用等核心能力。 3、参与大规模语言模型的预训练、有监督微调(SFT)和指令微调。

更新于 2026-03-31杭州
logo of aligenie
社招1年以上

我们正在寻找一位对大模型和agent前沿领域充满热情的大模型算法工程师,重点聚焦于旅行智能体(Agent)技术的研发与训练。我们已经开发了飞猪问一问,也接入了千问,如果你对创造能够自主感知、决策和行动的智能系统感到兴奋,并希望在大模型与强化学习结合的前沿领域大展身手,那么这个职位将非常适合你。你将加入我们的核心算法团队: 1、负责设计和实现下一代具有推理和行动能力的AI智能体,推动其在复杂环境中的应用。 2、研究、设计并实现基于大模型的智能体训练框架,特别是Agentic Reinforcement Learning (Agentic RL) 相关算法,探索和实验多种智能体范式,如ReAct、CoT、ToT 等,并将其与强化学习相结合,开发和优化智能体的推理、规划、工具使用等核心能力。 3、参与大规模语言模型的预训练、有监督微调(SFT)和指令微调。

更新于 2026-03-31杭州
logo of alibaba
社招3年以上技术类-算法

所在团队负责阿里国际贸易平台上的所有推荐产品,包括猜你喜欢、详情页推荐、个性化楼层等。团队通过大数据和深度学习建模,帮助平台上买卖家快速达成生意。来到这里,你将有机会深度接触到业界的计算平台和深度学习算法,并将算法技术转化为商业价值。具体地,你将有机会负责: 1. 用户画像、召回、排序和策略等模块的技术规划和算法设计,通过技术创新提升买卖家匹配效率。 2. 通过大规模深度学习和图学习,在面对数据稀疏和多国家多行业的情况下对用户实时兴趣、CTR预估、询盘和交易转化预估等问题建模。 3. 通过多样性和发现性策略,拓展用户需求,提升兴趣发现能力,进一步完善和提升推荐侧的产品价值。 4. 探索大语言模型+搜推的创新应用方向,LLM在推荐领域下的全链路建设,包括但不限于大规模的预训练、SFT、LoRA和RLHFL等技术,落地大语言模型+搜推的新的应用落地场景(如生成式推荐等)。

更新于 2025-09-23杭州