OPPO高级算法工程师(Agent)
任职要求
任职要求: 1. 硕士及以上学历,计算机科学,统计学,数据挖掘,数学,物理等相关专业。3 年以上 NLP /多模态算法研发经验,在预训练模型,生成式AI, Prompt工程,SFT 微调,对话交互等中的一个或多个领域中具备实践经验。 2. 在高影响力的权威榜单(CLUE、SuperGlue等)中取得优势名次,或在人工智能顶会/期刊上发表研究论文者优先(例如:ACL/EMNLP/NIPS/ICML/ICLR/CVPR等) 3. 扎实的编程基础,至少熟悉一种常见的深度学习框架(Pytorch, TensorFlow等); 4. 良好的数学基础与英文阅读能力,具备良好的团队协作意识与优秀的自驱力; 5. 关注 Reasoning 、Planning、Function call、DPO、MCTS相关技术,有相关经验者优先。
工作职责
智能体方向: 1、负责大模型驱动的AI智能体框架的实现,围绕ICL、CoT、记忆机制设计、自进化机制、多智能体协同机制等,优化提升AI智能体效果。 2、负责大模型的微调、强化学习、适配算法、调优工程方案,结合智能体应用,实现最佳效果与性能。 3、参与智能体的评估与优化,支持并构建产品原型和业务落地,支持小布助手、AI搜索等系统级智能体产品的落地。 4、跟踪与研究AI智能体相关前沿技术,并针对大模型推理与规划、工具使用、结构化输出等提出创新性方案。 AI搜索方向: 岗位职责: 1. 负责大模型相关的后训练技术研发,支持 SFT、DPO 和 RL 相关的技术研发,参与 RAG、Agent、用户意图理解等技术的研发; 2. 负责大模型在 OS、小布助手、AI 搜索等场景的应用,支持摘要总结、检索增强、问答、任务规划等领域的落地; 3. 跟进业界前沿技术,持续提升团队在自然语言处理领域的技术积累。
1.核心算法研发方面:负责大语言模型的核心算法研究与工程化落地,构建小米IoT商品理解、推理和生成能力的智能问答Agent系统。 2.RAG领域知识库体系构建:基于小米IoT生态链说明书知识,构建包括商品参数、功能问答、设置操作说明、故障排查等多源知识库。 3.RAG检索优化:优化改写、粗召、rerank等业务精排模型,提升大模型知识检索准确率。 4.探索IoT问答场景下的模型预训练、指令微调(Instruction Tuning)、对齐优化(Alignment)等关键技术,提升大模型在小米IoT商品问答中的表现。 5.技术前沿探索:跟踪大模型与Agent领域最新进展,推动小米产品领域问答场景下的技术创新与专利沉淀。
1、解决公司大模型/AI系统个性化的系统、算法中的中长期难题; 2、算法和系统难题包括但不限于:大模型个性化技术,多模态/手机端Agent框架搭建,Agent自动生成和自主学习,多模态大模型,多模态信息检索,端侧模型训练,个性化LLM推理等。算法与工程高度结合; 3、可自由参与各种技术讨论,自己发现问题,并解决问题。
在打车场景中,POI是用户目的地的数字化表达,是最基础的数据之一,直接影响用户能不能找到目的地、正确到达目的地。传统的数据更新依赖人工,现实的快速变化带来了更新成本剧增和更新速度降低。但这些在LLM时代迎来了转机,LLM更强的特征表达能力、更智能的规划能力让数据更新迎来了新的机会。在这你将迎来以下挑战: 1、追踪LLM/Agent的前沿技术:通过海量人工反馈资料,训练Agent替代人工,完成数据的自动化更新,降低成本、加快效率、提升质量 2、研究落地最新多模态对齐方案:在常见的图像、文本之外,我们场景中还包括位置信息(坐标),多模态对齐工作,对充分发挥数据价值,提升模型性能至关重要,是业内持续投入的重点&难点方向
我们是滴滴网约车MPT部门的大模型研究开发团队,致力于以大模型为核心,打通数据、技术与业务链路,推动AI在智能运营与交易市场中的应用革新。我们的研究方向涵盖大模型驱动的数据挖掘、智能运营系统、以及核心交易机制的技术演进。 工作职责与方向包括: - 负责基于大模型的智能运营系统构建,包括但不限于利用Prompt、SFT、RLHF、Agent等技术,打造面向业务的单点工具建设和产品工具集成。 - 负责基于大模型的交易技术任务和基础技术方案研发,包括但不限于基于大模型的判别式任务构建、基于大模型的基础公共特征挖掘,和交易市场主栈问题(定价、分单)中LLM的应用方案探索。 - 密切关注行业的最新动态,跟踪研究最新技术和趋势,推进有价值的技术在公司内部落地,探索前沿的算法迭代,推动技术创新。 - 与工程团队紧密合作,推动模型的工程化部署,包括模型压缩、推理加速等环节。