logo of mi

小米高级算法工程师(问答RAG+Agent)

社招全职A22739A地点:北京状态:招聘

任职要求


1.硕士及以上学历,计算机科学、自然语言处理机器学习相关专业。
2.熟练掌握大模型微调优化和算法原理,具备分布式训练、模型压缩、推理加速等实战经验。
3.深入理解Transformer、Prompt Tuning、RLHF、强化学习等…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.核心算法研发方面:负责大语言模型的核心算法研究与工程化落地,构建小米IoT商品理解、推理和生成能力的智能问答Agent系统。
2.RAG领域知识库体系构建:基于小米IoT生态链说明书知识,构建包括商品参数、功能问答、设置操作说明、故障排查等多源知识库。
3.RAG检索优化:优化改写、粗召、rerank等业务精排模型,提升大模型知识检索准确率。
4.探索IoT问答场景下的模型预训练、指令微调(Instruction Tuning)、对齐优化(Alignment)等关键技术,提升大模型在小米IoT商品问答中的表现。
5.技术前沿探索:跟踪大模型与Agent领域最新进展,推动小米产品领域问答场景下的技术创新与专利沉淀。
包括英文材料
学历+
NLP+
机器学习+
大模型+
算法+
还有更多 •••
相关职位

logo of oppo
社招3-8年SOFTWARE

智能体方向: 1、负责大模型驱动的AI智能体框架的实现,围绕ICL、CoT、记忆机制设计、自进化机制、多智能体协同机制等,优化提升AI智能体效果。 2、负责大模型的微调、强化学习、适配算法、调优工程方案,结合智能体应用,实现最佳效果与性能。 3、参与智能体的评估与优化,支持并构建产品原型和业务落地,支持小布助手、AI搜索等系统级智能体产品的落地。 4、跟踪与研究AI智能体相关前沿技术,并针对大模型推理与规划、工具使用、结构化输出等提出创新性方案。 AI搜索方向: 岗位职责: 1. 负责大模型相关的后训练技术研发,支持 SFT、DPO 和 RL 相关的技术研发,参与 RAG、Agent、用户意图理解等技术的研发; 2. 负责大模型在 OS、小布助手、AI 搜索等场景的应用,支持摘要总结、检索增强、问答、任务规划等领域的落地; 3. 跟进业界前沿技术,持续提升团队在自然语言处理领域的技术积累。

更新于 2025-12-05北京|深圳
logo of weibo
社招新浪&微博

1. 负责微博主站搜索业务的语义搜索技术研究和落地,包括:语义相关性、查询理解、问题生成、召回索引等核心技术 2. 基于海量用户行为数据以及人工标注数据,结合自然语言处理、大模型等前沿技术,支持Query改写、内容生成等一系列业务 3. 推进大模型技术在搜索引擎的落地,参与基础大语言模型应用研发,包括但不限于智能问答、物料扩充生成、搜索任务规划、内容优选和排序、工具调用、归纳总结、逻辑推理等能力

更新于 2025-03-06北京
logo of sf
社招3-5年

1、大模型与智能体核心能力建设: 围绕销售及大件业务场景,负责大语言模型在意图识别、规划理解、多轮对话、用户画像与偏好洞察、话题与线索分析、知识问答及 chatBI 等核心能力上的应用设计、微调与持续优化,支撑线索智能体、销售助手智能体及大件智能体等关键场景落地。 2、智能体推理链路与多智能体协同设计: 参与线索子智能体、销售助手子智能体、大件智能体与一级、三级销售智能体的大模型协同架构设计,构建基于大模型的多轮推理、任务分解与业务决策链路,提升智能体在复杂销售与大件业务场景下的理解、决策与协同执行能力。 3、智能体工程化与能力复用建设: 设计并持续优化 Prompt、RAG(检索增强生成)、工具调用及 Agent 协作机制,推动大模型、推荐及相关决策能力的工程化落地,保障智能体能力的稳定性、可扩展性与跨场景复用。 4、业务决策模型与数据驱动优化: 结合销售线索质量、智能报价与折扣策略等业务需求,支持折扣方案模型的优化与场景拓展,通过数据挖掘与分析持续评估智能体与模型效果,驱动核心能力的迭代优化与业务价值提升。

更新于 2026-01-19深圳
logo of sf
社招3-5年

1. 大模型技术研发与优化 深入探索大模型(如LLM、多模态模型)的核心算法,包括预训练、微调(Fine-tuning)、提示工程(Prompt Engineering)、RAG(检索增强生成)等技术,优化模型效果与性能。 *熟悉并能够设计和实现多智能体调度框架,结合大模型实现高效的任务调度和协作机制。 2. 大模型应用场景落地 负责大模型在垂直领域的应用开发,包括但不限于AIOps、代码生成/续写、智能问答、知识推理等场景,推动技术成果转化为实际生产力。 结合业务需求,设计高质量微调数据集和模型评估集,设计端到端的大模型解决方案,优化模型部署效率与推理成本。 3. 工程化与性能调优 熟悉Dify、LangGraph 等应用开发框架,能快速构建原型并推进产品化。 熟练使用Python,熟悉PyTorch/TensorFlow框架,具备CUDA/分布式训练经验者优先。 4. 跨团队协作与创新 与产品、数据、运维团队紧密合作,理解业务需求并设计技术方案。 跟踪学术界与工业界前沿技术(如Agent技术、MoE架构、MCP、A2A协议等),探索技术突破点。

更新于 2026-01-14深圳