美团大模型算法工程师
社招全职2年以上核心本地商业-基础研发平台地点:北京状态:招聘
任职要求
1. 计算机、人工智能、数学等相关专业硕士及以上学历,两年以上大模型、智能体或相关领域研发经验。 2. 具备扎实的大模型训练和调优背景,熟悉主流的大语言模型(Deepseek、Qwen、Llama等)及其他开源模型。精通至少一种深度学习框架(如TensorFlow, PyTorch)。 3. 在以下至少一个技术领域有深入研究和丰富的实践经验: - 智能客服大模型 - 复杂指令遵循、逻辑和数学推理、结合知识约束的推理、DPO、强化学习等 - 大模型问答系统,RAG、Function Call等 - Agent模…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
美团基础研发平台,作为公司的核心技术平台,致力于“零售+科技”的战略发展。我们专注于智能体构建、大模型推理、多模态训练等核心技术,并通过FRIDAY模型工厂与应用工厂,为业务提供稳定、安全、易扩展与技术先进的平台技术和技术能力。我们聚焦于大模型和智能体的前沿算法研究和应用落地,致力于将先进的人工智能技术转化为实际的业务价值。 我们真诚邀请你加入我们,共同推动技术发展,创造行业价值。 1. 支持智能客服项目,负责对话理解和生成类任务的算法建模工作,包括但不限于知识和指令遵循、深度推理、反思和评估等能力的优化和落地。 2. 参与大模型研发及业务落地,支持客服机器人、客户之声、风控等多场景的效果优化。 3. 通过系统建设,降低业务分析数据的门槛,影响和提升业务对数据价值挖掘的能力和效率。 4. 深入理解本地生活服务业务场景,抽象业务所需的大模型基础能力深度优化,推动相关技术在实际业务中的应用。 5. 参与技术创新探索,挖掘大模型落地场景。
包括英文材料
学历+
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
智能体+
https://learn.microsoft.com/en-us/shows/ai-agents-for-beginners/
In this 10-lesson course we take you from concept to code while covering the fundamentals of building AI agents.
https://www.ibm.com/think/ai-agents
Your one-stop resource for gaining in-depth knowledge and hands-on applications of AI agents.
Llama+
https://github.com/LlamaFamily/Llama-Chinese
Llama中文社区,实时汇总最新Llama学习资料,构建最好的中文Llama大模型开源生态,完全开源可商用。
https://www.llama.com/docs/overview/
This guide provides information and resources to help you set up Llama including how to access the model, hosting, how-to and integration guides.
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
TensorFlow+
https://www.youtube.com/watch?v=tpCFfeUEGs8
Ready to learn the fundamentals of TensorFlow and deep learning with Python? Well, you’ve come to the right place.
https://www.youtube.com/watch?v=ZUKz4125WNI
This part continues right where part one left off so get that Google Colab window open and get ready to write plenty more TensorFlow code.
还有更多 •••
相关职位
社招1年以上算法开发岗
1、参与生成式大模型能力构建;不局限于模型设计、prompt优化、预训练、模型推理加速、其他能力建设等; 2、采用最先进的并行处理和分布式学习技术,制定并执行性能优化策略,显著提升大型语言模型的训练速度和推理能力,例如跟进DeepSeek R1技术架构等,确保技术行业领先; 3、推进大模型技术在京东物流各个业务场景落地,包括不限于智能问答、智能数据分析、智能决策以及Computer Use等,助力业务流程优化,增质提效; 4、深度探索大语言模型方向,保持技术领先优势,推动京东物流在行业内树立高效、精准的大模型/多模态大模型应用标杆,并取得业务收益。
更新于 2025-06-09北京
社招大模型
1、探索新一代大语言模型基座架构,完成扩散模型(diffusion model)在大语言模型的重塑,突破逐个token预测的方式,实现高效的推理模式,探索全新scaling law; 2、实现大模型训练的数据清洗、合成和评估;设计和实现大模型训练的AI Infra框架。
更新于 2025-11-20北京|上海