顺丰大模型算法工程师
社招全职3-5年地点:深圳状态:招聘
任职要求
1、学历与经验: 计算机、人工智能、数学等相关专业硕士及以上学历,3 年及以上算法或大模型相关工作经验,具备大语言模型在真实业务场景中的落地实践经验者优先。 2、大模型与算法能力: 熟悉主流大语言模型(如 GPT、Qwen、LLaMA 等)的原理与使用方式,具备 Prompt Engineering、模型微调(SFT / LoRA)或推理优化经验;对意图识别、文本理解、信息抽取、多轮对话、任务规划等 NLP 方向具备扎实的理论基础与实践能力。 3、智能体与系统设计能力: 理解并具备基于大模型的智能体(Agent)设计与实现经验,熟悉多智能体协作机制、…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、大模型与智能体核心能力建设: 围绕销售及大件业务场景,负责大语言模型在意图识别、规划理解、多轮对话、用户画像与偏好洞察、话题与线索分析、知识问答及 chatBI 等核心能力上的应用设计、微调与持续优化,支撑线索智能体、销售助手智能体及大件智能体等关键场景落地。 2、智能体推理链路与多智能体协同设计: 参与线索子智能体、销售助手子智能体、大件智能体与一级、三级销售智能体的大模型协同架构设计,构建基于大模型的多轮推理、任务分解与业务决策链路,提升智能体在复杂销售与大件业务场景下的理解、决策与协同执行能力。 3、智能体工程化与能力复用建设: 设计并持续优化 Prompt、RAG(检索增强生成)、工具调用及 Agent 协作机制,推动大模型、推荐及相关决策能力的工程化落地,保障智能体能力的稳定性、可扩展性与跨场景复用。 4、业务决策模型与数据驱动优化: 结合销售线索质量、智能报价与折扣策略等业务需求,支持折扣方案模型的优化与场景拓展,通过数据挖掘与分析持续评估智能体与模型效果,驱动核心能力的迭代优化与业务价值提升。
包括英文材料
学历+
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
GPT+
https://www.youtube.com/watch?v=kCc8FmEb1nY
We build a Generatively Pretrained Transformer (GPT), following the paper "Attention is All You Need" and OpenAI's GPT-2 / GPT-3.
Llama+
https://github.com/LlamaFamily/Llama-Chinese
Llama中文社区,实时汇总最新Llama学习资料,构建最好的中文Llama大模型开源生态,完全开源可商用。
https://www.llama.com/docs/overview/
This guide provides information and resources to help you set up Llama including how to access the model, hosting, how-to and integration guides.
Prompt+
https://cloud.google.com/vertex-ai/generative-ai/docs/learn/prompts/introduction-prompt-design
A prompt is a natural language request submitted to a language model to receive a response back.
https://learn.microsoft.com/en-us/azure/ai-foundry/openai/concepts/prompt-engineering
These techniques aren't recommended for reasoning models like gpt-5 and o-series models.
https://www.youtube.com/watch?v=LWiMwhDZ9as
Learn and master the fundamentals of Prompt Engineering and LLMs with this 5-HOUR Prompt Engineering Crash Course!
SFT+
https://cameronrwolfe.substack.com/p/understanding-and-using-supervised
Understanding how SFT works from the idea to a working implementation...
NLP+
https://www.youtube.com/watch?v=fNxaJsNG3-s&list=PLQY2H8rRoyvzDbLUZkbudP-MFQZwNmU4S
Welcome to Zero to Hero for Natural Language Processing using TensorFlow!
https://www.youtube.com/watch?v=R-AG4-qZs1A&list=PLeo1K3hjS3uuvuAXhYjV2lMEShq2UYSwX
Natural Language Processing tutorial for beginners series in Python.
https://www.youtube.com/watch?v=rmVRLeJRkl4&list=PLoROMvodv4rMFqRtEuo6SGjY4XbRIVRd4
The foundations of the effective modern methods for deep learning applied to NLP.
还有更多 •••
相关职位
社招1年以上算法开发岗
1、参与生成式大模型能力构建;不局限于模型设计、prompt优化、预训练、模型推理加速、其他能力建设等; 2、采用最先进的并行处理和分布式学习技术,制定并执行性能优化策略,显著提升大型语言模型的训练速度和推理能力,例如跟进DeepSeek R1技术架构等,确保技术行业领先; 3、推进大模型技术在京东物流各个业务场景落地,包括不限于智能问答、智能数据分析、智能决策以及Computer Use等,助力业务流程优化,增质提效; 4、深度探索大语言模型方向,保持技术领先优势,推动京东物流在行业内树立高效、精准的大模型/多模态大模型应用标杆,并取得业务收益。
更新于 2025-06-09北京
社招大模型
1、探索新一代大语言模型基座架构,完成扩散模型(diffusion model)在大语言模型的重塑,突破逐个token预测的方式,实现高效的推理模式,探索全新scaling law; 2、实现大模型训练的数据清洗、合成和评估;设计和实现大模型训练的AI Infra框架。
更新于 2025-11-20北京|上海