顺丰大模型算法专家
社招全职3-5年地点:深圳状态:招聘
任职要求
1. 硕士及以上学历,博士学历优先,计算机/人工智能/数学/统计学等相关专业优先,具备 5 年以上团队管理经验(3 年+大语言模型方向工作经验); 2. 深入掌握大语言模型架构(如Transformer、LLaMA、Qwen、DeepSeek、GPT等),具备百亿参数规模以上的大语言模型Pre-train、Fine-tune、RLHF(GRPO, DAPO等)等完整研发及落地实战经验; 3. 精通Python,掌握至少一类深度学习框架(如PyTorch),熟悉多种分布式…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1. 负责制定大语言模型方向的技术战略与演进路线,持续引领团队在算法创新、系统部署、智能体架构等关键方向取得突破; 2. 全面统筹垂域大语言模型的研发、评估与部署生命周期,推动算法与系统能力的标准化、模块化和可复用建设; 3. 牵头在客服、销售、收派、运营、办公智能等核心领域构建智能体系统,重构关键业务流程,推动大语言模型的深度融合与落地应用; 4. 主导复杂业务问题的抽象建模,构建行业级、多任务、多场景的评估体系,覆盖模型精度、稳定性、安全合规等维度; 5. 制定并实施大语言模型系统性能优化策略,构建资源利用率高、弹性强的推理服务架构,提升模型部署效率与稳定性; 6. 引导团队围绕业务目标开展系统性大语言模型算法调研与分析,识别潜在问题与机会点,提出可落地的优化方案; 7. 紧跟大语言模型领域技术发展,持续输出行业趋势洞察,制定面向未来的技术路线与实施规划; 8. 管理算法团队,对团队成员进行技术引领、指导、职业发展辅导,保持团队先进性。
包括英文材料
学历+
Transformer+
https://huggingface.co/learn/llm-course/en/chapter1/4
Breaking down how Large Language Models work, visualizing how data flows through.
https://poloclub.github.io/transformer-explainer/
An interactive visualization tool showing you how transformer models work in large language models (LLM) like GPT.
https://www.youtube.com/watch?v=wjZofJX0v4M
Breaking down how Large Language Models work, visualizing how data flows through.
Llama+
https://github.com/LlamaFamily/Llama-Chinese
Llama中文社区,实时汇总最新Llama学习资料,构建最好的中文Llama大模型开源生态,完全开源可商用。
https://www.llama.com/docs/overview/
This guide provides information and resources to help you set up Llama including how to access the model, hosting, how-to and integration guides.
GPT+
https://www.youtube.com/watch?v=kCc8FmEb1nY
We build a Generatively Pretrained Transformer (GPT), following the paper "Attention is All You Need" and OpenAI's GPT-2 / GPT-3.
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
还有更多 •••
相关职位
社招核心本地商业-基
1. 从flops efficiency角度,对大模型预训练过程进行分析与探索,包括不限于对scaling law的研究,数据的认知实验,MoE等模型架构设计,以及其他工程与算法结合的ml sys相关优化等。 2. 负责原生多模态大模型的构建与预训练,包括各模态分词器设计,合成数据策略,以及跨模态融合训练策略等,提升原生多模态模型在视觉/语音的理解与生成任务上的能力。 3. 进行大模型reasoning能力的相关研究,研究pre-train / test-time compute对于模型推理能力的影响,借助SFT / DPO / self-play等手段,提高模型在代码数学等推理任务上的表现。 4. 通过post-training激发模型在各下游任务上的能力,从而构建具有通用问题解决能力的agent。
更新于 2025-06-03北京|上海
社招研发类
1、跟进大模型领域最新进展,包括LLM、VLM、SpeechLLM、Reasoning模型等领域近期算法的跟踪、实现、最佳实践流程标准化; 2、与研发团队密切合作,面向实际业务场景与软硬件特点,将算法与工程技术落地于实际项目,满足前沿创新目标或者业务目标。
更新于 2025-04-28南京|上海

