logo of sf

顺丰大模型算法专家

社招全职3-5年地点:深圳状态:招聘

任职要求


1. 硕士及以上学历,博士学历优先,计算机/人工智能/数学/统计学等相关专业优先,具备 5 年以上团队管理经验(3 年+大语言模型方向工作经验);
2. 深入掌握大语言模型架构(如TransformerLLaMA、Qwen、DeepSeek、GPT等),具备百亿参数规模以上的大语言模型Pre-train、Fine-tune、RLHF(GRPO, DAPO等)等完整研发及落地实战经验;
3. 精通Python,掌握至少一类深度学习框架(如PyTorch),熟悉多种分布式训练/推理加速技术(如DeepSpeed、Megatron、vLLM、FlashAttention等);
4. 具备大语言模型应用、Agent产品化经验,深刻理解自主决策的Agent建设方法论,曾主导或深度参与复杂业务场景的大语言模型部署与落地,有可量化的业务成果;
5. 熟悉大模型的部署、AI工程化,熟悉大模型的训练加速、推理加速、并发提升、资源节降技术,具备良好的系统工程能力;
6. 优秀的团队管理能力,具备跨团队沟通、项目协调、技术赋能能力,能激发团队技术成长潜力。

工作职责


1. 负责制定大语言模型方向的技术战略与演进路线,持续引领团队在算法创新、系统部署、智能体架构等关键方向取得突破;
2. 全面统筹垂域大语言模型的研发、评估与部署生命周期,推动算法与系统能力的标准化、模块化和可复用建设;
3. 牵头在客服、销售、收派、运营、办公智能等核心领域构建智能体系统,重构关键业务流程,推动大语言模型的深度融合与落地应用;
4. 主导复杂业务问题的抽象建模,构建行业级、多任务、多场景的评估体系,覆盖模型精度、稳定性、安全合规等维度;
5. 制定并实施大语言模型系统性能优化策略,构建资源利用率高、弹性强的推理服务架构,提升模型部署效率与稳定性;
6. 引导团队围绕业务目标开展系统性大语言模型算法调研与分析,识别潜在问题与机会点,提出可落地的优化方案;
7. 紧跟大语言模型领域技术发展,持续输出行业趋势洞察,制定面向未来的技术路线与实施规划;
8. 管理算法团队,对团队成员进行技术引领、指导、职业发展辅导,保持团队先进性。
包括英文材料
学历+
Transformer+
Llama+
GPT+
Python+
深度学习+
PyTorch+
vLLM+
AI agent+
大模型+
相关职位

logo of meituan
社招核心本地商业-基

1. 从flops efficiency角度,对大模型预训练过程进行分析与探索,包括不限于对scaling law的研究,数据的认知实验,MoE等模型架构设计,以及其他工程与算法结合的ml sys相关优化等。 2. 负责原生多模态大模型的构建与预训练,包括各模态分词器设计,合成数据策略,以及跨模态融合训练策略等,提升原生多模态模型在视觉/语音的理解与生成任务上的能力。 3. 进行大模型reasoning能力的相关研究,研究pre-train / test-time compute对于模型推理能力的影响,借助SFT / DPO / self-play等手段,提高模型在代码数学等推理任务上的表现。 4. 通过post-training激发模型在各下游任务上的能力,从而构建具有通用问题解决能力的agent。

更新于 2025-06-03
logo of hello
社招技术

研发哈啰出行大模型应用落地,支持千万DAU的Agent(包括主动性交易撮合Agent、生成式搜推广告大模型、智能客服、出行机器人等)

更新于 2025-07-03
logo of honor
社招研发类

1、跟进大模型领域最新进展,包括LLM、VLM、SpeechLLM、Reasoning模型等领域近期算法的跟踪、实现、最佳实践流程标准化; 2、与研发团队密切合作,面向实际业务场景与软硬件特点,将算法与工程技术落地于实际项目,满足前沿创新目标或者业务目标。

更新于 2025-04-28
logo of 10jqka
校招AI 算法类

1.负责公司大模型基座、多模态大模型核心算法研发(包括不限于文本,视频,图片,音频等); 2.负责大模型基座、多模态模型大规模训练加速,压缩、蒸馏、微调等技术方案。