快手语言大模型算法专家-【强化学习方向】

社招全职3-5年J00112026-07-03地点：北京状态：招聘

扫码手机上打开

任职要求

1、硕士及以上学历，强化学习相关专业优先；
2、在大规模预训练、模型对齐、强化学习、RAG、Agent等至少一个方向有深厚的项目经验和洞察力；
3…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、深入研究强化学习在快手自研语言大模型中的创新应用，提升大模型能力上限；
2、负责大模型的基础技术研究，包括但不限于训练算法、框架及模型架构相关的基础技术探索和创新；
3、在顶级会议与开源社区塑造快手大模型团队的技术影响力。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

强化学习+

还有更多 •••

登录查看完整学习资料

相关职位

阿里云智能-大语言模型算法专家/高级算法工程师-杭州

社招3年以上云智能集团

1. 高质量垂域数据工程：深入优化垂直领域（如文本内容审核）的高质量数据构建与迭代方法论，持续提升数据的质量、多样性与生产效率。 2. 可扩展后训练体系：探索适配领域特性的 SFT/RL 算法，构建高效、稳定、可扩展的垂域模型后训练范式，系统性提升模型能力。 3. 前沿技术研究与落地：探索推理模型前沿技术（如高效蒸馏、reward system、agentic RL、test-time learning 等）以及模型可解释性技术，沉淀技术成果和影响力，并推动大模型相关技术在行业场景中的转化与落地，提升领域模型竞争力，支撑业务持续增长。

更新于 2026-04-03杭州

阿里云智能-大语言模型算法专家/高级算法工程师-杭州

社招3年以上

更新于 2026-04-03杭州

蚂蚁集团-大语言模型算法专家-北京/上海/杭州【AGI专项】

社招5年以上技术类-算法

1. 负责研发大语言模型预训练技术，如高效的新型llm模型架构、长窗口训练技术、pretrain scaling law、高效预训练策略等。 2. 负责研发基于强化学习的推理模型，如大规模强化学习、新型RL算法、testing time scaling等。

更新于 2026-07-01杭州

蚂蚁集团-大语言模型算法专家-北京/上海/杭州

社招3年以上技术类-算法

1. 模型训练与调优：负责大语言模型的特定能力的指令微调及人类反馈强化学习的全流程研发工作。 2. 数据工程：设计并实施高质量的数据清洗、配比与增强策略，构建用于提升模型逻辑推理、代码生成或领域知识能力的特定数据集。 3. 模型评测与迭代（重点）：（1）构建完善的模型评测体系，深入分析模型在各类 Benchmark（如 C-Eval, CMMLU, GSM8K, MMLU, HumanEval 等）上的表现。（2）针对模型在特定任务上的短板进行归因分析，并提出针对性的优化方案（如数据合成、Prompt Engineering、思维链 CoT 优化等）。 4. 前沿技术跟进：追踪 NLP 及 LLM 领域的最新学术进展（如 MoE 架构、Long Context、Agent 等），并快速复现与落地到业务场景中。

更新于 2025-12-30北京|上海|杭州