logo of aligenie

智能互联千问事业部-大模型训练优化专家-基础架构方向

社招全职1年以上地点:北京 | 杭州 | 广州状态:招聘

任职要求


1、1年及以上后端系统研发、调优经验,熟练掌握Go/Java/Python以及MySQL/MongoDB/PostgreSQL,并可基于此搭建稳定高效系统;…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责千卡以上大规模混合模态大模型强化学习训练框架建设,调研和实现业界先进的强化学习方法,并探索算法工程结合的训练方法创新设计,实现模型性能和训练效率的双提升;
2、参与奖励系统、工具系统交互的设计与研发,打造高效率的可持续扩展架构;并通过线上链路的联合设计保障模型训练效果的对齐,保障模型在事实性、复杂任务规划解决等方面的能力提点可以落地千问App。
包括英文材料
Go+
Java+
Python+
MySQL+
还有更多 •••
相关职位

logo of quark
社招3年以上

1、参与万卡大规模文本及多模态大模型训练框架建设,为Quark、通义等国民级APP的大模型提供持续效果优化能力; 2、参与算法与工程结合的模型结构创新设计,并通过工程实现验证模型性能和训练效率; 3、参与万卡规模训练任务的极致训练效率优化,负责前沿技术的调研、引入和创新,效果验证与落地等工作。

更新于 2026-06-05杭州|广州|北京
logo of aligenie
社招3年以上

1、参与万卡大规模文本及多模态大模型训练框架建设,为Quark、通义等国民级APP的大模型提供持续效果优化能力; 2、参与算法与工程结合的模型结构创新设计,并通过工程实现验证模型性能和训练效率; 3、参与万卡规模训练任务的极致训练效率优化,负责前沿技术的调研、引入和创新,效果验证与落地等工作。

更新于 2026-04-06北京|杭州|广州
logo of aligenie
社招3年以上

1、研究并应用先进的模型压缩技术,在极小精度损失下实现模型瘦身与加速; 2、研发并落地大模型低比特(INT8/INT4/FP8/FP4等)量化技术,开发与硬件协同的量化部署方案,攻克干亿参数模型低比特推理精度挑战; 3、研发并优化新一代投机采样技术,探索多模态与MoE架构加速,构建动态投机采样策略,联合工程团队打造高效训练推理引擎,最大化吞吐收益; 4、研发并应用结构化/非结构化稀疏与剪枝技术,探索与改进KV-Cache压缩、Token剪枝、Prompt压缩及CoT压缩等动态稀疏化方法,以显著降低内存占用并提升系统吞吐。

更新于 2026-04-06北京|杭州|广州
logo of aligenie
社招3年以上

1、专注于解决大规模分布式模型推理中的通信瓶颈,优化通信效率; 2、深入分析NCCL/MPI等通信库在All-Reduce、All-Gather等集合操作中的性能问题,并利用GPUDirect RDMA、InfiniBand等高速网络技术进行底层优化; 3、设计与实现异步通信、计算-通信重叠、拓扑感知集合通信等策略,实现通信与计算的高效重叠,最大化GPU集群在TP/PP/EP等并行场景下的整体效率。

更新于 2026-04-06北京|杭州|广州