夸克千问C端事业群-多模态大模型Posttrain工程师-北京&广州
任职要求
1. 计算机相关专业硕士及以上学历;具有较强的逻辑分析能力,对数据敏感; 2. 熟悉 Linux 和 Python,熟悉Pytorch, transformers 等工具使用,了解分布式训练框架如Deepspeed、Megatron-LM等,熟悉大规模分布式训练,具备优秀的工程开发能力; 3. 精通业界主流的Posttrain技术、包括不限于Grpo、Gspo等,在Ag…
工作职责
千问多模态推理算法致力于使用AI在Agentic、stem等方向的效果提升。在这里您将与我们一起挑战前沿的产品技术问题,并收获服务千万级用户的成就感和影响力。 1. 负责面向推理的多模态大模型研发,包括图文、视频、音频等多个模态的预训练,探索多模态的数据质量评估和清洗方法; 2. 负责对模型的训练数据、训练策略、模型结构等进行深入分析。 3. 负责强化学习算法研发、提升训练稳定性、采样效率、训练效果。 4. 负责跟踪和研究多模态大模型前沿技术调研、落地、对业务进行优化; 5. 负责对各业务场景下相关技术问题进行分析、算法设计、研发以及推动上线,提升业务效果;
1. 负责多模态内容安全防控体系搭建,建设多全模态内容审核能力、多模态大模型安全调优能力,保证业务安全及大模型应用安全; 2. 多模态大模型算法:参与多模态大模型安全能力建设,负责多模态大模型安全能力、跨模态通用表征、AI Agent、AIGC等算法研发与应用,建立端到端多模态安全风控解决方案,紧跟业界前沿研究方向; 3、岗位特色:应对全风险,全模态问题,快速提升综合算法能力,与大模型时代发展同步,深耕大模型安全领域,持续积累安全领域业务经验; 4、业务支持:保障夸克AI、通义千问ToC、UC浏览器、书旗小说、超级汇川等产品的内容安全及大模型安全; 5、部门特色:作为综合型安全中台,包含法务、GA、公关、数安、内安、商安等职能,协同共建为业务提供全面安全保障。
千问学习算法团队致力于使用AI技术重塑面向未来的学习体验。在这里您将与我们一起挑战前沿的产品技术问题,并收获服务千万级用户的成就感和影响力。 1. 负责面向场景的多模态大模型研发,包括图文、视频、音频等多个模态的预训练,探索多模态的数据质量评估和清洗方法; 2. 负责对模型的训练数据、训练策略、模型结构等进行深入分析,指导评测方式迭代以及模型训练策略优化; 3. 负责视觉深度推理、数字化理解、实时语音交互对话、视频生成等能力建设; 4. 负责跟踪和研究多模态大模型前沿技术调研、落地、对业务进行优化; 5. 负责对各业务场景下相关技术问题进行分析、算法设计、研发以及推动上线,提升业务效果;
1. 负责Agentic大模型相关算法开发与优化,开发性能达到业界sota的Agentic大模型并能在实际业务场景中应用落地 2. 针对Agentic模型的训练特点,探索Agentic数据的合成策略与后训练数据配比策略,探索稳定高效的Agentic RL 方案,优化长程任务,实现智能体在复杂环境下的自主探索与迭代。 3. 探索创新Agentic RL算法,撰写发表创新论文或技术报告,参与模型开源,和社区、学术界保持良好的交流