logo of quark

夸克千问C端事业群-多模态大模型Agentic算法专家-北京、广州

社招全职1年以上技术类-算法地点:北京 | 广州状态:招聘

任职要求


1. 算法功底: 精通PPO、GRPO、DPO等强化学习算法,有大规模模型RLHF实战经验。
2. 专业深度: 深刻理解CoT、自反思及工具学习,熟悉分布式训练框架。
3. 创新能力…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责Agentic大模型相关算法开发与优化,开发性能达到业界sota的Agentic大模型并能在实际业务场景中应用落地 
2. 针对Agentic模型的训练特点,探索Agentic数据的合成策略与后训练数据配比策略,探索稳定高效的Agentic RL 方案,优化长程任务,实现智能体在复杂环境下的自主探索与迭代。
3. 探索创新Agentic RL算法,撰写发表创新论文或技术报告,参与模型开源,和社区、学术界保持良好的交流
包括英文材料
算法+
强化学习+
RLHF+
还有更多 •••
相关职位

logo of quark
社招2年以上技术类-算法

1. 负责多模态内容安全防控体系搭建,建设多全模态内容审核能力、多模态大模型安全调优能力,保证业务安全及大模型应用安全; 2. 多模态大模型算法:参与多模态大模型安全能力建设,负责多模态大模型安全能力、跨模态通用表征、AI Agent、AIGC等算法研发与应用,建立端到端多模态安全风控解决方案,紧跟业界前沿研究方向; 3、岗位特色:应对全风险,全模态问题,快速提升综合算法能力,与大模型时代发展同步,深耕大模型安全领域,持续积累安全领域业务经验; 4、业务支持:保障夸克AI、通义千问ToC、UC浏览器、书旗小说、超级汇川等产品的内容安全及大模型安全; 5、部门特色:作为综合型安全中台,包含法务、GA、公关、数安、内安、商安等职能,协同共建为业务提供全面安全保障。

更新于 2026-02-10北京
logo of quark
社招3年以上技术类-算法

千问学习算法团队致力于使用AI技术重塑面向未来的学习体验。在这里您将与我们一起挑战前沿的产品技术问题,并收获服务千万级用户的成就感和影响力。 1. 负责面向场景的多模态大模型研发,包括图文、视频、音频等多个模态的预训练,探索多模态的数据质量评估和清洗方法; 2. 负责对模型的训练数据、训练策略、模型结构等进行深入分析,指导评测方式迭代以及模型训练策略优化; 3. 负责视觉深度推理、数字化理解、实时语音交互对话、视频生成等能力建设; 4. 负责跟踪和研究多模态大模型前沿技术调研、落地、对业务进行优化; 5. 负责对各业务场景下相关技术问题进行分析、算法设计、研发以及推动上线,提升业务效果;

更新于 2026-02-03北京
logo of quark
社招3年以上技术类-算法

1.负责全模态交互系统的算法研发,包括但不限于多模态意图理解、上下文感知、复杂任务分解、GUI理解、工具调用等功能的实现; 2.设计先进的全模态融合与推理算法,确保系统在各类真实场景中的鲁棒性与响应效率; 3.跟踪全模态大模型发展趋势,包括SFT、RL、多模态对齐等技术,探索前沿技术在产品中的落地应用。

更新于 2026-01-28杭州
logo of quark
社招2年以上技术类-算法

1. 负责音频多模态生成大模型的研发,包含语音合成、音乐生成、音效生成和歌曲生成等任务的基础研究和应用落地; 2. 研发基于扩散模型(Diffusion Models)或自回归模型(AR)的音频生成算法; 3. 研究音频表征、强化学习或语音端到端等技术方向。

更新于 2026-04-02北京|杭州|上海