夸克千问事业部-安全大模型算法专家-LLM方向

社招全职1年以上技术类-算法2026-06-09地点：北京状态：招聘

扫码手机上打开

任职要求

1、3年以上算法研发经历，计算机相关专业研究生及以上学历； 
2、熟悉LLM后训练方法，具有SFT/DPO/GRPO等模型微调经验；熟悉Chain-of-Thought、LLM蒸馏等大模型业务落地方案；熟悉RAG、Agen…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、负责内容安全防控体系搭建，负责语言大模型防控能力及链路建设，包括风险内容识别能力、越狱识别能力、意图识别能力、安全代答能力等，保证业务安全及大模型应用安全；探索前沿LLM应用方案，落地千问等全业务审核场景；
2、参与语言大模型风控的数据、算法、决策完整体系建设，端到端拦截业务生成风险的同时，通过安全干预方式提升用户使用体验；负责审核模型的post-training，通过SFT/DPO/GRPO等方式实现审核规则输入及细粒度单轮/多轮风险内容识别；
3、负责搭建&迭代应急响应机制，实现对突发应急事件的实时拦截、应急处置，搭建自动迭代机制分钟/小时级闭环覆盖新增风险；
4、负责“数据生成/评估（Synthetic data/LLM-as-a-Judge）-审核模型训练-护栏攻击/风险挖掘（Agent）”的自动化迭代流程搭建，在业务场景打造行业一流的语言大模型安全风控体系。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

算法+

学历+

大模型+

还有更多 •••

登录查看完整学习资料

相关职位

千问事业部-安全大模型运营专家-北京

社招3年以上运营-产品运营

1、深入研究大模型在对话交互、内容生成等场景下的潜在安全风险（如幻觉、偏见、诱导违规、价值观偏差等）。结合国家相关法律法规及监管要求，制定并持续迭代千问大模型的内容安全审核规则、风险分类分级标准及防御策略； 2、负责日常及突发风险事件的监测与处置，通过Badcase挖掘与归因分析，快速响应并解决模型输出中的安全问题。针对提示词注入、越狱攻击等新型攻击手段，设计针对性的防御机制与拦截策略，持续降低模型回复的风险率； 3、协同算法与产品团队，构建高质量的“红队测试”数据集与安全对齐语料。通过Prompt优化、RAG（检索增强生成）干预、安全代答策略等手段，推动模型在安全维度的持续调优，实现“以模护模”的自动化风险拦截； 4、建立大模型内容安全评估体系，在模型迭代、备案及上线前开展全方位的安全评测与压力测试，输出风险评估报告，确保模型在全生命周期内的合规性与鲁棒性。

更新于 2026-06-09北京

千问事业部-千问大模型Agentic算法专家-北京/杭州

社招2年以上技术类-算法

全面负责定义、设计并实现下一代 Agentic AI 系统的核心算法与技术范式，将千问从回答问题升级成执行任务，解决智能体在任务规划、工具使用、多步推理、长程自主执行、环境交互等方面的核心挑战，探索并引领模型在自主决策、复杂任务编排、人机协作等前沿方向的技术突破。直接决定数亿千问用户在 AI 助手场景下的任务完成体验, 打造千问在 Agentic AI 时代的领先地位。 1. Agentic 能力定义与技术规划深入分析用户的真实任务需求与使用场景，结合业务，制定并执行 Agentic 能力的中长期技术演进路线图。密切追踪并研究 agentic AI 领域的最新进展,包括 agent 架构范式(ReAct、多智能体协作等)、agentic RL、工具学习、计算机使用(computer use)、长程自主执行等方向，主导定义“顶级智能体能力”的标准,并将其分解为可落地、可量化的算法迭代目标。 2. 任务规划与多步推理攻坚并解决复杂任务下的核心技术难题，包括但不限于任务分解与规划、多步推理与反思、错误自我识别与纠正、长程任务的记忆与状态管理、异常处理与恢复等。设计创新的脚手架与训练策略,使模型具备真正可靠、连贯的长程自主执行能力，而不仅是单轮的指令响应。 3. 工具使用与环境交互主导研发模型与外部工具、API、代码执行环境、搜索引擎、数据库等深度动态融合的先进技术。解决工具调用准确性、参数生成、多工具编排、observation 理解与处理、执行结果验证等核心问题。设计并优化可扩展的工具调用框架与执行环境，显著提升智能体在真实场景下完成复杂任务的成功率与可靠性。 4. Agentic 训练与对齐主导大模型在 agentic 场景下的 post-training 与对齐工作,包括 agentic SFT、面向工具使用与多步任务的强化学习(RLHF/RLAIF/DPO/GRPO 等)、奖励设计与可验证奖励、长程任务的信用分配、reward hacking 的识别与对抗等，设计高效的样本构建流水线，推动 agentic 能力的持续提升。 5. 评测体系与数据飞轮建立并完善一套科学、全面的 agentic 能力评测体系，能够精准衡量智能体的任务完成质量(成功率、效率、可靠性、安全性等)，覆盖过程评估与结果评估。探索 Agent-as-Judge 等前沿评测方法，以及针对性agentic benchmark建设，设计并驱动高效的数据闭环系统，利用真实用户的任务轨迹与反馈，持续、自动化地优化模型。

更新于 2026-06-09北京|杭州

高德-AI应用开发工程师-出行业务

社招2年以上技术类-开发

1、负责高德出行场景（驾车，骑行，步行）的大模型应用框架开发，构建高可用、低延迟的分布式系统； 2、负责优化Agent决策引擎、任务调度、多模态数据处理等模块的性能与稳定性； 3、负责搭建Agent与外部系统（如数据库、API、第三方服务）的高效通信机制； 4、负责保障大模型应用系统架构的稳定、高效运行，帮助业务优化性能和改善系统稳定性； 5、负责协调业务资源，与大模型算法和数据源服务等团队协作，保障项目有效落地和需求高效交付。

更新于 2025-12-02北京

推荐算法工程师-【海外Push】

社招D4870

1、负责快手国际化Push相关的算法研发、优化工作，运用策略和算法手段促进用户增长； 2、负责Push推荐系统的搭建以及相关算法落地，面对亿级别的用户群体情况下实现Push的个性化匹配，做到千人千面； 3、负责Push的算法、策略的设计，并直接参与Push场景下推荐系统的全链路开发与优化，包括但不局限于触发、召回、粗排、精排、下发策略等阶段； 4、从海量数据中挖掘用户消费行为、社交关系网以及运营热点实现Push内容池的搭建。

更新于 2025-04-09北京