logo of quark

夸克千问事业部-安全大模型算法专家-LLM方向

社招全职1年以上技术类-算法地点:北京状态:招聘

任职要求


1、3年以上算法研发经历,计算机相关专业研究生及以上学历; 
2、熟悉LLM后训练方法,具有SFT/DPO/GRPO等模型微调经验;熟悉Chain-of-Thought、LLM蒸馏等大模型业务落地方案;熟悉RAG、Agen…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责内容安全防控体系搭建,负责语言大模型防控能力及链路建设,包括风险内容识别能力、越狱识别能力、意图识别能力、安全代答能力等,保证业务安全及大模型应用安全;探索前沿LLM应用方案,落地千问等全业务审核场景;
2、参与语言大模型风控的数据、算法、决策完整体系建设,端到端拦截业务生成风险的同时,通过安全干预方式提升用户使用体验;负责审核模型的post-training,通过SFT/DPO/GRPO等方式实现审核规则输入及细粒度单轮/多轮风险内容识别;
3、负责搭建&迭代应急响应机制,实现对突发应急事件的实时拦截、应急处置,搭建自动迭代机制分钟/小时级闭环覆盖新增风险;
4、负责“数据生成/评估(Synthetic data/LLM-as-a-Judge)-审核模型训练-护栏攻击/风险挖掘(Agent)”的自动化迭代流程搭建,在业务场景打造行业一流的语言大模型安全风控体系。
包括英文材料
算法+
学历+
大模型+
还有更多 •••
相关职位

logo of quark
社招3年以上运营-产品运营

1、深入研究大模型在对话交互、内容生成等场景下的潜在安全风险(如幻觉、偏见、诱导违规、价值观偏差等)。结合国家相关法律法规及监管要求,制定并持续迭代千问大模型的内容安全审核规则、风险分类分级标准及防御策略; 2、负责日常及突发风险事件的监测与处置,通过Badcase挖掘与归因分析,快速响应并解决模型输出中的安全问题。针对提示词注入、越狱攻击等新型攻击手段,设计针对性的防御机制与拦截策略,持续降低模型回复的风险率; 3、协同算法与产品团队,构建高质量的“红队测试”数据集与安全对齐语料。通过Prompt优化、RAG(检索增强生成)干预、安全代答策略等手段,推动模型在安全维度的持续调优,实现“以模护模”的自动化风险拦截; 4、建立大模型内容安全评估体系,在模型迭代、备案及上线前开展全方位的安全评测与压力测试,输出风险评估报告,确保模型在全生命周期内的合规性与鲁棒性。

更新于 2026-06-09北京
logo of quark
社招2年以上技术类-算法

全面负责定义、设计并实现下一代 Agentic AI 系统的核心算法与技术范式,将千问从回答问题升级成执行任务,解决智能体在任务规划、工具使用、多步推理、长程自主执行、环境交互等方面的核心挑战,探索并引领模型在自主决策、复杂任务编排、人机协作等前沿方向的技术突破。直接决定数亿千问用户在 AI 助手场景下的任务完成体验, 打造千问在 Agentic AI 时代的领先地位。 1. Agentic 能力定义与技术规划 深入分析用户的真实任务需求与使用场景,结合业务,制定并执行 Agentic 能力的中长期技术演进路线图。密切追踪并研究 agentic AI 领域的最新进展,包括 agent 架构范式(ReAct、多智能体协作等)、agentic RL、工具学习、计算机使用(computer use)、长程自主执行等方向,主导定义“顶级智能体能力”的标准,并将其分解为可落地、可量化的算法迭代目标。 2. 任务规划与多步推理 攻坚并解决复杂任务下的核心技术难题,包括但不限于任务分解与规划、多步推理与反思、错误自我识别与纠正、长程任务的记忆与状态管理、异常处理与恢复等。设计创新的脚手架与训练策略,使模型具备真正可靠、连贯的长程自主执行能力,而不仅是单轮的指令响应。 3. 工具使用与环境交互 主导研发模型与外部工具、API、代码执行环境、搜索引擎、数据库等深度动态融合的先进技术。解决工具调用准确性、参数生成、多工具编排、observation 理解与处理、执行结果验证等核心问题。设计并优化可扩展的工具调用框架与执行环境,显著提升智能体在真实场景下完成复杂任务的成功率与可靠性。 4. Agentic 训练与对齐 主导大模型在 agentic 场景下的 post-training 与对齐工作,包括 agentic SFT、面向工具使用与多步任务的强化学习(RLHF/RLAIF/DPO/GRPO 等)、奖励设计与可验证奖励、长程任务的信用分配、reward hacking 的识别与对抗等,设计高效的样本构建流水线,推动 agentic 能力的持续提升。 5. 评测体系与数据飞轮 建立并完善一套科学、全面的 agentic 能力评测体系,能够精准衡量智能体的任务完成质量(成功率、效率、可靠性、安全性等),覆盖过程评估与结果评估。探索 Agent-as-Judge 等前沿评测方法,以及针对性agentic benchmark建设,设计并驱动高效的数据闭环系统,利用真实用户的任务轨迹与反馈,持续、自动化地优化模型。

更新于 2026-06-09北京|杭州
logo of amap
社招2年以上技术类-开发

1、负责高德出行场景(驾车,骑行,步行)的大模型应用框架开发,构建高可用、低延迟的分布式系统; 2、负责优化Agent决策引擎、任务调度、多模态数据处理等模块的性能与稳定性; 3、负责搭建Agent与外部系统(如数据库、API、第三方服务)的高效通信机制; 4、负责保障大模型应用系统架构的稳定、高效运行,帮助业务优化性能和改善系统稳定性; 5、负责协调业务资源,与大模型算法和数据源服务等团队协作,保障项目有效落地和需求高效交付。

更新于 2025-12-02北京
logo of kuaishou
社招D4870

1、负责快手国际化Push相关的算法研发、优化工作,运用策略和算法手段促进用户增长; 2、负责Push推荐系统的搭建以及相关算法落地,面对亿级别的用户群体情况下实现Push的个性化匹配,做到千人千面; 3、负责Push的算法、策略的设计,并直接参与Push场景下推荐系统的全链路开发与优化,包括但不局限于触发、召回、粗排、精排、下发策略等阶段; 4、从海量数据中挖掘用户消费行为、社交关系网以及运营热点实现Push内容池的搭建。

更新于 2025-04-09北京