logo of quark

夸克千问事业部-安全大模型产品专家-北京

社招全职3年以上产品类-用户型地点:北京状态:招聘

任职要求


1、本科及以上学历,3年以上B端、平台型或安全相关产品经验,熟悉产品全流程;
2、了解大模型基本原理与生成机制,熟悉护栏常见防护手段(提示词拦截、输出审核、语义检测等),能与算法、工程师有效对话,独立评估安全策略对端上响应时延的影响;
3、优秀的沟通协调能力,具备与业务、算法、工程、风险运营等多角色高效协同的经验,能够将复…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责各业务接入大模型护栏能力时的全链路方案设计,包括安全介入环节的确定、时效要求制定、数据传输与交互逻辑设计,对最终的安全体验与响应效率负责;
2、主动监控并通过数据分析等手段发现大模型安全链路中的异常问题,牵头排查、定位根源,并协调外部产品/技术/算法&内部安全技术、算法及风险运营等角色推动解决;
3、对接外部业务产品/技术/算法,及内部风险运营/技术/算法,理解各方诉求与约束,推动共识达成,确保安全能力落地;
4、统筹部门内多个安全相关项目(如护栏链路迭代、算法能力接入&应用、新业务接入等),制定里程碑,跟踪进度,识别风险,确保交付质量。
包括英文材料
学历+
大模型+
还有更多 •••
相关职位

logo of quark
社招5年以上产品类-平台型

1. 负责通义APP内容安全中台的产品设计,并协调内外部资源实现落地; 2. 开展竞品调研,分析行业动态和竞争对手情况,制定内容风控能力升级规划; 3. 协调算法、运营、研发等岗位,对项目进行全流程管理,包括资源调配、进度跟踪和风险管控; 4. 优化产品设计,提升内容安全中台操作效率和操作体验; 5. 探索新的AI产品安全形态,充分获取大模型行业发展及相应安全动态信息,并有效应用

更新于 2025-12-09北京
logo of quark
社招3年以上运营-产品运营

1、深入研究大模型在对话交互、内容生成等场景下的潜在安全风险(如幻觉、偏见、诱导违规、价值观偏差等)。结合国家相关法律法规及监管要求,制定并持续迭代千问大模型的内容安全审核规则、风险分类分级标准及防御策略; 2、负责日常及突发风险事件的监测与处置,通过Badcase挖掘与归因分析,快速响应并解决模型输出中的安全问题。针对提示词注入、越狱攻击等新型攻击手段,设计针对性的防御机制与拦截策略,持续降低模型回复的风险率; 3、协同算法与产品团队,构建高质量的“红队测试”数据集与安全对齐语料。通过Prompt优化、RAG(检索增强生成)干预、安全代答策略等手段,推动模型在安全维度的持续调优,实现“以模护模”的自动化风险拦截; 4、建立大模型内容安全评估体系,在模型迭代、备案及上线前开展全方位的安全评测与压力测试,输出风险评估报告,确保模型在全生命周期内的合规性与鲁棒性。

更新于 2026-06-09北京
logo of quark
社招2年以上技术类-算法

全面负责定义、设计并实现下一代 Agentic AI 系统的核心算法与技术范式,将千问从回答问题升级成执行任务,解决智能体在任务规划、工具使用、多步推理、长程自主执行、环境交互等方面的核心挑战,探索并引领模型在自主决策、复杂任务编排、人机协作等前沿方向的技术突破。直接决定数亿千问用户在 AI 助手场景下的任务完成体验, 打造千问在 Agentic AI 时代的领先地位。 1. Agentic 能力定义与技术规划 深入分析用户的真实任务需求与使用场景,结合业务,制定并执行 Agentic 能力的中长期技术演进路线图。密切追踪并研究 agentic AI 领域的最新进展,包括 agent 架构范式(ReAct、多智能体协作等)、agentic RL、工具学习、计算机使用(computer use)、长程自主执行等方向,主导定义“顶级智能体能力”的标准,并将其分解为可落地、可量化的算法迭代目标。 2. 任务规划与多步推理 攻坚并解决复杂任务下的核心技术难题,包括但不限于任务分解与规划、多步推理与反思、错误自我识别与纠正、长程任务的记忆与状态管理、异常处理与恢复等。设计创新的脚手架与训练策略,使模型具备真正可靠、连贯的长程自主执行能力,而不仅是单轮的指令响应。 3. 工具使用与环境交互 主导研发模型与外部工具、API、代码执行环境、搜索引擎、数据库等深度动态融合的先进技术。解决工具调用准确性、参数生成、多工具编排、observation 理解与处理、执行结果验证等核心问题。设计并优化可扩展的工具调用框架与执行环境,显著提升智能体在真实场景下完成复杂任务的成功率与可靠性。 4. Agentic 训练与对齐 主导大模型在 agentic 场景下的 post-training 与对齐工作,包括 agentic SFT、面向工具使用与多步任务的强化学习(RLHF/RLAIF/DPO/GRPO 等)、奖励设计与可验证奖励、长程任务的信用分配、reward hacking 的识别与对抗等,设计高效的样本构建流水线,推动 agentic 能力的持续提升。 5. 评测体系与数据飞轮 建立并完善一套科学、全面的 agentic 能力评测体系,能够精准衡量智能体的任务完成质量(成功率、效率、可靠性、安全性等),覆盖过程评估与结果评估。探索 Agent-as-Judge 等前沿评测方法,以及针对性agentic benchmark建设,设计并驱动高效的数据闭环系统,利用真实用户的任务轨迹与反馈,持续、自动化地优化模型。

更新于 2026-06-09北京|杭州
logo of amap
社招2年以上技术类-开发

1、负责高德出行场景(驾车,骑行,步行)的大模型应用框架开发,构建高可用、低延迟的分布式系统; 2、负责优化Agent决策引擎、任务调度、多模态数据处理等模块的性能与稳定性; 3、负责搭建Agent与外部系统(如数据库、API、第三方服务)的高效通信机制; 4、负责保障大模型应用系统架构的稳定、高效运行,帮助业务优化性能和改善系统稳定性; 5、负责协调业务资源,与大模型算法和数据源服务等团队协作,保障项目有效落地和需求高效交付。

更新于 2025-12-02北京