logo of bytedance

字节跳动大模型后训练技术专家-安全与风控

社招全职3年以上A85682地点:北京状态:招聘

任职要求


1、硕士及以上学位,计算机、统计学、人工智能和信息安全专业等相关专业,3年以上算法相关经验;
2、熟练掌握Python/C/C++语言之一,熟悉大数据处理框架和机理,有扎实的AI相关理论基础;
3、深入理解强化学习算法:DPO/PPO/GRPO和相关的训练范式;
4、熟悉大模型技术栈:数据构建/强化学习/有监督微调/模型调优/评估/训练框架/推理加速;
5、在NLP、风控算法、搜索/推荐有丰富的经验,参与过数据处理项目者优先;
6、能够结合实际问题设计端到端的解决方案和架构,高效、稳定、可扩展;良好沟通协调能力,喜欢有挑战的事情,务实、自驱。

工作职责


1、研究模型和技术方案,探索大模型训练在安全领域应用的上限;
2、深入大模型技术栈,结合安全关键问题进行深度产品集成和落地,如代码分析、漏洞检测、自动化攻击研判、Oncall;
3、数据构建/合成/标注/清洗、推理模型/代码模型等后训练(SFT/RL)、框架开发、模型加速与蒸馏等;
4、搭建高效、鲁棒和低成本的模型算法服务,应用到大规模场景;
5、跨团队、跨职能沟通协调,与业务方紧密协作,促进团队和合作方共赢。
包括英文材料
学历+
算法+
Python+
C+
C+++
强化学习+
大模型+
NLP+
相关职位

logo of aliyun
社招3年以上云智能集团

1. 行业解决方案设计与交付 - 基于阿里云大模型技术(如通义千问),为银行、保险、证券等金融客户量身定制AI大模型解决方案,覆盖AI财富助手、智能客服、智能风控等核心场景。 - 深入理解客户业务痛点,提供从需求分析、技术选型到方案落地的全流程支持,确保大模型技术与金融业务深度融合。 2. 大模型全生命周期技术赋能 - 主导客户侧大模型后训练(Post-training)、领域微调(Domain-specific Fine-tuning)、模型蒸馏(Distillation)及多模态融合优化,提升模型在金融垂直场景的精度及性能。 - 优化大模型训练与推理性能,包括分布式训练加速(如DeepSpeed、Megatron-LM)、显存优化、量化压缩(INT8/FP16)及低延迟推理部署(如vLLM、SGLang)等。 3. 工程化落地与性能调优 - 解决金融场景高并发、高稳定性需求,设计高性能计算架构,优化模型在GPU/TPU集群的训练效率及端到端推理链路。 - 结合金融行业数据隐私与安全要求,设计符合监管的模型部署方案。 4. 客户技术赋能与生态共建 - 面向客户技术团队提供大模型技术培训、实战工作坊及POC验证,推动AI能力在客户内部的规模化应用。 - 沉淀金融行业大模型最佳实践,输出白皮书、案例研究及标准化解决方案,提升阿里云在金融AI领域的市场影响力。

更新于 2025-09-15
logo of antgroup
校招蚂蚁星计划 -

我们是谁 我们是蚂蚁国际风控团队——既是深耕全球支付安全领域二十年的行业领航者,更是由新生代科技精英组成的创新突击队。以中国智慧筑基,以全球视野拓疆,我们正用智能风控技术来重构行业新生态,为全球200+国家地区的跨境支付和金融服务提供以AI为新底座的风控核心能力。我们的荣誉: 1.iDASH国际隐私计算竞赛冠军 2.新加坡金融峰会大奖AI TOP4 3.乌镇互联网大会精品案例 4.在AAAI、KKD、SIGIR、EMNLP、WWW、ACM等顶会均有论文发表 为何选择我们: 1.核心业务:蚂蚁国际在近年不断开拓的新战场,在欧洲、东南亚、中东、美洲等全球布局并在几乎所有业务域实现了高速增长。作为支付和金融服务的核心能力,蚂蚁的风控能力和AI智能化水平在国内海外都是行业标杆的存在。加入我们,加入职场发展的快车道。 2. 技术空间:跨境支付和金融服务的风控问题涉及复杂的业务形态和行业知识,如何通过AI革命性地改变现有模式是实现普惠服务的关键。我们聚焦于探索和落地大模型和智能体的落地实践,挑战具有全球行业影响力的技术难题,培育面向未来的核心竞争力。 3.国际化机遇:全球范围的AI行业顶尖专家带你成长的同时让你有更多看世界的机会。你可以与全球精英一起共事,团队25%的海外员工;蚂蚁国际在全球20多个国家有办公室,并有充分高回报的海外外派机会。 我们的研究方向: 1.大模型强化学习后训练及复杂推理前沿探索 2.多智能体与复杂任务自主规划能力探索 3.多模态大模型推理决策 4.图像AIGC深度伪造检测 大模型创新应用团队是蚂蚁国际风控的创新前沿,由多个经验丰富的算法工程师组成的精英团队,致力于大模型的创新及其在风控场景的应用。我们希望打造风控推理大模型,并在风控调查,风险定性决策中进行深度探索。这需要建设风控领域行业推理大模型、基于Multi-Agent和强化学习的智能风控决策系统, 分析无代码化AI助手等方面的算法深度攻坚,基于大模型的人工智能体解决实际业务痛点。勇于探索及突破前沿大模型能力边界。 职位描述: 1. 负责大模型技术前沿技术跟踪、创新和落地; 2. 设计并构建风控领域最有效的知识体系、知识图谱等任务,实现风控及相关行业知识的高效注入; 3. 探索并设计风控调查场景下,最优奖励学习和强化学习策略,并协助团队完成风控推理大模型建设; 4. 设计并有效进行多智能体的能力突破,提升多智能体在复杂场景的自主规划能力,高效完成风控调查所需的信息采集和对客交互。

logo of meituan
校招核心本地商业-基

数据与训练方向: 1.大模型数据体系建设:构建多语言和多模态的数据处理流程和实验链路,优化数据的筛选与配比策略,探索动态数据调整、多阶段训练和课程学习等方法提升数据质量和多样性,优化大模型的训练效果。 2.合成数据探索:探索大规模合成数据方法,应用于复杂任务、推理、代码和多模态等场景。制定合成数据在预训练、强化学习等不同训练阶段的应用策略,并深入研究数据扩展规模定律、数据多样性和模型坍塌等基础问题,推动数据驱动的性能突破。 3.多模态学习与推理:探索多模态预训练的新范式,突破模态融合瓶颈。具体包括实现多模态能力的早期融合、理解与生成的统一建模,研究多模态扩展定律以指导数据与训练方案,扩展超长上下文机制以支持全模态场景等。同时,面向复杂的多模态推理与交互场景,探索多模态强化学习、多模态奖励模型、推理阶段扩展(test-time scaling)以及全模态链式思维(CoT)等方法,提升模型处理复杂任务和全模态交互的能力。 4.高效模型架构设计:设计高效的大模型架构以提升训练和推理效率。探索 MoE(混合专家)、稀疏注意力、线性注意力等高效模型结构,以及模型编辑与合并等技术,研发能够显著提升推理速度和资源利用率的新型模型架构。 5.推理效率与性能优化:推动算法与系统的协同优化,实现模型性能与效率的最大化平衡。基于对硬件计算潜力的深度挖掘,开发高效的模型推理方案和算法,包括模型压缩、剪枝、量化、稀疏化等,降低模型应用部署成本。 后训练方向: 1.后训练数据与流程建设,从指令数据生产、合成、进化、配比等方面提升数据质量,优化指令微调、强化学习、奖励模型等训练pipeline,提升模型综合能力; 2.后训练关键能力建设,包括但不限于优化模型创意生成、多语言、逻辑推理、复杂指令遵循、代码生成、工具调用等能力,提升模型可控性和安全性,拓展模型能力边界; 3.面向准确性、多模信息、最优路径等方向,探索奖励模型的新范式,构建统一模型学习环境,实现模型的价值对齐和能力对齐; 4.面向推理规划能力、多智能体系统、模型自进化等方向,探索下一代强化学习算法,持续提升大模型的智能水平和在真实复杂场景效果; 5.前沿探索:动态推理计算优化(Test-time Compute Optimization)、多智能体协同进化架构 、大规模强化学习系统优化等。

更新于 2025-05-23
logo of kuaishou
社招D4910

1、主导多模态大模型的后训练全流程优化,包括指令微调(SFT)、强化学习(RLHF/DPO/PPO)、模型蒸馏等技术的研发与工程实现,持续提升模型在通用领域及垂直领域(如短视频理解、电商理解)的泛化能力和安全性; 2、参与多模态合成数据生成(覆盖纯文本、图文及视频等内容理解维度)、建立数据质量评估体系,设计数据蒸馏流程,推动​​数据-模型-评测​​迭代优化; 3、面向短视频社区、电商内容理解等场景,解决后训练阶段的核心挑战,​​如​​跨模态对齐一致性、长上下文推理、多任务指令冲突优化以及多模态智能推理探索等;推动技术成果转化,主导模型在快手短视频社区的集成落地(例如RAG增强系统、多模态Agent任务规划),并通过API封装与服务化支撑业务创新; 4、跟踪前沿多模态大模型后训练技术的前沿演进,探索SFT自动化迭代、轻量化RLHF以及reward model一体化等创新技术方向,形成专利或顶会论文提升团队技术影响力。

更新于 2025-08-05