logo of xiaohongshu

小红书Hi Lab-【Ace顶尖实习生】AI 安全、评估与价值观对齐研究

实习兼职大模型地点:上海 | 北京 | 杭州状态:招聘

任职要求


1、不限年级,本科及以上在读,计算机/人工智能/软件工程等相关专业优先;
2、优秀的代码能力、数据结构和基础算法功底,熟悉Python等至少一门编程语言;
3、熟悉大模型领域相关研究工作和…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


本研究方向聚焦于构建兼具强大能力与安全保障的AI系统,确保技术发展与人类价值观保持一致。随着AI能力边界不断扩展,系统性评估其安全性与行为边界变得至关重要。

研究将开发先进的红队测试方法,通过模拟各类攻击场景揭示模型弱点;建立抵御"越狱"尝试的防御机制,使AI在面对误导性指令时维持适当行为;探索价值观对齐技术,使AI能理解并遵循复杂的社会规范与伦理准则。研发量化评估框架,客观衡量AI系统的安全性与符合预期的程度。这一方向旨在构建真正可信赖的人工智能,使其能在发挥最大潜能的同时,始终将人类福祉置于核心位置,为负责任的AI发展提供技术保障。
包括英文材料
数据结构+
算法+
Python+
还有更多 •••
相关职位

logo of xiaohongshu
实习大模型

本课题的研究目标是开发面向大模型的可扩展监督对齐方法,通过探索更高效的人类反馈收集与利用机制、自动化偏好学习和评估框架,以及对齐传递技术,实现在有限人类监督资源下对大规模AI系统进行有效对齐。 项目将建立产品与研究的协同设计机制,确保对齐技术能够直接响应实际产品需求,通过从产品应用场景中收集真实用户反馈来迭代优化对齐方法,形成研究与产品互促共进的闭环,提升模型在安全性、价值观一致性和指令遵循能力等方面的表现。

更新于 2025-08-22北京
logo of netease
实习网易有道

1. 参与有道业务的UI设计工作,为新功能、新产品提供创意及设计方案; 2. 参与产品讨论,与产品经理、工程师协作,从视觉设计和用户体验的角度提出建议与解决方案; 3. 全面跟进产研流程,与产品、研发、测试团队紧密协作,跟进设计方案落地,保证设计方案高度还原。 4. 续关注设计趋势,主动挖掘视觉/体验问题,提出改进建议,提升产品设计品质。

更新于 2025-06-18北京
logo of xiaohongshu
社招3-5年大模型

【训练推理框架研发】 大模型hi lab AI Infra团队专注于大语言模型领域的前沿技术研究和落地,提供高性能、高可靠、可扩展的机器学习系统、丰富的异构计算资源和极致的端到端的机器学习服务体验,为公司提供核心技术能力和服务。 1、负责机器学习框架的研究与开发,服务于公司各个产品; 2、高效部署,优化NLP/多模态大模型核心业务模型; 【轻量化】 机器学习系统团队需要将传统或者新型的轻量化算法和工程有机结合起来进行加速,提高大语言模型训练或者推理性能的同时,通过算法手段尽可能降低效果损失。候选人将在以下几个方向进行深入探索和落地: 1、量化方向:负责但不限于大语言模型的低精度训练(FP8)、推理(W8A8KV8等)、低精度优化器(量化梯度、优化器状态、参数等) 2、高性能模型结构:大语言模型Finetune或者其他阶段的LoRA系列(熟悉各种变种),训练阶段的MQA/GQA系列等 3、稀疏化方向:大语言模型剪枝、稀疏、蒸馏、Sparse Attention等 4、新型方向:Medusa、超长文本、Speculative Sampling等

更新于 2025-09-15北京|上海
logo of xiaohongshu
社招3-5年客户端开发

1、负责小红书基座大模型团队hi lab APP应用的客户端研发和产品迭代; 2、与产品、QA、服务端研发等团队保持良好的沟通,共同保证产品顺利推进; 3、设计良好的技术架构,与团队共同推进优化代码的健壮性、可维护性。持续不断的优化代码结构,承担重点、难点的技术攻坚。

更新于 2025-09-11北京|上海