logo of xiaohongshu

小红书强化学习后端研发实习生

实习兼职大模型地点:北京状态:招聘

任职要求


1.重点院校硕士及以上学历(或特别优秀的本科生),计算机、软件工程、人工智能等相关专业优先
2.熟悉Linux开发环境,具备良好扎实的算法基础、良好的编程风格和系统设计能力
3…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.小红书大模型强化学习基础设施的开发,接入并维护强化学习工程环境,加快模型训练速度
2.进行大模型强化学习的相关研究,探索如何在开放领域任务(Code,web search,computer use)上高效的进行 RL Scaling,参与研究奖励模型和强化学习模型的泛化性,持续提升模型 Post-Train 能力
包括英文材料
学历+
Linux+
算法+
系统设计+
Go+
还有更多 •••
相关职位

logo of bytedance
社招A98852

1、支持端到端语音多模态大模型技术在字节跳动公司内外丰富的业务场景落地,解决落地过程中的前沿问题,持续优化落地效果; 2、探索前沿的多模态技术,专注语音多模态大模型的前沿技术和算法效果,追求和探索业界最前沿算法,包括但不限于语言、音乐、语音、音频的生成与理解等; 3、深入调研和关注音频/NLP/多模态等方向的前沿技术。

更新于 2025-02-17北京
logo of bytedance
社招A259606

1、支持端到端语音多模态大模型技术在字节跳动公司内外丰富的业务场景落地,解决落地过程中的前沿问题,持续优化落地效果; 2、探索前沿的多模态技术,专注语音多模态大模型的前沿技术和算法效果,追求和探索业界最前沿算法,包括但不限于语言、音乐、语音、音频的生成与理解等; 3、深入调研和关注音频/NLP/多模态等方向的前沿技术。

更新于 2025-03-28上海
logo of meituan
实习核心本地商业-业

【课题说明】 面向C端用户的医药健康AI助手项目旨在重塑用户未来的看病范式,给用户提供AI问诊、对症找药、药品问答、医疗科普等多元化核心能力,在用户诊前、诊中、诊后的关键环节提供专业的医疗决策支持,从而促进线上看病一体化链路的打通,率先形成线上便捷+专业的看病入口。 【建议研究方向】 1.医药Agent技术架构设计:针对问病、问药、科普等场景分别建设专业的子Agent能力,并优化多Agent之间的协作逻辑,满足用户灵活的多轮对话交互需求。 2.模型自动化评测:从医学专业性和用户体验维度构建多维度benchmark,并探索Agent各能力项的Auto-Eval做法,提升模型评测效率和结果可靠性。 3.模型后训练技术:探索合成数据技术方案来快速积累高质量医疗训练数据,并通过SFT、强化学习等手段持续提升模型在医学问答、病情采集、疾病诊断、药品推荐等关键任务上的表现和泛化能力。

更新于 2025-05-27北京
logo of bytedance
实习A07601A

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:智能创作团队是字节跳动创作场景业务中台,负责了抖音、剪映等产品的技术和业务研发,涵盖了计算机视觉、深度学习、高性能计算、图形学、特效引擎等技术领域,并以多种形式向公司内部各业务线提供业界前沿的内容理解、内容创作、互动体验与消费的能力和行业解决方案,同时通过火山引擎为企业客户提供服务。 1、设计和实现基于LLM的智能体架构,包括任务规划、对话管理、意图识别、流程工程等; 2、设计和实现多模态Agent,支持文本、语音、图像等多种输入/输出形式的处理; 3、推动AI Agent在架构和性能上的持续优化,提升Agent对用户理解能力和响应的准确性; 4、开发和维护智能体的后端服务,确保系统的稳定性和可扩展性; 5、跟踪并研究行业前沿AI算法,持续提升AI Agent的技术水平; 6、编写必要的技术文档,包括API接口说明、核心算法设计与代码开发。

更新于 2024-03-13北京