logo of xiaohongshu

小红书【Ace顶尖实习生】大模型在研发效能和代码域的智能化生成和Agent探索

实习兼职测试开发地点:北京 | 上海 | 杭州状态:招聘

任职要求


1、不限年级,本科及以上在读,人工智能/计算机/软件工程等相关专业优先;
2、具备优秀的代码能力、数据结构和基础算法功底,熟练掌握C/C++、Python等一个或多个编程语言;
3、熟悉大模型相关的算法和技术,有自然语言处理、大模型训练、强化学习算法
登录查看完整任职要求
微信扫码,1秒登录

工作职责


大模型如 GPT 系列等,凭借其强大的语言理解和生成能力,为编程带来了新的变革。在大模型编程的实际应用里,涌现出诸多极具价值的落地场景,像代码问题的精准发现与高质量修复、代码的智能补全与生成等,这些场景切实提高了编程工作的效率与质量。

当前也普遍面临一系列亟待解决的问题与挑战:
1、怎样精准识别代码中潜藏的高质量问题,并迅速且有效地完成修复;
2、如何借助 RAG 技术等手段,精准召回相似的代码问题;
3、怎样构建更完善的评测体系,对整个编程系统以及各个应用场景进行全面且高质量的评估。
这些问题在行业内具有广泛的共性,极具研究价值。通过合作研究探寻解决方案,有望推动大模型编程领域迈向新的高度。
包括英文材料
数据结构+
算法+
C+
C+++
还有更多 •••
相关职位

logo of xiaohongshu
实习大模型

本课题的研究目标是研发面向复杂场景的可拓展大规模强化学习系统。 包括不限于: 1、超大规模Reward System构建; 2、面向复杂场景构建“策略与反馈一体化”的递归自我增强方法,解决“AI超越人类”时的可拓展监督问题; 3、面向长程任务探索人机合作博弈的强化学习机制,实现模型在超长程复杂任务上的需求明确、自我规划与执行校验能力;让AI从被动完成指令的工具转变为主动推动任务进展的的协作者,实现目标对齐; 4、强化学习进程中的大模型可解释性、可理解性。

更新于 2025-08-22北京|上海|杭州
logo of xiaohongshu
实习大模型

本课题的研究目标是开发面向大模型的可扩展监督对齐方法,通过探索更高效的人类反馈收集与利用机制、自动化偏好学习和评估框架,以及对齐传递技术,实现在有限人类监督资源下对大规模AI系统进行有效对齐。 项目将建立产品与研究的协同设计机制,确保对齐技术能够直接响应实际产品需求,通过从产品应用场景中收集真实用户反馈来迭代优化对齐方法,形成研究与产品互促共进的闭环,提升模型在安全性、价值观一致性和指令遵循能力等方面的表现。

更新于 2025-08-22北京
logo of xiaohongshu
校招大模型

传统审核大模型通常采用SFT的方式逼近人审对审核规则的识别精度,此时人工执行质量和规则合理性则成为机审体系性能上限。 本课题通过RLVR和Multi-Agent的方式,构造机审判别Agent与规则生成Agent的博弈学习,以对抗上升的方式不断提升审核规则的完备性以及相应机审识别的准召,使得机审可以突破人工上限,实现大模型智能在审核象限的涌现和“Aha moment”。

更新于 2025-12-02北京|上海|杭州
logo of xiaohongshu
校招大模型

本课题的研究目标是研发更高效的预训练scaling效率,通过数据策略、模型结构设计(Dense, MoE, Long Context等)、初始化&优化器策略、学习范式的创新,深度理解模型的学习机制和评估方法,能够更精准的预测模型行为,并持续提升模型预训练从算力&数据到智能的转化效率。

更新于 2025-12-03北京|上海|杭州