沐瞳【27届】算法研究员实习生
任职要求
1.计算机科学、人工智能等相关专业硕士及以上学历优先,并发表至少一篇论文,包括但不限于 ACL、EMNLP、CVPR、ICCV、ICML、ICLR等会议论文; 2.熟悉大语言模型、多模态技术、强化学习、智能体( Agent)等AI技术,并熟悉Qwen等LLM/VLM模型架构细节,并具备扎实的算法基础; 3.熟悉扩散模型、Flow matching、图像/视频的 DiT 架构、RAG、SFT/RLHF等相关的…
工作职责
1.负责AIGC多模态大模型相关的算法模块的研发、架构设计、模型后训练、数据构建和效果评估等工作,包括各模态tokenizer设计,数据合成策略,以及跨模态融合后训练策略等,参与实现游戏领域定制化的文生图像/视频、图像/视频理解和编辑等多模态大模型的技术落地; 2.参与文本、代码、图像、视频等多模态内容的生成与理解相关算法研发与优化,熟悉包括RAG技术栈和Code理解/生成技术栈等,并支撑相应算法高效落地到游戏的各管线及工作流中; 3.进行大模型reasoning能力的相关算法探索,研究SFT/GRPO/self-play等技术,提高模型在游戏引擎代码库等场景涉及的推理任务上的表现,参与落地游戏领域具有业务问题解決能力的agent; 4.跟进大模型、多模态、强化学习、智能体的前沿算法技术研究,支持强化学习在游戏 bot 中的算法落地应用,把握AIGC生成技术的最新前沿技术发展趋势。
ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:AI数据与安全团队为Seed基座模型及AI原生应用提供跨模态数据服务,覆盖数据生产全流程,包含模型评估标准的制定、数据规模化生产、数据飞轮搭建,不断提升数据质量,支持模型快速迭代。 团队由产品经理、数据工程、数据运营等跨职能人才组成,并通过与Seed研究员、行业专家、全球顶尖数据供应商紧密合作,从真实场景中收集反馈并分析模型表现数据,解决AI前沿突破过程中的复杂数据问题,推动模型性能与用户体验的双重提升。我们既是帮助模型技术迭代的一线贡献者,也是模型和AI产品的一手用户。 1、深入理解AI大模型视频通话场景,负责多模态对话、联网、Function Call等方向的数据采集、标注、质检与策略运营工作; 2、与产品研发团队紧密配合,快速沉淀多模态大模型数据理想态和标准,积极为模型后训提供数据策略和建议; 3、针对模型突出问题进行专项攻坚,通过设计PE策略、Workflow工作流等,探索更高效的数据生产方式。
ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:AI数据与安全团队为Seed基座模型及AI原生应用提供跨模态数据服务,覆盖数据生产全流程,包含模型评估标准的制定、数据规模化生产、数据飞轮搭建,不断提升数据质量,支持模型快速迭代。 团队由产品经理、数据工程、数据运营等跨职能人才组成,并通过与Seed研究员、行业专家、全球顶尖数据供应商紧密合作,从真实场景中收集反馈并分析模型表现数据,解决AI前沿突破过程中的复杂数据问题,推动模型性能与用户体验的双重提升。我们既是帮助模型技术迭代的一线贡献者,也是模型和AI产品的一手用户。 1、负责大模型自动化评测研发工作,将各类评测集在内部平台集成开发,助力模型在各垂类方向的能力提升; 2、负责训练数据的有效性验证工作,通过模型训练、构建Agent等方式,判别有效训练数据,助力模型能力提升; 3、调研公开文献、公开评测集、训练方法,参与自建评测集等探索类工作,优秀成果可以支持学术论文发表; 4、探索智能、高效的模型评估和训练方案,主导开发相关工具。
1、负责公司内部工作台中后台系统和H5的前端研发工作,包括需求分析、设计、编码和维护; 2、参与前端技术选型和技术方案制定,推动团队技术革新和进步; 3、与团队成员紧密协作,按时高质量完成项目开发任务; 4、关注用户体验,持续优化产品交互和性能; 5、负责相关技术文档的编写和维护。