logo of bytedance

字节跳动大语言模型数据实习生(数理方向)-豆包大模型

实习兼职A178635地点:北京状态:招聘

任职要求


1、本科及以上学历在读,数学、物理等理科专业优先;
2、参加过全国奥林匹克竞赛且获奖者优先;
3、具备优秀的相关竞赛专业能力,能够解答中学/大学竞赛级别题目或擅长竞赛题判卷;
4、具备逻辑思维和条理性,能够清晰、准确地传达信息和想法;
5、自驱力强,对通用人工智能有着强烈的兴趣。

工作职责


日常实习:面向全体在校生,为符合岗位要求的同学提供3个月以上的项目实践机会。
团队介绍:字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的 AI 大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。
豆包大模型团队在AI领域拥有长期愿景与决心,研究方向涵盖NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。目前,豆包APP已成为中国市场用户量最大的AIGC应用。

1、负责为豆包大模型提供理科竞赛级(数学/代码/理科...)知识的数据工作,包括标准/方法的设计、数据的生产和检验;
2、评价模型效果,并调整优化竞赛问题的整体解答思路,判断解答的优缺点;
3、通过模型&人工结合的方式,设计适用于大模型的复杂逻辑推理的数据生产方法;
4、与研发工程师协作,讨论确定现状和问题,明确下一步提升模型推理等能力的方案。
包括英文材料
学历+
相关职位

logo of alibaba
实习淘天集团研究型实

1. 跟进和研发大规模语言模型(LLM)的SFT、RLHF等技术; 2. 跟进和研发大规模语言模型的数据治理与筛选、指令合成与指令跟随等技术; 3. 研发基于大模型的淘宝问问助手、ChatBot、检索增强、Code、Longchain等下游应用; 4. 结合以上方向的探索和研究,撰写发表论文,和业界、学术界保持良好的交流。

更新于 2025-05-06
logo of netease
实习网易云音乐

【职位前言】 DeepSeek-R1的发布给世界带来了不小的震撼,更令人敬佩的是,无论是赶超OpenAI o1的模型效果,还是节省百万美元成本的工程优化,这背后的原理与实现都在官方发布的技术报告和开源项目中一一公开。 大语言模型的前沿研究将不再只是少数巨头才玩得起的项目,更多的研究者可以入局这场对人工智能探索的新征程。 如果您对模型背后的工程优化充满好奇(FP8混合精度训练、分布式专家并行等),想深入了解并上手实践,但又没有合适的计算资源与明确的优化目标,又对模型 post-training(GRPO强化学习、模型蒸馏等等)跃跃欲试,但又没有明确的应用场景和数据资源—— 那不妨来网易云音乐,和我们搭上这趟时代的列车,一起拆解硬核技术,聚焦于音乐业务中的搜索、推荐、广告场景,探索大模型的应用落地与高效部署。 【职位描述】 1、参与大模型在后训练和推理工程中的性能优化,结合底层硬件特性从混合精度训练、矩阵计算加速、注意力机制计算优化、GPU分布式并行等方面提升工程效率; 2、通过强化学习、模型蒸馏等方式,构建音乐领域具有 CoT 推理能力的大语言模型,应用于搜索、推荐、广告等业务场景。 【我们拥有】 1、音乐行业内海量用户独一无二的数据资源; 2、贴近实际的业务场景,让 idea 落地并发挥价值; 3、可观的计算资源,性能上还有极大的空间待与你一同挖掘; 4、鼓励创新探索、倡导悉心钻研、宽松融洽多元的团队氛围; 5、成果转换的支持,合作完成项目及论文,助力未来的职业发展。

更新于 2025-06-17
logo of alibaba
实习淘天集团研究型实

1. 跟进多模态大模型(vLLM)预训练、SFT、RLHF等技术,调研与跟进最新进展;负责多模态相关性大模型、多模态大模型稀疏检索和稠密模型,多模态大模型个性化预训练方向,以及多模态大语言模型的训练和推理加速; 2. 多模态大模型个性化预训练:研发个性化预训练模型,探索在训练样本、模型参数量等维度上scale-up能带来的收益,研究在电商搜索场景下, CTR和CVR 模型中用户动线特征的挖掘和应用,包括用户行为模型的获取、特征设计、结构优化等个性化建模; 3. 多模态大模型的训练和推理加速:协助研究和开发多模态大语言模型的加速技术,包括但不限于量化、剪枝和蒸馏,以及数据特征和调度优化;实现和优化多模态大模型推理框架,以提高推理速度和效率;与工程团队合作,解决机器学习模型在部署过程中的性能问题; 4. 多模态大模型相关性模型:研发基于多模态大模型的相关性标注和评测大模型,应用到体验实验评测、体验监控、离线数据标注、线上相关性判断等方向; 5.多模态大模型稀疏检索和稠密模型:研究方向包括不限于:电商词表生成、多模态稀疏词表和稠密表征技术、LLMs幻觉缓解等问题。

更新于 2025-05-06
logo of bytedance
实习A69161A

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动用户增长(User Growth)负责抖音、今日头条、番茄小说、剪映等多个产品的用户增长业务,建立行业领先的增长和营销技术,打造极致的用户体验。加入我们,有机会参与亿级用户场景的开发与架构工作,也有机会从数据出发,利用策略和模型为业务带来更大的助力。 1、负责字节跳动产品的智能广告创意,为抖音、今日头条、番茄小说、西瓜视频等产品实现用户增长的目标;探索应用DiffusionModel,GPT,CV/NLP在营销场景/短视频/小说领域实现对广告文案、视频、图片等素材进行内容理解并高质量生成投放竞争力素材; 2、自动化素材生产平台的算法能力优化,拆解起量创意进行创意洞察,视频智能剪辑,内容优选,并以数据驱动的方式,优化素材投前、投中环节的效果; 3、调研业界创意、多模态及Generative AI方向最新技术,落地应用并提升广告创意理解、自动生成和优化等场景的效果。

更新于 2025-06-20