字节跳动Code大模型算法工程师/研究员-豆包大模型
任职要求
1、本科及以上学历,计算机、物理、数学、神经科学或相关专业; 2、具备扎实的计算机科学功底和编程能力,熟悉常见算法和数据结构,具有良好的编程习惯; 3、熟悉语言模型的基本技术、模型结构,对AI的未来有信仰和工作热情; 4、工作认真细致,计划性强,具有刨根问底的探究精神,对研发工作中有很强的实事求是的落地信念,追…
工作职责
团队介绍:字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的 AI 大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。 豆包大模型团队在AI领域拥有长期愿景与决心,研究方向涵盖NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。目前,豆包APP已成为中国市场用户量最大的AIGC应用。 1、负责代码预训练数据的合成、清洗、权重分配、来源扩充等一系列工作,持续提高代码预训练、中程训练等阶段的数据质量;负责探究预训练小领域数据的配比和最终效果之间的关系;开发数据合成链路,解决代码模型中的关键问题; 2、负责探究深度推理技术,探究Test-time Compute和模型效果的Scaling laws,参与后训练奖励模型、强化学习算法的一系列优化流程,探究线上代码补全数据到RL过程的数据飞轮; 3、专注于代码强化学习中的奖励模型(Reward Model)的优化和创新;包括和SFT阶段配合解决判别能力较差的场景、探究合成数据进行代码奖励模型的预训练、组织标注人员进行代码奖励模型的标注、Critic的前沿探究、强化学习过程中的可执行代码与单元测试的质量过滤和扩充。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok AI创新中心,是致力于AI基础设施建设和创新研究的部门,探索行业领先的人工智能技术,包括大语言模型,多模态大模型等研究方向。我们希望研发能够处理多语言和海量视频内容理解的模型算法,为用户带来更好的内容消费体验。在Code AI方向,我们利用大语言模型强大的代码理解与推理能力,提升程序性能与研发效率。 1、与算法研究员紧密合作,定义高质量的数据集评价标准; 2、阅读相关领域最新研究论文或报告,寻找高效科学的方法获取及构建高质量数据; 3、与工程师密切配合,搭建高效的数据采集、获取与生产管线; 4、设计训练数据标注所需的流程、规则与画像,对项目的质量和进度负责。

这是一个面向AI时代、极具技术挑战性的岗位。 您将深度探索通过AI从千亿金融数据切片中洞察投资者情绪和盘面状态,针对国际国内重大热点事件追踪对人工智能、新能源、半导体、新材料、生物医药等关键产业链上下游方向金融标的影响,推动AI从辅助工具向投资决策伙伴演进,引领全球金融行业智能变革! 一、岗位职责 1. 市场情绪量化智能辅助交易决策——将市场情绪转化为可量化的决策信号 - 开发AI驱动的多维度市场情绪指标体系,从全球社交媒体、多语言新闻资讯、跨市场交易数据中提取投资者情绪特征 - 构建情绪-市场行情的因果关联模型,挖掘情绪变化与股价波动、资金流向的深层关系 - 打造实时情绪监测预警系统,捕捉市场拐点与异常波动 - 将情绪量化指标融入投资决策框架,为全球投资者提供前瞻性的交易信号与风险预警 - 基于历史数据进行策略回测与优化,持续提升预测准确性 2. 重大事件驱动的产业链投资机会挖掘——从事件到投资策略的全链路智能化 - 基于知识图谱构建全球产业链关系网络,覆盖全球企业、供应链依赖、竞争格局等多维度关联 - 开发重大事件智能识别与影响传导分析系统,自动追踪全球政策变化、技术突破、地缘事件对产业链的冲击路径 - 构建事件驱动的投资策略回测引擎,量化评估历史事件对不同市场、行业、个股的影响程度 - 利用大模型进行事件深度解读,自动生成产业链影响分析报告与投资策略建议 - 打造"事件监测→产业链挖掘→影响量化→策略生成→回测验证"的完整智能投研闭环 3. 构建Multi-Agent驱动的多模态智能内容创作系统 Multi-Agent协同与Deep Search深度创作 - 构建多智能体协作框架,通过Deep Search进行深度信息检索与知识整合 - 实现高质量金融内容的自动化创作,从数据挖掘到观点生成的全链路智能化 多模态内容理解与生成 - 融合文本、图表、视频等多模态数据,开发跨模态内容理解与创作能力 - 结合AI可视化技术,将复杂金融数据转化为直观的可视化内容,构建"理解-分析-可视化"的深度内容生产链路 4. 引领金融AI技术前沿探索 持续跟踪Multi-Agent、Deepsearch、多模态学习、知识图谱、情绪计算、因果推断等领域最新研究成果,评估前沿技术在全球金融投研与内容创作场景的应用价值。与团队协作将创新技术转化为产品能力,推动同花顺在国际金融智能领域的技术突破。
蚂蚁集团技术研究院致力于做有用、有想象力的科研,负责探索下一代前沿科技,帮助蚂蚁构建更具竞争力和可持续性的技术生态。 蚂蚁技术研究院数据智能实验室专注于通过下一代数据创新深化AGI前沿,这里汇聚了一群对人工智能充满热情的极客、科学家和工程师,核心成员累计学术引用量过万。 实验室拥有顶级资源支持包括但不限于海量高质量训练数据(万亿级Token,覆盖多领域、多模态);超大规模算力(万卡级GPU集群,支持分布式训练与高效调优);与全球顶尖AI团队(如DeepMind、OpenAI等)的深度合作机会等。 你将参与: - 下一代AGI大模型研发 a. 探索更高效的训练架构 b. 突破现有模型的推理与泛化能力 c. 研究多模态、因果推理、强化学习等前沿方向 - 构建新数据范式 a. math/code数据饱和后的后训练时代数据 b. 合成数据,突破全球可用数据上限 c. 多模态数据,构建空间数据与跨模态任务的核心引擎 - 技术创新与开源 a. 撰写高质量技术论文,推动学术边界 b. 构建开源工具链,降低AGI研发门槛 c. 与全球开发者社区互动,分享你的成果
蚂蚁集团技术研究院致力于做有用、有想象力的科研,负责探索下一代前沿科技,帮助蚂蚁构建更具竞争力和可持续性的技术生态。 蚂蚁技术研究院数据智能实验室专注于通过下一代数据创新深化AGI前沿,这里汇聚了一群对人工智能充满热情的极客、科学家和工程师,核心成员累计学术引用量过万。 实验室拥有顶级资源支持包括但不限于海量高质量训练数据(万亿级Token,覆盖多领域、多模态);超大规模算力(万卡级GPU集群,支持分布式训练与高效调优);与全球顶尖AI团队(如DeepMind、OpenAI等)的深度合作机会等。 你将参与: - 下一代AGI大模型研发 a. 探索更高效的训练架构 b. 突破现有模型的推理与泛化能力 c. 研究多模态、因果推理、强化学习等前沿方向 - 构建新数据范式 a. math/code数据饱和后的后训练时代数据 b. 合成数据,突破全球可用数据上限 c. 多模态数据,构建空间数据与跨模态任务的核心引擎 - 技术创新与开源 a. 撰写高质量技术论文,推动学术边界 b. 构建开源工具链,降低AGI研发门槛 c. 与全球开发者社区互动,分享你的成果