字节跳动研究科学家-基础设施系统实验室(北京/杭州)
任职要求
1、计算机科学、应用数学、电子工程或相关方向博士学位; 2、在顶级会议(如SIGMOD、VLDB、SIGIR、NeurIPS、ICML等)有向量检索、索引结构、信息检索或机器学习相关的论文发表记录; 3、深入理解 ANN 算法、量化技术、图索引与分区索引等核心技术; 4、具备系统级性能分析能力,能够从CPU、内存、存储等多层次对系统进行性能剖析与优化; 5、熟练…
工作职责
1、研究并开发近似最近邻(ANN)搜索算法,重点关注过滤检索、混合检索或基于磁盘的索引方案; 2、优化现有算法,在可扩展性、延迟、内存占用和过滤支持方面持续提升; 3、与工程团队紧密合作,完成算法原型、性能评估与生产系统集成; 4、参与或撰写学术论文、开源项目或内部技术文档; 5、跟踪向量检索、RAG、LLM 系统等前沿研究进展。
项目规划与执行:参与大规模深度学习模型预训练项目的规划和执行,制定实验计划,与研究团队协作制定技术路线图,设定研究里程碑并跟踪进展。 风险管理:识别可能影响模型训练的潜在风险和技术问题,制定并实施相应的解决方案。 流程优化:识别优化大规模模型训练流程的机会,参与开发可重复的实验流程和自动化训练管道。 跨团队协作:与AI研究科学家、机器学习工程师和计算基础设施团队协作,确保研究目标和技术路线的一致性。 计算资源协调:协助管理GPU集群、分布式计算资源、大规模数据集和代码仓库的访问与使用。 进展汇报:定期向研究负责人汇报项目进展,突出关键实验结果、技术挑战和解决方案。 技术文档:维护清晰的实验文档、技术规范和项目状态记录。 项目评估:参与评估研究项目的技术可行性,为项目调整提供技术建议。 知识分享:主动与团队成员分享前沿技术、实验经验和最佳实践。
项目规划与执行:参与大规模深度学习模型预训练项目的规划和执行,制定实验计划,与研究团队协作制定技术路线图,设定研究里程碑并跟踪进展。 风险管理:识别可能影响模型训练的潜在风险和技术问题,制定并实施相应的解决方案。 流程优化:识别优化大规模模型训练流程的机会,参与开发可重复的实验流程和自动化训练管道。 跨团队协作:与AI研究科学家、机器学习工程师和计算基础设施团队协作,确保研究目标和技术路线的一致性。 计算资源协调:协助管理GPU集群、分布式计算资源、大规模数据集和代码仓库的访问与使用。
ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok AI创新中心,是致力于AI基础设施建设和创新研究的部门,探索行业领先的人工智能技术,致力于突破多模态大模型与代码大模型的技术边界。我们正在构建下一代AI系统,这些系统能够无缝理解与整合多语言文本、海量视频内容及复杂代码结构,打造真正跨模态的统一智能架构。我们的研究不仅关注模型的理解能力,更探索其在复杂推理任务中的应用潜力,将代码作为连接各类智能任务的通用语言。团队旨在通过创新算法设计,为用户提供前所未有的内容体验与创作辅助,同时显著提升开发效率与系统性能。 1、与研究科学家密切合作,开发先进的RLHF(人类反馈强化学习)算法,并将其应用于多模态大模型和视频理解任务; 2、参与尖端RLHF技术的研究; 3、构建高质量偏好数据训练多模态大语言模型,提升模型基础能力。