字节跳动研究科学家-基础设施系统实验室(北京/杭州)
任职要求
1、计算机科学、应用数学、电子工程或相关方向博士学位; 2、在顶级会议(如SIGMOD、VLDB、SIGIR、NeurIPS、ICML等)有向量检索、索引结构、信息检索或机器学习相关的论文发表记录; 3、深入理解 ANN 算法、量化技术、图索引与分区索引等核心技术; 4、具备系统级性能分析能力,能够从CPU、内存、存储等多层次对系统进行性能剖析与优化; 5、熟练…
工作职责
1、研究并开发近似最近邻(ANN)搜索算法,重点关注过滤检索、混合检索或基于磁盘的索引方案; 2、优化现有算法,在可扩展性、延迟、内存占用和过滤支持方面持续提升; 3、与工程团队紧密合作,完成算法原型、性能评估与生产系统集成; 4、参与或撰写学术论文、开源项目或内部技术文档; 5、跟踪向量检索、RAG、LLM 系统等前沿研究进展。
项目规划与执行:参与大规模深度学习模型预训练项目的规划和执行,制定实验计划,与研究团队协作制定技术路线图,设定研究里程碑并跟踪进展。 风险管理:识别可能影响模型训练的潜在风险和技术问题,制定并实施相应的解决方案。 流程优化:识别优化大规模模型训练流程的机会,参与开发可重复的实验流程和自动化训练管道。 跨团队协作:与AI研究科学家、机器学习工程师和计算基础设施团队协作,确保研究目标和技术路线的一致性。 计算资源协调:协助管理GPU集群、分布式计算资源、大规模数据集和代码仓库的访问与使用。 进展汇报:定期向研究负责人汇报项目进展,突出关键实验结果、技术挑战和解决方案。 技术文档:维护清晰的实验文档、技术规范和项目状态记录。 项目评估:参与评估研究项目的技术可行性,为项目调整提供技术建议。 知识分享:主动与团队成员分享前沿技术、实验经验和最佳实践。
项目规划与执行:参与大规模深度学习模型预训练项目的规划和执行,制定实验计划,与研究团队协作制定技术路线图,设定研究里程碑并跟踪进展。 风险管理:识别可能影响模型训练的潜在风险和技术问题,制定并实施相应的解决方案。 流程优化:识别优化大规模模型训练流程的机会,参与开发可重复的实验流程和自动化训练管道。 跨团队协作:与AI研究科学家、机器学习工程师和计算基础设施团队协作,确保研究目标和技术路线的一致性。 计算资源协调:协助管理GPU集群、分布式计算资源、大规模数据集和代码仓库的访问与使用。
1-在京东拥有极其多样的业务及技术场景,我们在电商、物流、金融、云计算、大数据等诸多方面均有多年的耕耘与实践;在这里你可以参与广告/推荐/搜索、信息安全、风控等诸多领域的工作和研究; 2.负责机器学习基础设施的搭建、系统优化、部署与维护等;与机器学习算法工程师紧密协作,为算法模型的优化、部署和维护提供工程技术支持; 3-与京东的技术团队及科学家们一同参与AI算法的前沿研究,助力业务提升效率,实现京东技术愿景和战略。