字节跳动研究科学家-基础设施系统实验室(北京/杭州)
任职要求
1、计算机科学、应用数学、电子工程或相关方向博士学位; 2、在顶级会议(如SIGMOD、VLDB、SIGIR、NeurIPS、ICML等)有向量检索、索引结构、信息检索或机器学习相关的论文发表记录; 3、深入理解 ANN 算法、量化技术、图索引与分区索引等核心技术; 4、具备系统级性能分析能力,能够从CPU、内存、存储等多层次对系统进行性能剖析与优化; 5、熟练使用C++或Python,具备索引类算法的实际实现与调试经验。 加分项: 1、有向量数据库或检索系统的实际构建经验; 2、熟悉FAISS、ScaNN、HNSWLib、DiskANN等主流框架; 3、理解分布式系统架构,或具备GPU加速检索的实战经验; 4、有混合检索(稠密+稀疏)、多模态检索或LLM检索相关经验者优先; 5、对将研究成果落地于生产系统充满热情。
工作职责
1、研究并开发近似最近邻(ANN)搜索算法,重点关注过滤检索、混合检索或基于磁盘的索引方案; 2、优化现有算法,在可扩展性、延迟、内存占用和过滤支持方面持续提升; 3、与工程团队紧密合作,完成算法原型、性能评估与生产系统集成; 4、参与或撰写学术论文、开源项目或内部技术文档; 5、跟踪向量检索、RAG、LLM 系统等前沿研究进展。
项目规划与执行:参与大规模深度学习模型预训练项目的规划和执行,制定实验计划,与研究团队协作制定技术路线图,设定研究里程碑并跟踪进展。 风险管理:识别可能影响模型训练的潜在风险和技术问题,制定并实施相应的解决方案。 流程优化:识别优化大规模模型训练流程的机会,参与开发可重复的实验流程和自动化训练管道。 跨团队协作:与AI研究科学家、机器学习工程师和计算基础设施团队协作,确保研究目标和技术路线的一致性。 计算资源协调:协助管理GPU集群、分布式计算资源、大规模数据集和代码仓库的访问与使用。 进展汇报:定期向研究负责人汇报项目进展,突出关键实验结果、技术挑战和解决方案。 技术文档:维护清晰的实验文档、技术规范和项目状态记录。 项目评估:参与评估研究项目的技术可行性,为项目调整提供技术建议。 知识分享:主动与团队成员分享前沿技术、实验经验和最佳实践。
1-在京东拥有极其多样的业务及技术场景,我们在电商、物流、金融、云计算、大数据等诸多方面均有多年的耕耘与实践;在这里你可以参与广告/推荐/搜索、信息安全、风控等诸多领域的工作和研究; 2.负责机器学习基础设施的搭建、系统优化、部署与维护等;与机器学习算法工程师紧密协作,为算法模型的优化、部署和维护提供工程技术支持; 3-与京东的技术团队及科学家们一同参与AI算法的前沿研究,助力业务提升效率,实现京东技术愿景和战略。
-我们正在寻找一名机器学习高级工程师-AI推理方向。理想的候选人需要拥有深厚的ML推理知识和强烈的热情来 优化我们的模型,以最高效的利用我们的AI加速器的每一个FLOP和每一个字节的内存。 -我们的使命是解决自动驾驶难题。您将与才华横溢的软件工程师、机器学习工程师和研究科学家团队合作,推动最先进的自动驾驶人工智能。 1、为深度学习模型在小鹏定制的AI加速器上的部署做优化。 2、为小鹏的AI加速器编开发内核。 3、为关键内核的性能估计建立数学模型。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok AI创新中心,是致力于AI基础设施建设和创新研究的部门,探索行业领先的人工智能技术,包括大语言模型,多模态大模型等研究方向。我们希望研发能够处理多语言和海量视频内容理解的模型算法,为用户带来更好的内容消费体验。在Code AI方向,我们利用大语言模型强大的代码理解与推理能力,提升程序性能与研发效率。 1、与研究科学家密切合作,开发先进的RLHF(人类反馈强化学习)算法,并将其应用于多模态大模型和视频理解任务; 2、参与尖端RLHF技术的研究; 3、构建高质量偏好数据训练多模态大语言模型,提升模型基础能力。