logo of bytedance

字节跳动机器学习研发工程师-搜索架构

社招全职A171872A地点:北京状态:招聘

任职要求


1、掌握扎实的计算机基础知识,深入理解数据结构算法和操作系统知识;
2、有强烈的求知欲,快速学习和沟通能力;
3、编程能力扎实,有良好的编程习惯。

加分项:
1、熟悉主流的深度学习框架(PytorchTensorflow);
2、熟悉主流高性能并行编程技术,有GPU编程经验(CUDA或Triton);
3、熟悉vLLM,TRT-LLM大模型推理框架,熟悉大模型并发推理原理;
4、熟悉FSDP、DeepSpeedMegatron等业界主流分布框架的使用和原理。

工作职责


1、参与抖音&国际化短视频搜索场景下机器学习和深度学习架构的设计与实现;
2、关注文本相关性模型、多模态、Wide&Deep模型、LLM模型等深度学习模型在搜索场景中的性能和成本优化;
3、提高模型训练效率,加速推理性能,优化GPU吞吐;
4、设计和开发高性能算子库,研究最新的GPU计算技术和优化方法,充分利用GPU并行计算能力,支持各种模型在不同硬件上的构建和部署。
包括英文材料
数据结构+
算法+
编程规范+
深度学习+
PyTorch+
TensorFlow+
CUDA+
大模型+
vLLM+
DeepSpeed+
Megatron+
相关职位

logo of bytedance
社招A166830

1、参与抖音&国际化短视频搜索场景下机器学习和深度学习架构的设计与实现; 2、关注文本相关性模型、多模态、Wide&Deep模型、LLM模型等深度学习模型在搜索场景中的性能和成本优化; 3、提高模型训练效率,加速推理性能,优化GPU吞吐; 4、设计和开发高性能算子库,研究最新的GPU计算技术和优化方法,充分利用GPU并行计算能力,支持各种模型在不同硬件上的构建和部署。

更新于 2024-10-11
logo of baidu
社招TPG

-负责搜索服务架构建设,支持企业内部各类搜索系统的架构研发工作; -负责服务治理与重构、云原生架构改造、搜索性能优化,保证搜索系统的可扩展性与可持续发展; -负责智能化语义检索,机器学习与大模型技术在搜索场景的应用落地,提升搜索的智能化水平; -支持用户体验、内容生态的革新;

更新于 2025-06-12
logo of bytedance
社招E0055

1、负责行业AI搜索能力构建、包括但不限于游戏、电商、商业咨询、视频、图片、文章等, 为用户提供智能、准确、丰富的搜索体验; 2、从万~千亿不同规模的搜索场景, 应用LLM技术以及其他NLP和多模态机器学习技术, 构建AI检索产品,包括但不限于RAG、 语义检索、图搜、音视频搜索等; 3、搜索全栈(Query分析、相关性、召回、粗排、精排、混排)建设,包括相关性计算、CTR预估、CVR预估、向量召回、价值混排等; 4、AI检索能力构建,探索最前沿的NLP技术和多模态技术,从基础的分词、NER、OCR到应用上的Query分析、基础相关性等,全链路应用深度学习模型; 5、与团队成员紧密合作,将研究成果转化为实际应用,推动产品的创新和升级。

更新于 2023-02-21
logo of bytedance
社招A251060

团队介绍:负责抖音、今日头条等产品的搜索算法创新和架构研发工作。我们使用前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,以及应用RAG技术,使得AI对数亿抖音用户的潜在价值得以实现。充分给同学们提供成长自我的机会。 1、探索前沿的检索技术:横跨视频、直播、图文、团购等众多体裁,从基础的NLP技术,到基于多模态理解、用户行为理解、EMBED DING相似性等的召回; 2、探索大规模的排序技术:在原有BERT、大规模稀疏模型的基础上,探索和落地超大规模自回归模型SCALING LAW; 3、探索超大规模的AI搜索RAG引擎:充分挖掘抖音海量流量的潜在价值,建设超大规模、多AGENT协同的AI搜整体架构,满足潜在的用户价值; 4、大规模流式机器学习技术:超高吞吐实时数据流,流式大规模机器学习,让更个性化的搜索更加懂你; 5、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新。 1、为字节跳动搜索业务定制分布式系统底座,支撑抖音、今日头条、番茄小说等产品搜索业务的快速构建与持续发展; 2、参与搜索新一代分布式检索系统、特征存储系统的开发和维护,持续优化性能、成本、稳定性,加强其扩展定制能力。

更新于 2025-02-24