字节跳动AI系统研发工程师-火山引擎
任职要求
1、计算机科学、人工智能等相关专业硕士研究生及以上学历,5年以上AI算法开发经验,3年以上智能座舱领域经验; 2、掌握多模态/语言大模型底层原理,包括模型结构差异、位置编码及并行训练算法; 3、熟悉深度学习框架(TensorFlow/PyTorch),熟悉大模型训练与优化技术(LoRA、P-Tuning、分布式训练); 4、主导过智能座舱大模型落地项目,涵盖算法设计、数据构建及工程化部署全流程; 5、有语音交互、计算机视觉或个性化推荐系统开发经验,熟悉车载场景数据特点与隐私保护要求; 6、较强的问题解决能力与技术文档撰写能力,能够独立分析并优化复杂算法流程。
工作职责
1、深入分析用户需求与使用场景,设计自然流畅的交互逻辑,如多轮对话、情感识别及场景化服务; 2、参与并负责智能座舱多模态大模型的算法设计与选型,涵盖语音交互、视觉感知、个性化推荐等场景; 3、构建座舱领域专用数据集,设计数据增强与清洗策略,支撑模型训练与迭代; 4、优化RAG技术体系,包括向量检索、ES检索及图数据库检索方案,提升语义理解与知识融合能力; 5、设计、开发基于大模型的各类智能体,提高领域内的准确性和性能,并参与群体协作、联动; 6、了解并关注模型在云侧及端侧的工程化部署技术,优化模型结构,确保低延迟与高稳定性,跟踪行业动态、技术趋势,提出突破性技术方案并推动POC验证。
1、深入分析用户需求与使用场景,设计自然流畅的交互逻辑,如多轮对话、情感识别及场景化服务; 2、以Golang/Rust为核心技术栈,设计大模型服务架构,涵盖感知规划调度等模块,支持高并发、低延迟的车载交互场景; 3、开发高性能API服务,支持多端单/双向通信调用,支撑富文本、音视频等载体信息下发;优化对应的Trace观测系统; 4、深度参与客户需求分析,通过场景化用例拆解,转化业务需求为服务端技术方案,实现用户数据隐私保护机制; 5、设计端云协同架构,实现端侧轻量化推理与云端复杂计算的协同,降低车载硬件资源消耗,针对车载场景网络特点,优化服务端通信协议。
1、负责火山引擎-方舟大模型平台的Agent技术研发,包括Multi-Agent框架、Memory机制等基础能力建设; 2、开发UI-Agent、DeepResearch Agent等专业领域Agent,提升大模型在特定场景的应用能力; 3、设计并实现易用高效的Agent开发套件,降低开发者使用Agent技术的门槛; 4、探索Agent方向的创新方法与技术,提出更先进的Agent范式,引领行业技术发展; 5、探索面向Agent的评估方法,构建火山方舟Agent评估体系。
1、负责AI ToB语音产品落地应用的服务架构研发,快速搭建AI语音相关平台应用、后端服务链路,持续优化产品体验、稳定性; 2、将基于前沿深度学习、大模型相关的语音、对话、LLM技术框架落地应用到实际业务中; 3、持续探索在各种场景下,利用AI语音能力增强产品体验,提升工程效率; 4、为火山引擎相关产品提供AI语音、对话技术服务,用AI技术影响数亿用户。
团队介绍:Data AML是字节跳动公司的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。此外,AML还在AI for Science,科学计算等领域做一些前沿研究。 课题介绍:大规模推荐系统正在越来越多的应用到短视频、文本社区、图像等产品上,模态信息在推荐系统中的作用也越来越大。 字节实践中发现模态信息能够很好的作为泛化特征支持推荐等业务场景,端到端的超大规模多模态推荐系统的研究具有非常大的想象空间。 期望在算法和工程CoDesign基础上,对多模态Cotrain、7B/13B大规模参数模型、更长序列端到端等方向进一步进行探索。 工程上研究方向包括多模态样本的表征、基于 pytorch 框架的高性能多模态推理引擎、高性能多模态训练框架的构建、异构硬件在多模态推荐系统上的应用;算法上的研究方向包括设计合理的推荐广告和多模态Cotrain结构、Sparse MOE、Memory Network、混合精度等。 1、负责公司机器学习系统架构的设计开发,以及系统性能调优; 2、负责解决系统高并发、高可靠性、高可扩展性等技术难关; 3、覆盖机器学习系统多个子方向领域的工作,包括:资源调度、任务编排、模型训练、模型推理、模型管理、数据集管理、工作流编排、ML for System等; 4、负责机器学习系统前瞻技术的调研和引入,比如:最新硬件架构、异构计算系统、GPU优化技术的引入落地; 5、研究基于机器学习方法,实现对集群/服务资源使用情况的分析和优化。