字节跳动后端研发工程师-搜索
任职要求
1、出色的分析问题、解决问题能力,总是能从纷繁复杂的工程现象中一眼看出问题本质; 2、出色的工程能力、动手能力、架构设计能力,能够设计和落地大流量高并发的搜索业务系统; 3、优秀的代码能力、数据结构…
工作职责
1、负责抖音/今日头条等多个搜索产品和LLM方向的业务研发工作,追求前沿的技术做出好的搜索产品体验; 2、参与搜索&LLM工程方向多个领域的优化、改进和创造、创新工作,方向包括: (1)业务工程:高效率高标准支持搜索产品高频迭代需求,能深入理解业务,可技术自驱赋能业务增长; (2)性能&稳定性:负责搜索产品的性能优化和稳定性工作;性能上可多视角来挖掘系统的性能瓶颈,不断挑战极限;稳定性上确保搜索产品的高SLA,同时可以对全系统做好降级保障; (3)搜索工程架构:能够对庞大的搜索架构进行最优化的治理,确保整体系统的设计合理,运作顺畅,打造小而美的系统; (4)搜索&LLM平台:对搜索和LLM业务做平台化效率提升,开展方向包括LLM接入平台、LLM插件平台、搜索研发平台、LLM以及搜索效果评估等; (5)搜索离线:对千亿的文档和短视频数据集里进行数据处理,确保能够高时效送索引,并推动离线数据平台化的建设,为搜索引擎提供可靠的数据支撑; (6)搜索&LLM安全:洞察各种系统漏洞,设计高安全搜索架构,做好安全防御;深度理解合规需求,建设安全与干预平台,保护用户隐私,解决涉黄、暴力等问题。
我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 1、参与设计实现支持RLHF/DPO等对齐技术的高效训练框架,优化强化学习阶段的Rollout、Reward Model集成、多阶段训练 Pipline; 2、研发支持多机多卡 RL 的分布式训练框架,开发TP/PP/ZeRO-3与RL流程的动态协同机制,解决 RL 算法在超长时序下的显存/通信瓶刭 3、构建端到端后训练工具链,主导框架与 MLOps 平台集成,提供训练可视化、自动超参搜索等生产级能力 4、与公司各算法部门深度合作,参与大语言模型LLM、多模态大模型 MLLM等业务在 SFT/RL领域的算法探索和引擎迭代; 5、参与分析各业务 GPU 利用率与饱和度等指标,结合业务场景持续优化训练框架能力,提升框架领先性。
1、深入理解业务需求,负责软件需求到实现过程中的技术设计、编码实现等全流程需求交付工作,并参与核心业务模块、通用业务系统的开发工作; 2、参与公司国际化产品的系统架构优化,性能优化并辅助其他模块进行技术实现; 3、保持积极、负责的工作态度面对各种日常工作,对团队充满正能量、对项目充满强自驱力; 4、负责滴滴国际化消息触达平台,以及业界领先技术的调研与评估,持续保持产品的技术竞争力,解决企业出海遇到的消息触达等问题,包括短信、Email、Whatsapp、TTS、端内消息等触达通道
工作职责: 1. 负责贝壳C端的后端服务设计与开发,保障高并发场景下的系统稳定性; 2. 参与推荐引擎、模型预测、向量检索等基础系统、平台的设计、研发及调优工作,构建高并发推荐在线服务; 3. 深度参与数据工程开发,优化数据链路,构建离线特征,进行数据归因分析,协助推荐相关的用户画像的工程化建设; 4. 从业务中提取需求,抽象并优化现有系统,以提升效率并降低成本; 5. 关注性能、微服务、设计模式,提升用户体验; 6. 研究和应用新的算法技术,不断优化和改进现有的系统。