字节跳动服务端开发工程师/专家(数据飞轮方向)-Dev Infra
任职要求
1、有较强的学习能力,有强烈的求知欲、好奇心和进取心,能及时关注和学习业界最新技术; 2、扎实的计算机基础知识,丰富后端研发经验,熟悉Golang、Python及相应框架环境和常用技术组件;…
工作职责
1、负责大模型应用开发平台的数据飞轮建设,为开发者提供一站式数据回流、加工、分析、训练、评估和部署的全流程平台能力; 2、负责构建支撑海量数据的底座能力,支撑全流程血缘、高效处理、深入洞察以及训练投递等能力,支撑全生命周期数据管理; 3、持续推动整体架构演进,结合行业支持探索数据飞轮在大模型场景下的最佳实践。
1、参与下一代客户服务 Agent的构建,负责Agent生命周期的数据飞轮建设,搭建一站式的数据处理和应用平台,高效满足策略分析、模型训练、效果评测等agent构建环节的数据应用诉求; 2、与产品、工程、算法、运营团队紧密沟通协作,深入了解agent生命周期各个环节的工作,充分挖掘数据应用痛点和诉求,抽象沉淀建设平台能力,持续推动平台的整体架构演进; 3、关注行业前沿,持续探索数据飞轮在Agent场景下的最佳实践。
负责字节跳动资源分发中台Gecko的建设,为抖音、抖音火山版、抖音极速版、西瓜视频、今日头条等业务提供完整的资源分发解决方案,不断增强字节跳动移动端资源分发的官方基础设施的能力。 1、负责接入层服务/微服务的架构设计、开发实现、深度优化与稳定性建设。提升系统负载能力和计算效率,保障大流量场景下系统的高并发、高性能、高可靠(Golang技术栈); 2、可参与部分控制面系统设计开发工作,参与控制面服务体系建设、工具链能力建设,提升研发效率(Node.js技术栈); 3、负责技术攻关和创新技术研究,不断增强分发通道产品的场景覆盖能力与用户体验。
1.能独立完成需求分析、技术方案设计及开发工作; 2.负责集团财务相关(预算/管报/财务分析等)系统的服务端代码编写、测试、和发布工作; 3.作为核心技术专家参与产品需求讨论、研发方案设计及代码实现等,深入理解业务需求,提供技术解决方案,推动项目的高效开发与交付; 4.负责系统的各项监控和排障,快速响应并高效解决线上问题,确保业务的平稳运行; 5.和团队一起解决系统中的关键问题和技术难题。
团队介绍: 我们团队为用户提供满足各种出行场景的好路线,提供极致的出行体验,同时服务C端、B端,涵盖自驾、打车、物流等多种业务场景,我们的每一次技术升级或业务的改进都能影响全国用户,有非常复杂的高并发分布式服务系统架构,有业界最先进的路线规划算法(cbr,cch,rch,raptor等)。如果你想发挥你的想象力创造更多社会价值,如果你享受克服困难和挑战自我的喜悦,如果你热爱技术并喜欢追求极致性能和效果,如果你渴望挖掘出源源不断的新应用场景,那就加入我们团队吧! 岗位职责: 你将加入高德在线导航服务团队,从0到1参与打造手车一体的「出行域 Agent」。目标体验对标特斯拉车机中的 Grok:让用户可以用自然语言完成从出行规划、实时导航到行程中各类决策的全流程交互,实现“能听懂、会思考、帮决策、可执行”的智能出行助手。 工作职责: 1.子Agent架构设计与服务实现 a)参与设计出行域子Agent的整体技术架构,包括调用链路、状态管理、容错与降级方案。 b)实现与高德主Agent的协议对接和能力编排,支持多轮对话、工具调用、跨场景任务协同。 c)在手机端与车机端统一能力出口下,处理不同终端、不同地区/国家的差异化需求(如地图/POI/法规差异)。 大模型微调与蒸馏落地 2.针对出行/导航/车机场景,设计与构建高质量训练数据(提示词工程、对话数据、工具调用日志等)。 a)参与或主导对基础大模型的大规模微调(Supervised Fine-tuning / Preference Optimization 等),提升在出行域的理解和决策能力。 b)负责模型压缩、蒸馏与推理优化,使模型在服务端/边缘侧兼顾效果与时延。 3.Agent能力调优与决策优化 a)设计和优化子Agent的工具使用策略(Tool / Function Calling),包括路况查询、路线规划、POI 检索、多目的地规划、国际场景信息调用等。 b)在弱网、高并发、复杂上下文下优化Agent的鲁棒性和决策稳定性。 c)针对复杂出行任务(如跨城自驾、多目的地行程、充电/加油规划、实时绕行、国际出行规则差异)进行专项调优。 4.效果评测与质量体系构建 a)搭建出行Agent的自动化评测框架,包括:指令理解准确率、工具调用正确率、任务成功率、响应时延、用户反馈闭环等。 b)构建离线评测集和真实流量回放机制,持续追踪模型与系统升级带来的收益和风险。 c)联合产品与运营,通过灰度发布、A/B 实验驱动持续优化。 5.性能与稳定性保障 a)在9亿+月活与车机大规模接入背景下,对服务进行高可用、高性能设计(限流、降级、缓存、异步架构、观测性体系)。 b)处理线上复杂问题(流量波动、模型异常、工具依赖故障等),建立监控、告警和自愈机制。 6.前沿技术探索与工程化落地 a)跟踪 LLM、Agent、RAG、多Agent协作、规划与推理(Planning & Reasoning)、多模态等方向的最新进展,并筛选适合出行场景的技术方案。 b)探索将地图/导航结构化数据与大模型结合的最佳实践,让Agent真正“看得懂地图、懂路况”。