logo of bytedance

字节跳动后端研发工程师(Agent中台方向)-生活服务

社招全职5年以上A223866A地点:北京状态:招聘

任职要求


1、本科及以上学历,计算机、通讯等相关专业,5年及以上研发相关工作经验优先;
2、扎实的计算机知识,有较强的逻辑能力和学习能力;深入了解GoPythonJava等至少一门语言;
3、熟悉分布式系统设计、微服务系统设计、稳定性治理、常用中间件原理以及实践等优先;
4、在系统容灾(多活架构、流…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责Agent系统的稳定性建设,设计高可用架构与容灾降级方案,保障系统在极端场景下稳定运行;
2、优化系统性能,解决分布式场景下的任务调度、数据一致性、故障自愈等挑战,提升服务SLA;
3、建立系统监控、告警及应急响应机制,负责重大故障的排查与恢复;
4、持续优化系统架构,通过代码重构、性能调优等手段提升系统扩展性与可维护性;
5、探索分布式计算、任务调度、流式数据处理等领域的前沿技术(如分布式事务、弹性扩缩容、异构计算等),推动技术成果转化。
包括英文材料
学历+
Go+
Python+
Java+
分布式系统+
微服务+
中间件+
还有更多 •••
相关职位

logo of bytedance
社招1年以上A104586

团队介绍:商业产品与技术部门(广告业务)成立于2014年,负责字节跳动商业变现端到端大型广告系统建设,覆盖抖音、今日头条、西瓜视频、番茄小说、穿山甲等产品矩阵,致力于让营销更省心、更高效、更美好,推动商业可持续增长,让不分体量、地域的企业及个体,都能通过数字化技术激发创造、驱动生意。 商业平台负责整个广告投放系统的客户业务平台建设,我们为客户提供广告创编、商业认证、市场推广等一站式投广覆盖和商业化能力输出。同时在围绕大模型建设中台化Copilot框架,探索面向广告营销场景的Copilot Agent能力方面有深入实践和充满热情。 1、参与商业化本地生活广告平台(本地推)方向的前端研发工作; 2、参与复杂业务场景下工程能力规划和建设,例如场景配置化、低代码、AI提效等; 3、参与开发提效、代码质量提升、前端架构优化、服务稳定性优化等技术建设。

更新于 2025-01-13北京
logo of bytedance
社招5年以上A65306

1、负责Agent系统的稳定性建设,设计高可用架构与容灾降级方案,保障系统在极端场景下稳定运行; 2、优化系统性能,解决分布式场景下的任务调度、数据一致性、故障自愈等挑战,提升服务SLA; 3、建立系统监控、告警及应急响应机制,负责重大故障的排查与恢复; 4、持续优化系统架构,通过代码重构、性能调优等手段提升系统扩展性与可维护性; 5、探索分布式计算、任务调度、流式数据处理等领域的前沿技术(如分布式事务、弹性扩缩容、异构计算等),推动技术成果转化。

更新于 2025-03-11成都
logo of bytedance
社招1年以上A36814

团队介绍:商业产品与技术部门(广告业务)成立于2014年,负责字节跳动商业变现端到端大型广告系统建设,覆盖抖音、今日头条、西瓜视频、番茄小说、穿山甲等产品矩阵,致力于让营销更省心、更高效、更美好,推动商业可持续增长,让不分体量、地域的企业及个体,都能通过数字化技术激发创造、驱动生意。 商业平台负责整个广告投放系统的客户业务平台建设,我们为客户提供广告创编、商业认证、市场推广等一站式投广覆盖和商业化能力输出。同时在围绕大模型建设中台化Copilot框架,探索面向广告营销场景的Copilot Agent能力方面有深入实践和充满热情。 1、参与商业化本地生活广告平台(本地推)方向的前端研发工作; 2、参与复杂业务场景下工程能力规划和建设,例如场景配置化、低代码、AI提效等; 3、参与开发提效、代码质量提升、前端架构优化、服务稳定性优化等技术建设。

更新于 2024-03-11上海
logo of xiaohongshu
社招5-10年引擎

我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 1、参与设计实现支持RLHF/DPO等对齐技术的高效训练框架,优化强化学习阶段的Rollout、Reward Model集成、多阶段训练 Pipline; 2、研发支持多机多卡 RL 的分布式训练框架,开发TP/PP/ZeRO-3与RL流程的动态协同机制,解决 RL 算法在超长时序下的显存/通信瓶刭 3、构建端到端后训练工具链,主导框架与 MLOps 平台集成,提供训练可视化、自动超参搜索等生产级能力 4、与公司各算法部门深度合作,参与大语言模型LLM、多模态大模型 MLLM等业务在 SFT/RL领域的算法探索和引擎迭代; 5、参与分析各业务 GPU 利用率与饱和度等指标,结合业务场景持续优化训练框架能力,提升框架领先性。

更新于 2026-03-28上海|北京