logo of bytedance

字节跳动大模型网关资深工程师/专家

社招全职A172997地点:北京状态:招聘

任职要求


1、对云原生技术、中间件、容器、网络,分布式、Faas等方面技术有深入研究的;
2、精通云计算平台技术体系,具有系统架构设计经验和能力,能独立负责技术架构规划和架构演进;
3、熟练掌握C/C++Java/ScalaPythonGolang中的一门语言;
4、…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责边缘大模型网关,边缘推理等产品化工作;
2、负责安全、高可靠性、高性能的端边云算力协同平台建设;
3、掌握业界前沿的技术,持续探索在各种边缘场景下的AI解决方案。
包括英文材料
中间件+
C+
C+++
Java+
Scala+
Python+
还有更多 •••
相关职位

logo of amap
社招5年以上产品类-平台型

我们正在寻找一位具备深厚数据产品经验、跨业务视野和系统化规划能力的高级/资深数据产品专家,负责推动高德地图在大数据分析、用户理解、行为洞察与数据治理等领域的平台级产品建设。该角色将主导多个关键数据产品的战略规划与落地执行,打造面向未来的数据驱动型基础设施, ● 【数据应用落地业务场景】 ○ 负责北斗平台(包含经营分析、行为分析、供给分析、各类业务专题场景等) 的产品架构设计与演进规划,满足业务针对各类分析场景的业务应用价值落地。 ● 【数据资产管理】 ○ 面对数据供给者团队,建立一套简易高效率的资产维护工具,帮助数据供给者高效、高质量地维护数据资产。并作为平台方推行资产分级管理和数据运营机制。 ● 【可信资产门户】 ○ 打造企业级官方权威数据资产字典,正式推出。作为全公司统一的数据目录和知识库,它将帮助大家低门槛、快速地发现、理解、评估所需数据, ● 【智能化探索落地】 ○ 面向数据使用者,并向AI 智能化、 Agent 进化(数据应用方向)。 实现分析师的智能分身Agent, 可落地接管数据常寻与分探索类场景, 数据对外进行全面推广应用。实现分析师的智能分身Agent落地,并为Agent的使用量和准确度负责 期望带来的关键改变 你将不仅是平台的建设者,更是数据价值的定义者与推动者。我们期待你带来以下层面的关键突破: ● 【 从“报表工具”到“智能决策引擎”的跃迁】 ○ 打破传统BI仅做数据展示的局限,构建具备高级归因、异动预警、预测推演、自动洞察能力的下一代分析平台,让数据主动说话。 ● 【从“数据生产”到“数据消费”的全局视角重构】 ○ 建立以业务价值为导向的数据服务体系,实现数据从“被查询”到“被推荐”、“被调用”、“被集成”的转变,显著提升数据使用效率与覆盖率。 ● 【 从“单点能力”到“平台通用化”的升级】 ○ 打造具备高度抽象能力和横向复用性的数据平台产品,支撑高德多条业务线(导航、出行、本地生活 等)共性需求,避免重复造轮子。 ● 【 从“被动响应”到“前瞻引领”的思维进化】 ○ 超越“接需求—做功能”的模式,能够基于业务发展趋势提前布局数据能力建设,例如预判新业务场景所需的数据模型与分析框架。 ● 【 从“工程实现”到“商业影响”的价值闭环】 ○ 推动数据能力深度嵌入业务链路(如通过用户画像优化投放ROI、通过路径分析提升转化率),形成可量化、可持续的数据驱动增长机制。

更新于 2026-01-15北京
logo of ly
社招5年以上

岗位职责: 1、负责商旅财务系统的日常维护及功能开发 2、负责核心业务模块的需求分析、技术方案设计与编码实现 3、参与系统架构演进,保证系统的高可用、高并发和可扩展性 4、编写高质量、可维护、可测试的代码,并参与代码审查 5、持续改善系统业务流程,以技术推动业务的发展

更新于 2025-12-26苏州
logo of alibaba
社招1年以上

负责内部AI大模型网关的开发和维护,致力于打造集团内部的统一大模型服务接入平台(AI Hub)。我们向下聚合集团内外各类大模型服务,向上为丰富的业务场景提供统一的API接入标准。我们面临着极高的并发挑战,致力于通过智能路由、精细化限流、商业化计费等手段,构建一个高可用、高性能、易接入的 AI基础设施网关

更新于 2026-01-14杭州
logo of xiaohongshu
实习大模型

1、参与小红书万亿级Token量MaaS系统构建,包括但不限于大模型智能网关、大模型弹性伸缩、推理系统优化等方向,共同打造国内领先的大模型MaaS系统; 2、探索负载感知的推理系统流量调度算法,如基于Prefix Cache命中率调度、基于P/D分离的流量调度、基于KVCache使用率、推理排队负载感知的流量调度、长上下文请求调度优化等,持续提升MaaS系统的稳定性、成本效益; 3、探索并跟进业界开源SOTA模型,如Qwen系列、DeepSeek系列,多维度评估模型效果并建立相关的准入体系,及时上架到MaaS系统; 4、参与MaaS系统的国产卡适配,如华为910C、阿里PPU等; 5、参与攻克大规模分布式推理系统带来的复杂挑战,通过弹性调度、容量规划、链路压测等手段提升系统健壮性,确保平台能够弹性扩展,支撑业务的飞速增长。

更新于 2025-08-05北京|上海