logo of kuaishou

快手多模态推理平台研发工程师-【可灵AI专项】

社招全职3-5年J0011地点:北京状态:招聘

任职要求


1、硕士及以上学历,计算机、软件工程、人工智能、自动化等相关专业优先;
2、3年以上机器学习系统或基础架构研发经验,熟练掌握 Java/Python 语言中的一种;
3、有大规模分布式系统的设计和开发经验,熟悉常见的容器编排调度、数据库、消息队列等配…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、多模态推理工作流架构,设计并实现多阶段分布式推理工作流,支持视觉/文本/音频等多模态内容生成任务,负责大模型服务的端到端开发与部署,包括模型集成、API封装及异构资源调度优化;
2、AIOPS平台建设与协作提效,构建面向大模型业务的全生命周期AIOPS平台,覆盖开发、测试、监控全流程,建设标准化工具链与自动化流程,落地跨团队高效协作范式,加速业务迭代与成果转化;
3、Agent应用开发,支持TOC多模态AIGC任务的编排计算,利用Agent能力辅助用户进行复杂视频生成等。
包括英文材料
学历+
机器学习+
Java+
Python+
还有更多 •••
相关职位

logo of kuaishou
实习D13925

1、参与智能创作Agent核心系统的研发与迭代,学习如何融合多模态理解、交互与生成能力,探索AI在内容创作中的应用场景; 2、协助搭建创作领域的多模态认知体系,结合行业知识库,理解镜头美学、剪辑节奏、叙事逻辑等要素,支持图片/视频/音乐生成模型的优化与应用; 3、参与大模型后训练相关探索(如SFT、RLHF 等),通过高质量数据合成、指令设计、偏好对齐等方法,提升Agent的长推理和复杂规划能力; 4、参与Agent相关核心模块的开发与实验,包括任务编排、工具调用、多Agent协作、长期记忆和个性化能力探索。

更新于 2025-12-10北京
logo of mihoyo
社招3年以上程序&技术类

1. 负责大模型推理平台(含多模态)与传统网关场景的统一流量接入与调度体系建设:入口网关到推理后端的路由、转发、灰度、熔断、降级与回滚策略落地。 2. 设计与实现面向推理业务的流量调度算法:按模型/租户/优先级/成本/延迟目标进行动态路由与容量分配,持续优化 TTFT / TPOT / P99 等指标。 3. 建设流量治理能力:限流(全局/分层/配额)、并发控制、排队与背压、超时与重试、连接管理、长连接与流式请求治理、突发保护与弹性策略。 4. 完善可观测性与问题定位:全链路 tracing、结构化日志、指标与告警体系;建设压测/回放/故障演练能力,提升定位与恢复效率。 5. 推进平台化与工程化:沉淀配置/策略编排/发布体系,保障多集群、多环境的一致性、稳定性与安全合规。 6. 持续跟进业界先进网关与推理流量技术/算法,推动在生产环境落地与迭代。

北京
logo of mihoyo
社招3年以上程序&技术类

1. 负责大模型推理平台(含多模态)与传统网关场景的统一流量接入与调度体系建设:入口网关到推理后端的路由、转发、灰度、熔断、降级与回滚策略落地。 2. 设计与实现面向推理业务的流量调度算法:按模型/租户/优先级/成本/延迟目标进行动态路由与容量分配,持续优化 TTFT / TPOT / P99 等指标。 3. 建设流量治理能力:限流(全局/分层/配额)、并发控制、排队与背压、超时与重试、连接管理、长连接与流式请求治理、突发保护与弹性策略。 4. 完善可观测性与问题定位:全链路 tracing、结构化日志、指标与告警体系;建设压测/回放/故障演练能力,提升定位与恢复效率。 5. 推进平台化与工程化:沉淀配置/策略编排/发布体系,保障多集群、多环境的一致性、稳定性与安全合规。 6. 持续跟进业界先进网关与推理流量技术/算法,推动在生产环境落地与迭代。

上海
logo of bytedance
社招2年以上A241222

团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok AI创新中心,是致力于AI基础设施建设和创新研究的部门,探索行业领先的人工智能技术,包括大语言模型,多模态大模型等研究方向。我们希望研发能够处理多语言和海量视频内容理解的模型算法,为用户带来更好的内容消费体验。在Code AI方向,我们利用大语言模型强大的代码理解与推理能力,提升程序性能与研发效率。 1、参与设计并实现高可用、可扩展、分布式大模型机器学习平台,支撑国际化短视频大模型研发与高效迭代; 2、探索业界前沿的大模型工程研发(LLMOps)相关技术,覆盖数据、训练、推理服务、评测、自动化编排、Prompt工程、资源调度等方向; 3、构建高性能大模型推理服务架构,降低推理成本,保障服务高可用运行。

更新于 2024-03-25北京