logo of aliyun

阿里云阿里云智能-Java应用开发高级工程师-云通信-杭州

社招全职3年以上云智能集团地点:杭州状态:招聘

任职要求


1. 3年以上互联网大规模业务或分布高并发系统,特别对所在领域业务系统的高可用和稳定性建设有实战经验者优先。
2. 软件工程理论基础扎实,熟悉分布式服务理论基础。有软件分层概念,熟悉设计模式及原则, 有良好的编程习惯。
3. java基础扎实,熟悉jvm内存管理、GC算法,熟悉JVM参数调优,熟悉java集合类、多线程。
4. 精通java web开发。掌握spring(springbootspring mvc)、myb…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责云通信国际融合产品核心产品功能开发与版本迭代,保证产品能力快速迭代和高质量交付
2. 负责云通信融合产品与能力开放平台基础框架开发,兼顾传统接口式编程范式以及大模型编程范式,保证系统鲁棒性的同时考虑业务扩展性 
3. 负责大语言模型应用层开发与落地,包括但不限于生成ChatFlow,智能对话生成,知识问答、数据分析等场景
4. 通过行业会议、技术媒体、学术研究、友商交流等方式,收集领域内的新技术信息,包括但不限于技术原理、技术优劣势、应用场景等
5. 分析竞对产品的核心技术指标和发展方向,通过内外部渠道,了解并洞悉客户需求,并凝练形成对应的技术洞察、选型以及协助产品经理构建产品发展规划
6. 指导和培养团队成员,包括评审设计文档和代码
7. 参与平台整体系统的架构设计与演进规划,结合业务实际情况综合考虑系统的安全性、稳定性、可扩展性、性能和使用体验,对系统持续优化,确保能够满足持续发展的业务形态与规模对基础平台能力的需求
包括英文材料
高并发+
高可用+
设计模式+
编程规范+
Java+
JVM+
GC+
算法+
还有更多 •••
相关职位

logo of xiaohongshu
社招3-5年后端开发

工作职责: 1、负责大模型平台的架构设计和核心功能研发,构建云原生架构,设计高可用、高性能的微服务体系; 2、负责构建面向大模型全流程的DevOps,与下游云原生平台深度融合,支撑大模型在公司内各业务生产链路稳定高效地落地; 3、负责万卡规模GPU集群效能分析及优化,通过调度策略优化、在离线混部、GPU虚拟化、存储&网络加速等手段,提升GPU集群使用效率; 4、将平台和框架结合,通过任务调度、弹性容灾、性能优化等措施端到端提升AI生产效率,涉及k8s/kubeflow、网络通信、分布式训练等; 5、优化各AI平台性能,提升系统稳定性和可扩展性,保障大规模并发场景下的服务质量与用户体验; 6、持续研究分析业内创新AI平台产品,优化技术方案,改进产品功能,提升创新能力与产品体验。

更新于 2025-11-07北京|上海|杭州
logo of xiaohongshu
社招3-5年大模型

我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 1、负责大模型平台的架构设计和核心功能研发,构建云原生架构,设计高可用、高性能的微服务体系; 2、负责构建面向大模型全流程的DevOps,与下游云原生平台深度融合,支撑大模型在公司内各业务生产链路稳定高效地落地; 3、负责万卡规模GPU集群效能分析及优化,通过调度策略优化、在离线混部、GPU虚拟化、存储&网络加速等手段,提升GPU集群使用效率; 4、将平台和框架结合,通过任务调度、弹性容灾、性能优化等措施端到端提升AI生产效率,涉及k8s/kubeflow、网络通信、分布式训练等; 5、优化各AI平台性能,提升系统稳定性和可扩展性,保障大规模并发场景下的服务质量与用户体验; 6、持续研究分析业内创新AI平台产品,优化技术方案,改进产品功能,提升创新能力与产品体验。

更新于 2025-10-23北京|上海|杭州
logo of aliyun
社招3年以上云智能集团

阿里云ApsaraMQ是行业一流的Serverless消息云服务,为客户提供一站式多场景的业界主流消息服务(包括Apache RocketMQ、Apache Kafka、RabbitMQ、MQTT、MNS、EventBridge),具备10倍成本优化、10倍弹性能力、异地多活、丰富集成生态等产品优势。目前AI时代已来,我们正在引领新一代AI MQ技术,为AI Agent提供事件驱动架构基础设施和实时AI Context服务,覆盖AI原生应用架构和一站式Agentic数据分析的场景。 1.负责阿里云消息云服务AI MQ、Data+AI等特性研发,拓展消息、事件流在AI场景的落地规模; 2.负责阿里云消息云服务稳定性建设,为AI Agent提供坚实、可靠的通信、数据流技术底座; 3.负责阿里云消息技术性能优化、成本优化,持续降低Agent通信的延迟和成本; 4.负责阿里云消息运维平台建设,基于大模型构建SRE Agent持续提升产研效率; 5.负责Apache RocketMQ技术竞争力建设和开源社区运营,打造AI MQ心智,持续扩大开发者规模。

更新于 2026-01-05深圳|杭州
logo of aliyun
社招3年以上云智能集团

1、负责云网络SLB/GA/PVL/NAT等虚拟化网元以及转发底座在AI场景下如GPU集群调度、LLM模型分发、应用层感知的流量分发等相关需求分析以及技术方案设计; 2、负责云网络SLB/GA/PVL/NAT等虚拟化网元以及转发底座的AI场景下的控制平面以及数据平面的开发以及维护,包括相关需求开发、性能优化、架构升级、稳定性保障等; 3、负责云网络虚拟化网元在AI训练/推理场景下的技术预研以及技术规划。

更新于 2025-12-20北京|杭州|南京