阿里云阿里云智能-网络研发Java技术专家-北京/杭州
任职要求
1、计算机相关专业,5年以上Java开发经验; 2、有扎实的Java和数据库知识,熟练掌握Spring、Mybatis、Netty等常用开源框架,了解其原理并能结合业务场景灵活运用; 3、对分布式系统有较深的理解及经验,熟悉常用的…
工作职责
1、参与DNS、顶级域服务平台相关系统的架构设计和开发工作; 2、参与DNS、顶级域服务平台相关系统的中长期规划和持续迭代升级,保障系统的稳定性、性能及可扩展性; 3、在深入理解业务及需求的基础上制定最佳技术方案,并推动方案高效落地; 4、通过新技术新方法的引入持续提升系统的稳定性、性能及研发效率,助力业务高速发展。
负责阿里云全球网络的服务化平台研发,包括但不限于平台开发、模型/算法构建、海量数据分析处理等。 阿里云基础设施网络研发事业部,负责整个阿里巴巴网络基础设施的研发、建设和运维,始终坚持利用软/硬件技术及研究,针对业务需求研发网络解决方案,给公司业务提供强有力支持。广域网架构与研发团队,作为网络研发事业部核心团队之一,负责设计、研究、建设、运营面向全球的阿里巴巴广域网络,实现网络的高可靠、高可用、低成本,并不断提升用户体验。 具体岗位职责: 1. 负责阿里全球网络的数据分析、网络优化、资源规划等自动化和智能化系统研发,包括但不限于面向稳定性保障、质量优化和成本经营的算法、模型和平台研发 2. 负责阿里全球网络的质量探测与保障、网络监控、流量采集、Qos管控等系统设计研发 3. 负责阿里全球网络流量调度系统设计和研发,实现云边一体、端网融合、全球加速等目标
1. 技术方案设计 • 与PD紧密合作,收集、识别、分析客户需求,结合自身行业经验分析并论证需求合理性;在需求明确后,确定技术方案的目标、范围和交付成果; • 完成客户需求的技术方案设计,结合需求场景选择合理的技术架构,满足性能与稳定性要求,并保持足够的可扩展性,同时确保ROI(投入产出比)合理。 2. 技术实现 • 基于DDD(领域驱动设计)开发方法,按时完成弹性网卡(ENI)、安全组(Security Group)业务需求的开发,高质量交付; • 对编码进行阶段性讨论和Code Review,并通过调试优化,推动代码成功部署; • 在Code Review过程中,能够保持热情,及时给予年轻工程师经验指导,帮助其快速成长; • 对开发中和部署后的程序进行维护和迭代,包括值班on-call、升级工单处理、缺陷排查、问题诊断、产品体验改善、性能和成本优化等。 3. 稳定性和性能优化 • 与架构和SRE团队紧密合作,针对负责的功能制定稳定性策略,寻找并解决产品系统中的潜在风险和瓶颈,处理线上疑难杂症问题,确保系统的安全可靠; • 使用DDD(领域驱动设计)开发方法对存量代码进行重构,持续改善系统设计、提升系统性能并消除稳定性隐患。 4. 技术预研 • 定期调研业界对标产品的产品形态并结合客户反馈的业务诉求,分析并转化为ECS弹性网卡、ECS安全组等平台产品的需求;协同PD保持上述产品能力的先进性。 5. 技术规划 • 定期跟踪系统在性能和稳定性相关指标方面的变化趋势,及时分析原因,发现弹性能力演进的机会点,并提前设定技术架构演进的前瞻性目标,开展POC验证; • 对分布式技术、高性能通信技术、数据库技术等保持好奇心和敏锐性,结合业务实际做好技术预研、分享和应用。
阿里云专有云是面向政企行业客户的全栈云平台,为政企客户(政府、金融、部委、央企等行业)提供产品和服务。 该岗位主要负责专有云平台IAAS技术方向的架构规划及研发工作,提升技术竞争力,满足专有云客户业务需求。 技术方案设计 • 基于技术方案的拆解,按照任务目标和产出规范,完成任务/子任务的设计、编码开发和系统功能实现 • 负责核心功能的架构与代码模板的编写,开发与维护系统公用核心模块,技术架构重构、优化等 • 对编码进行阶段性的讨论和CodeReview,并通过调试优化,推动代码成功部署 • 对开发中和部署后的程序进行必要的维护和迭代,包括值班oncall、升级工单处置、bug排查、问题诊断、产品体验改善、性能和成本优化等 稳定性和性能优化 • 制定稳定性策略,寻找并解决产品系统中的潜在风险和瓶颈,覆盖线上疑难杂症问题,确保系统的安全可靠 • 运用产品优化技术和方法,进行性能优化,提高产品稳定性和性能 技术预研 • 跟踪和了解最新的产品技术和趋势,根据业务需要提供最新的技术支持和建议。 技术规划 • 理解业务战略及重点,基于业务需求作出高可用、高可靠、高拓展性的技术架构规划和落地。
1. 作为技术负责人,制定并推动多模态交互系统的端云整体工程架构演进路线,覆盖端侧推理、客户端集成、云端服务及协同策略。 2. 主导端侧AI推理框架的设计与优化,包括模型加载、算子加速、内存管理、功耗控制、异构计算(CPU/GPU/NPU)调度等,确保大模型在资源受限设备上的高效运行。 3. 负责Android客户端核心交互模块的架构设计与开发,包括多模态输入采集、实时通信、状态管理、离在线切换、异常恢复等关键能力。 4. 设计高并发、低延迟、可扩展的云端推理服务架构,支持语音识别、大模型生成、多模态融合等服务的弹性部署与动态扩缩容。 5. 构建端云协同机制,实现任务卸载、上下文同步、模型热更新、A/B测试等能力,提升系统整体鲁棒性与迭代效率。 6. 带领应用工程团队,负责关键技术方案评审、核心模块编码、性能压测、线上稳定性保障及团队技术能力建设。 7. 与算法、产品、芯片、测试及客户解决方案团队紧密协作,推动系统从原型验证到规模化商用落地。