logo of aliyun

阿里云阿里云智能-服务端研发-AI 模型&架构方向

社招全职1年以上云智能集团地点:杭州状态:招聘

任职要求


1. 本科及以上学历,计算机科学、软件工程或相关专业;具备大模型服务平台/推理系统/分布式系统工程化经验者优先。
2. 编程能力:精通 Go/Java 至少一门语言。
3. 深度掌握服务化架构设计(如模型调度中台、API网关),主导过复杂分布式系统架构设计与落地;熟悉资源弹性调度算法、成本优化策略(如GPU资源复用)及…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 大模型推理与调度平台建设:主导多模态/LLM 推理服务化与模型调度中台(自研/二方/三方)建设,支持同模型多账号、多模型共存、降级容错与弹性扩缩容,保障高并发低时延的线上推理体验。
2. 推理加速与资源效率优化:推进推理加速与 GPU 资源复用等优化策略落地,提升模型利用率并降低单位推理成本。
3. 模型成本治理体系:建设模型资源(如配额、用量、费用、使用期限/到期策略)可视化与治理闭环,推动降本动作落地并形成可持续的成本优化机制。
4. 服务端基础架构演进与全球化支撑:负责全球多 Region 架构规划与服务端架构演进,建设统一网关与用户服务体系,支撑业务快速迭代与流量调度、容错容灾与性能优化。
5. SRE 稳定性与可观测性建设:构建全链路监控与自动化运维能力,完善异常响应、容量管理与弹性扩容机制,提升平台可用性与可运营性。
6. 架构融合与平台化治理:推动团队多款 AI 产品服务端架构融合与服务复用,减少重复投入并沉淀统一能力,持续演进与维护以满足企业级/ToC 产品化交付要求。
包括英文材料
学历+
大模型+
分布式系统+
Go+
Java+
系统设计+
还有更多 •••
相关职位

logo of dingtalk
社招3年以上技术类-开发

- AI能力研发:基于钉钉智能财务与智能差旅的产品场景(如发票OCR识别、费用分类、预算预测、差旅行程推荐等),设计并实现AI算法模型,实现应用场景落地,提升智能化水平。 - 服务端架构开发:构建高并发、高可用的服务端系统,支持AI模型的在线推理与实时响应,保障企业级业务稳定性。 - 数据与算法工程化:完成从数据采集、清洗、建模到部署的全流程闭环,推动AI模型在生产环境中的落地与迭代优化。 - 跨团队协作:与产品经理、前端工程师、算法专家协同,将AI能力深度集成到钉钉智能财务与差旅产品中,实现业务价值。 - AI工具链建设:探索qwen等大模型的应用场景,通过提示词工程、模型微调等技术优化用户体验。

更新于 2025-12-11杭州
logo of dingtalk
社招3年以上技术类-开发

1. AI能力研发:主导钉钉低代码AI领域的架构设计与AI研发工作,整合大模型和AI技术,赋能低代码平台,提升应用搭建的智能化水平。同时,构建钉钉低代码业务应用小模型,增强低代码应用的智能性,推动钉钉低代码AI的商业化进程 2. 数据与算法工程化:深入分析钉钉低代码应用的结构化数据、业务场景及系统日志,构建钉钉低代码业务领域的数据模型,实现钉钉低代码业务领域轻量化模型架构。通过AI技术推动钉钉低代码业务与技术能力的创新与发展,构建智能化的低代码模型 3. 服务端架构开发:构建高并发、高可用的服务端系统,支持AI模型的在线推理与实时响应,保障企业级业务稳定性 4. 跨团队协作:从商业视角看问题,并协调相关方合作,与产品经理、前端工程师、算法专家协同,将AI能力深度集成到钉钉低代码和智能OA产品中,实现业务价值

更新于 2025-12-23杭州
logo of baidu
社招TPG

-负责视觉工程研发和业务交付,研发 AI 模型推理、图声处理、媒体流等工作 -负责视觉工程研发服务端开发、前/终端开发等,具体因候选人而异,按需调整方向 -负责工程性能优化、异构硬件芯片适配、协同交付测试系统联调,确保产出质量 -负责视觉感知类业务(诸如识别、检测等)、AIGC 与生成类业务、数字人业务等 -负责面向业务交付充分保障需求研发质量、面向工程服务稳定重复保证服务高效运行

更新于 2024-08-09北京
logo of ctrip
社招5年以上国际业务开发

1、作为核心研发,负责大语言模型相关应用的落地; 2、深度参与AI领域技术研究、需求设计、技术决策、工程实现、业务效果优化; 3、掌握复杂系统的设计,编写核心代码,持续优化系统,保证系统架构的高质量、高可用、高扩展;

更新于 2025-05-20上海