阿里云阿里云智能-技术专家/高级开发工程师-阿里云百炼
任职要求
1. 熟练掌握Linux环境下Java/Python等1-2种语言; 2. 硕士及以上学历,具备扎实的计算机科学功底和编程能力,具有良好的编程习惯; 3. 具备独立模块或系统的需求分析、架构设计和编码能力,保证…
工作职责
1. 负责百炼平台大模型调优与部署等AI工具链产品化落地; 2. 负责百炼平台的调优模型推理、模型评测、模型调优、模型广场等的模块的架构设计和开发工作; 3. 了解技术使用场景和优缺点,能够就复杂技术问题,提供解决方案并执行落地,同时对上下游技术团队及技术架构有完整的了解; 4. 基于业务需求和技术洞察,在调优后模型的推理服务方面,进行技术规划并落地。
1. 负责阿里云百炼平台的质量保障工作,参与产品需求和技术方案评审,评估技术架构合理性和可测性。 2. 进行阿里云百炼平台的质量保障体系建设,包括功能测试、自动化测试、性能测试和稳定性测试等。 3. 配合开发团队进行问题排查和分析,解决线上用户问题,持续提升产品竞争力。
职位概述: 阿里云飞天实验室正在寻找一位充满激情的大模型应用开发者,加入我们的创新团队,共同构建和优化阿里云百炼大模型平台的核心应用组件, 开发以核心技术驱动的前沿应用的构建。我们专注于前沿的大模型能力,基于最新的模型能力,构建大模型应用,支持阿里云toB客户, 打造海内外和开源社区影响力。 团队介绍: 我们是一支致力于AGI,构建前沿的大模型应用范式的团队。 岗位描述: 1. 负责大规模语言基础模型,多模态模型,文生图、视频生成模型等AI能力的产品化落地工作。 2. 支持百炼大模型平台上应用组件、场景化应用的开发和落地。 3. 主要负责百炼大模型平台应用广场、MCP广场能生态能力建设。 加入我们,你将获得: 1. 与行业顶尖人才共事的机会。 2. 参与前沿技术研究和产品开发的平台。 3. 开放和包容的工作环境如果你渴望在一个充满活力和创新的环境中工作,并且对人工智能技术充满热情,我们期待你的加入!
团队介绍 我们是阿里云智能集团飞天实验室团队,致力于通过技术创新和工程实践推动前沿AI技术的落地与应用。团队聚焦于模型服务的基础研发,覆盖从底层架构设计到上层业务支持的全链路开发工作。我们的目标是打造业界最出色、成本最低、效率最高、规模最大、稳定、易用的模型服务平台,支撑大规模AI模型的研发、部署与推理极致优化,助力企业级AI应用的快速发展。 岗位职责 1. 负责大规模语言基础模型、多模态模型、文生图、视频生成模型等AI能力的产品化落地工作; 2. 主要负责通义千问多端核心应用的构建,支持最新模型能力的落地; 3. 支持百炼大模型开发平台上应用组件、场景化应用的开发和落地。
1、稳定性保障与体系建设:负责大模型服务平台及人工智能产品的稳定性保障工作,通过指标建设、预案设计、容量规划、监控完善、建立SOP等手段提升业务可用性与可靠性。 2、高并发流量治理:主导大规模分布式系统及高并发场景下的流量治理方案设计与实施,包括弹性扩缩容以及熔断、限流、降级等容灾策略,确保业务连续性与鲁棒性。 3、新环境部署:在新环境上进行一整套推理系统及其上下游依赖的部署和运维,负责日常模型的上架、性能监测、中间件和底层基建性能监测等。 4、Oncall与应急响应:参与OnCall值班,快速定位并解决生产环境故障,主导重大事件应急响应与复盘;建立故障快速恢复机制,推动根因分析及长效改进措施落地。 5、运维自动化:优化现有部署、监控及维护流程,推动运维自动化与平台化建设,提升研发效率与系统可观测性。负责监控/日志/网络/存储等原生基础设施的保障和工具开发。