阿里云阿里云智能-机器学习平台研发专家-杭州/北京
任职要求
1. 计算机及相关专业背景,扎实的计算机基础知识,3年以上Golang、Java、Python或C++一种或多种语言的开发经验; 2. 具有3年以上分布式系统或后端服务系统相关工作经验,具备复杂系统软件的设计和调试能力; 3. 熟悉容器(如Docker/Containerd)、Kubernetes、微服务架构、数据库、Prometheus和ElasticSearch等至少一项相关技术。熟悉异构设备,包括但是不限于gpu; 4.…
工作职责
1. 研发需求洞察与设计:负责阿里云人工智能平台PAI的需求讨论、架构设计、软件开发、功能测试及部署上线,确保项目从初始阶段到交付的全流程高质量执行; 2. 系统优化:从功能、性能、可用性、易用性等多个维度,结合产品设计、产品设计和解决方案架构及客户反馈,进行系统各模块的持续分析和优化,降低用户使用门槛,提升用户满意度和忠诚度; 3. 技术支持与维护:负责线上环境的运行监控与问题定位,与SRE和售后团队紧密协作,及时为客户提供技术支持,保障平台的稳定运行; 4. 前沿技术开发:紧贴大模型及AIGC等业界趋势,提炼并反馈有价值的用户需求,持续增强和改进平台的功能,保持技术的先进性和市场竞争力。
【业务介绍】 作为公司统一的机器学习平台团队,负责调度公司所有模型训练与推理资源;基于自建的训推引擎,构建公司统一的机器学习平台,为公司所有算法同学(稀疏 & 稠密,含 LLM) 模型迭代提供端到端的一站式服务;包括 数据生产,模型训练,模型上线,特征管理,模型测试,资源管控等一系列能力。 【岗位职责】 1、负责机器学习链路,离在线数据相关的开发工作,包括样本数据、特征数据等的数据链路搭建、任务运维和调优、性能优化等 2、负责小红书大规模机器学习平台的后台系统设计和开发工作;包括样本平台,特征平台,训练平台,推理平台等AI应用后台建设等; 3、研究分析业内AI平台产品,优化技术方案,改进产品功能,完善产品体验。
【业务介绍】 我们是小红书内稠密类模型(LLM/MLLM/SD/CV/NLP)统一的AI平台QuickSilver,负责调度公司内所有稠密类模型训练与推理资源,基于自建的训推引擎,为公司所有AI算法同学迭代业务模型提供端到端一站式AI服务;包括数据管理,模型管理,模型训练、压缩、推理、部署,服务管理,资源调度等一系列能力。 工作职责: 1、负责稠密类模型训练推理开发平台的架构设计和核心功能研发 2、设计和实现大模型训练部署流程,包括模型fine-tuning、推理服务化等 3、构建云原生架构,设计高可用、高性能的微服务体系 4、优化平台性能,提升系统稳定性和可扩展性
【职位介绍】 我们团队负责构建小红书推荐算法中台,提高内容分发效率,为海量用户提供极致的推荐体验。在这里,你将参与到推荐系统的全链路搭建和各类算法的研发,包括不限于大模型应用、多模态建模、深度学习、强化学习、迁移学习、表示学习、图学习等领域。我们希望对推荐、搜索、广告感兴趣的同学,加入我们一起研发世界一流的推荐引擎。 1. 负责推荐算法中台的全链路建设,抽象业务共性,敏捷高效支持各类推荐需求。 2. 负责业界先进推荐算法的研发和落地,包括但不限于大模型技术、多模态内容理解、召回算法、排序模型(粗精排)、长短期兴趣建模、多场景联合建模等。