乐元素AI平台开发工程师
任职要求
1、计算机及相关专业本科及以上学历,3年以上系统开发经验。 2、精通Java,熟悉Python,具备优秀的系统开发和优化能力。 3、熟悉微服务架构及Spring、Redis、MQ等常用开发框架和中…
工作职责
1、参与AI平台相关子系统设计、开发和优化,包括数据管理、模型管理、模型训练、模型推理、流程编排等。 2、持续优化和提升平台效率、易用性,解决研发过程中的卡点和瓶颈,支撑图形图像、语音、NLP及多模态等多个方向算法的高效生产和迭代。 3、跟踪AI领域的前沿技术和趋势,持续推进平台创新。

1. LLM 工作流编排应用平台的设计与开发:负责企业级大模型工作流的设计与开发,包括流程自动化、Prompt 管理、工具链集成以及低/无代码应用平台的建设,助力业务智能化升级; 2. Multi-agent 系统的设计与开发:构建Multi-agent协作系统,实现 agent自治、分布式任务调度、任务拆解与动态规划等能力,支持复杂业务场景的自动化与智能决策; 3. LLMOps 系统开发:保障企业级模型服务的稳定性、安全性和可扩展性,包括但不限于模型/服务自动化部署、运行监控、弹性扩缩容、自动回滚、故障自愈、全链路可观测性和 SLA 管理等。

1.负责 AI 应用开发范式的设计以及 AI 基础设施的建设,支持公司 AI 应用的快速落地; 2.与产品和算法团队紧密协作,把业务的 AI 需求转化为技术解决方案,并提供对应的系统底座工具; 3.确保 AI 应用系统架构稳定且高效地运行,助力业务优化性能、增强系统稳定性; 4.持续追踪前沿技术趋势,关注并探索 AI 新应用,适时引入新技术与新方法,不断提升产品在技术和工程架构方面的先进性。
【业务介绍】 作为公司统一的机器学习平台团队,负责调度公司所有模型训练与推理资源;基于自建的训推引擎,构建公司统一的机器学习平台,为公司所有算法同学(稀疏 & 稠密,含 LLM) 模型迭代提供端到端的一站式服务;包括 数据生产,模型训练,模型上线,特征管理,模型测试,资源管控等一系列能力。 【岗位职责】 1、负责机器学习链路,离在线数据相关的开发工作,包括样本数据、特征数据等的数据链路搭建、任务运维和调优、性能优化等 2、负责小红书大规模机器学习平台的后台系统设计和开发工作;包括样本平台,特征平台,训练平台,推理平台等AI应用后台建设等; 3、研究分析业内AI平台产品,优化技术方案,改进产品功能,完善产品体验。
