阿里云阿里云智能-大模型前沿部署工程师(工业场景)-北京/上海/杭州/深圳/广州
任职要求
本科及以上学历,计算机、人工智能、软件工程等相关专业,具备2年以上工作经验; 熟练掌握Python/Java编程语言,并具备工程能力与系统思维,有大模型项目落地经验者优先,熟悉阿里云大模型平台(AI Studio、百炼、PAI)、通义系列产品者优先; 熟悉掌握主流大模型技术栈,包括Context Engineering、RAG、Tool Use、MCP、Agent Workflow、DeepResearch、DeepSearch、Agen…
工作职责
深入重点客户业务场景,快速识别其对大模型技术的需求场景,例如知识问答、办公提效、内容生成、智能研发、辅助编程、多模态识别和生成等,端到端完成需求分析、总体方案设计、架构设计、组件研发、数据集成、系统集成等工作,推动通义千问系列模型在行业场景的落地; 主导大模型项目落地的关键技术工作,包括场景需求收集、数据解析与处理、知识抽取与向量化、RAG开发、Agent 流程编排等,协助客户完成模型选型、系统对接、用量监控、成本优化与效果迭代,确保客户可直观感知模型价值; 开发辅助工具代码降低客户接入门槛,例如测试工具、效果评测工具、数据处理工具、API 调用示例及 Demo 应用; 输出大模型落地方法论与最佳实践,包括 Prompt 模板库、RAG 优化策略、Agent 设计模式等,支持客户自主运营与规模化复制。
-跟进前沿技术,参与目标检测/实例分割/视频理解/AIGC生成/多模态大模型等方向的算法技术研究与部署落地 -针对工业场景中的实际需求,协助参与CV算法的优化与迭代,提升算法性能与效果 -协助完成相关算法的工程化实现,完成算法落地与产品化工作,确保算法能够在实际项目中稳定运行 -跟踪行业动态与最新技术进展,赋能各个业务方向,为公司项目提供技术支持与解决方案
1. 负责文生图(Text-to-Image)生成算法的研发与优化,包括中文场景下图像生成质量提升、多模态对齐、可控性生成等方向; 2. 图文融合的排版生成技术研发,构建和优化多模态联合训练模型,实现自动化、智能化的视觉内容布局生成(如杂志、UI界面等); 3. 结合各业务场景下相关技术问题进行分析、算法设计,推动算法在工业级场景的部署与应用,沉淀在业界有影响力工作;
1. 负责计算机视觉&多模态相关算法研发,面向但不限于:多模态内容理解、多模态检索、多模态目标检测、分割、Metric Learning、主体识别、图像编辑、图像增强、文生图等; 2. 负责智能编辑、智能生成、一键成片等创作工具的研发与应用,达到业界领先的性能指标; 3. 负责相关算法和系统的持续迭代和进化; 同时能够深入小红书发布业务场景,结合实际需求进行技术落地和创新; 4. 完成基于多模态大模型的算法升级,快速实现以及大规模工业化部署,参与创新性算法的研究以及开发工作;
我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 1、参与设计实现支持RLHF/DPO等对齐技术的高效训练框架,优化强化学习阶段的Rollout、Reward Model集成、多阶段训练 Pipline; 2、研发支持多机多卡 RL 的分布式训练框架,开发TP/PP/ZeRO-3与RL流程的动态协同机制,解决 RL 算法在超长时序下的显存/通信瓶刭 3、构建端到端后训练工具链,主导框架与 MLOps 平台集成,提供训练可视化、自动超参搜索等生产级能力 4、与公司各算法部门深度合作,参与大语言模型LLM、多模态大模型 MLLM等业务在 SFT/RL领域的算法探索和引擎迭代; 5、参与分析各业务 GPU 利用率与饱和度等指标,结合业务场景持续优化训练框架能力,提升框架领先性。