阿里云阿里云智能-大模型前沿部署工程师(工业场景)-北京/上海/杭州/深圳/广州
任职要求
本科及以上学历,计算机、人工智能、软件工程等相关专业,具备2年以上工作经验; 熟练掌握Python/Java编程语言,并具备工程能力与系统思维,有大模型项目落地经验者优先,熟悉阿里云大模型平台(AI Studio、百炼、PAI)、通义系列产品者优先; 熟悉掌握主流大模型技术栈,包括Context Engineering、RAG、Tool Use、MCP、Agent Workflow、DeepResearch、DeepSearch、Agen…
工作职责
深入重点客户业务场景,快速识别其对大模型技术的需求场景,例如知识问答、办公提效、内容生成、智能研发、辅助编程、多模态识别和生成等,端到端完成需求分析、总体方案设计、架构设计、组件研发、数据集成、系统集成等工作,推动通义千问系列模型在行业场景的落地; 主导大模型项目落地的关键技术工作,包括场景需求收集、数据解析与处理、知识抽取与向量化、RAG开发、Agent 流程编排等,协助客户完成模型选型、系统对接、用量监控、成本优化与效果迭代,确保客户可直观感知模型价值; 开发辅助工具代码降低客户接入门槛,例如测试工具、效果评测工具、数据处理工具、API 调用示例及 Demo 应用; 输出大模型落地方法论与最佳实践,包括 Prompt 模板库、RAG 优化策略、Agent 设计模式等,支持客户自主运营与规模化复制。
-跟进前沿技术,参与目标检测/实例分割/视频理解/AIGC生成/多模态大模型等方向的算法技术研究与部署落地 -针对工业场景中的实际需求,协助参与CV算法的优化与迭代,提升算法性能与效果 -协助完成相关算法的工程化实现,完成算法落地与产品化工作,确保算法能够在实际项目中稳定运行 -跟踪行业动态与最新技术进展,赋能各个业务方向,为公司项目提供技术支持与解决方案
1. 负责文生图(Text-to-Image)生成算法的研发与优化,包括中文场景下图像生成质量提升、多模态对齐、可控性生成等方向; 2. 图文融合的排版生成技术研发,构建和优化多模态联合训练模型,实现自动化、智能化的视觉内容布局生成(如杂志、UI界面等); 3. 结合各业务场景下相关技术问题进行分析、算法设计,推动算法在工业级场景的部署与应用,沉淀在业界有影响力工作;
1. 负责计算机视觉&多模态相关算法研发,面向但不限于:多模态内容理解、多模态检索、多模态目标检测、分割、Metric Learning、主体识别、图像编辑、图像增强、文生图等; 2. 负责智能编辑、智能生成、一键成片等创作工具的研发与应用,达到业界领先的性能指标; 3. 负责相关算法和系统的持续迭代和进化; 同时能够深入小红书发布业务场景,结合实际需求进行技术落地和创新; 4. 完成基于多模态大模型的算法升级,快速实现以及大规模工业化部署,参与创新性算法的研究以及开发工作;
1、探索生成式预估范式在搜索推荐场景的可行性与边界,系统分析生成式模型相较于传统判别式模型在表达能力、泛化性与训练效率上的优劣;设计可扩展的生成式架构,涵盖生成式训练范式、结构优化、以及基于强化学习的排序目标对齐方法,构建具备scale-up潜力的下一代预估模型体系。 2、研究大语言模型(LLM)在电商场景下的个性化CTR/CVR预估应用,探索模态对齐、用户行为链(CoT)建模等技术路径,将LLM的推理能力迁移至用户偏好理解与意图推断,实现更精准的人货匹配与动态兴趣建模。 3、主导大模型预估系统的基础设施建设,涵盖算力友好的算法设计、分布式训练加速、线上低延迟部署、端到端链路优化及计算复杂度控制,推动前沿模型技术在高并发、实时性要求严苛的工业场景中规模化落地。