阿里云阿里云智能-大模型前沿部署工程师(工业场景)-北京/上海/杭州/深圳/广州
任职要求
本科及以上学历,计算机、人工智能、软件工程等相关专业,具备2年以上工作经验; 熟练掌握Python/Java编程语言,并具备工程能力与系统思维,有大模型项目落地经验者优先,熟悉阿里云大模型平台(AI Studio、百炼、PAI)、通义系列产品者优先; 熟悉掌握主流大模型技术栈,包括Context Engineering、RAG、Tool Use、MCP、Agent Workflow、DeepResearch、DeepSearch、Agen…
工作职责
深入重点客户业务场景,快速识别其对大模型技术的需求场景,例如知识问答、办公提效、内容生成、智能研发、辅助编程、多模态识别和生成等,端到端完成需求分析、总体方案设计、架构设计、组件研发、数据集成、系统集成等工作,推动通义千问系列模型在行业场景的落地; 主导大模型项目落地的关键技术工作,包括场景需求收集、数据解析与处理、知识抽取与向量化、RAG开发、Agent 流程编排等,协助客户完成模型选型、系统对接、用量监控、成本优化与效果迭代,确保客户可直观感知模型价值; 开发辅助工具代码降低客户接入门槛,例如测试工具、效果评测工具、数据处理工具、API 调用示例及 Demo 应用; 输出大模型落地方法论与最佳实践,包括 Prompt 模板库、RAG 优化策略、Agent 设计模式等,支持客户自主运营与规模化复制。
-跟进前沿技术,参与目标检测/实例分割/视频理解/AIGC生成/多模态大模型等方向的算法技术研究与部署落地 -针对工业场景中的实际需求,协助参与CV算法的优化与迭代,提升算法性能与效果 -协助完成相关算法的工程化实现,完成算法落地与产品化工作,确保算法能够在实际项目中稳定运行 -跟踪行业动态与最新技术进展,赋能各个业务方向,为公司项目提供技术支持与解决方案
1. 负责文生图(Text-to-Image)生成算法的研发与优化,包括中文场景下图像生成质量提升、多模态对齐、可控性生成等方向; 2. 图文融合的排版生成技术研发,构建和优化多模态联合训练模型,实现自动化、智能化的视觉内容布局生成(如杂志、UI界面等); 3. 结合各业务场景下相关技术问题进行分析、算法设计,推动算法在工业级场景的部署与应用,沉淀在业界有影响力工作;
1. 负责计算机视觉&多模态相关算法研发,面向但不限于:多模态内容理解、多模态检索、多模态目标检测、分割、Metric Learning、主体识别、图像编辑、图像增强、文生图等; 2. 负责智能编辑、智能生成、一键成片等创作工具的研发与应用,达到业界领先的性能指标; 3. 负责相关算法和系统的持续迭代和进化; 同时能够深入小红书发布业务场景,结合实际需求进行技术落地和创新; 4. 完成基于多模态大模型的算法升级,快速实现以及大规模工业化部署,参与创新性算法的研究以及开发工作;
1. 多模态大模型研发与落地: - 负责工业视觉质检领域多模态大模型的构建、训练与优化,解决传统CV模型在复杂背景、小样本、零样本缺陷的识别率低的问题。 - 研究并应用多模态融合技术(如图像+文本描述、图像+参数),提升模型对工业缺陷的语义理解与泛化性能,同时实现工业缺陷的自然语言描述生成和智能问答。 - 搭建面向大模型的质检数据生产与清洗的pipeline,包括高质量图文对齐数据的构建、合成数据生成等,并设计模型效果评估体系,驱动算法的持续迭代与优化。 - 针对工业场景的实时性与高精度要求,负责大模型的轻量化部署与推理加速(如量化、剪枝、蒸馏)。 2. 质检Agent智能体构建: - 负责设计并主导研发面向工业视觉质检场景的智能Agent,具备多模态理解能力,能够融合图像、文本(如工艺标准SOP)、传感数据等信息,实现对缺陷的自动化判定、描述、归因及溯源。 - 构建面向质检场景的Agent工作流(Workflow),包括任务规划(模型自动择优等)、节点调用(训练任务的全流程、工具搭建业务流等等)、结果反馈。 - 负责构建并维护质检领域的专业知识库(RAG),结合向量数据库技术,提升Agent在特定缺陷场景下的准确性和可解释性。 3. 大模型微调与优化: - 针对工业质检的小样本、长尾分布问题,设计并实施高效的大模型微调策略(如LoRA、P-Tuning等),提升模型在特定质检任务上的识别检出能力。 - 持续跟进多模态大模型、AIGC、Agent等领域的最新前沿技术进展,并引领团队进行技术预研和创新,探索其在工业缺陷检测中的应用潜力。