阿里云阿里云智能-算法专家-机器学习PAI
任职要求
1、国内、外知名高校硕士及以上学历,计算机/cv/nlp相关专业方向优先,3年以上工作经验 2、熟悉常用的大模型(LLMs)/多模态大模型(VLM)算法,具备极佳的工程能力,熟练使用c/c++/python等计算机语言,熟悉langchain,Dify等大模型应用开发框架 3、具备优秀的逻辑思维能力,善于发现和推理不同事物之间的关系和影响,在复杂业务场景下能够分解和抽象问题,提供优秀、完整、可行的解决方案 4、熟悉大规模数据处理平台Hadoop/Spark/ODPS等;熟悉主流深度学习工具pytorch/TensorFlow/Keras等 5、对算法原理及应用有较深入的理解,在机器学习、数据挖掘、CV、NLP等相关领域顶会或期刊上发表论文者优先
工作职责
1.负责基于AI云平台,构建高效、易用的大模型/多模态大模型算子工具库,包括数据处理,预训练,SFT,模型蒸馏,强化学习等链路,并将云上的AI能力赋能给客户; 2. 基于上述AI算法开发工具链,研发大模型/多模态大模型算法在ChatBI,AI Agent,自动驾驶,具身智能等典型应用场景的最佳实践,对算法效果、性能进行持续优化; 3. 具备将业务问题转化成算法实现问题,帮助客户解决实际问题的能力;能与企业客户深度沟通,通过对业务的深入理解,将不同用户对算法的需求抽象成标准工具,达到能快速复制的效果; 4. 持续跟踪大模型/多模态大模型算法技术本身的业界动态,在算法效果/效率方面持续创新,沉淀学术影响力
● 设计和实现高效的分布式推理架构,提升多节点、多GPU环境下的推理速度和资源利用率。开发智能的请求调度算法,确保高并发场景下的最优响应时间和吞吐量。对推理引擎的运行时环境进行深度优化,减少延迟,提高整体性能。针对多种异构AI加速硬件(如NVIDIA GPU, AMD GPU, NPU等),对核心算子进行极致性能优化,最大化算力和访存带宽利用率。 ● 探索并实现极低bit量化技术和稀疏化,减少模型存储和计算资源消耗,同时保持推理精度。探索更高效的解码算法,提升生成任务的推理速度。 ● 设计并实现能够处理大规模并发请求的系统架构,确保极端负载下的稳定性和性能。引入容错机制、自动恢复和监控报警系统,保证系统的高可用性和稳定性。构建灵活的系统架构,支持动态扩展,以应对未来业务增长和技术演进的需求。 ● 持续关注并跟进业界技术发展,尤其是超长上下文、COT思维链、多模态融合等方向。积极尝试和探索新的推理优化方向,提出并验证创新性的解决方案。
1. MLOps平台开发打造一站式大模型开发平台,负责主流开源和闭源模型的训练、评测、蒸馏、压缩、部署全链路工具开发 ● 参与模型各种后训练如微调、蒸馏、强化学习的产品化,以及vLLM/sglang/自研推理引擎的优化,提供有竞争力的推理性能 ● 负责各种MLOps工具链开发,如AI资产管理、实验管理、血缘跟踪、评测对比等,帮助用户串联AI开发全流程,提升模型开发效率 ● 负责多模态数据自动标注和挖掘功能的开发,为智驾和具身智能客户提供新一代的数据工程解决方案 2. 企业级Agent开发平台建设 ● 建设具备全模态能力的agent开发平台,帮助客户构建RAG、chatbot、data agent、design agent、research agent等各种AI agent应用 ● 提供白盒化开发模式,建设全链路的可观测、可调试和监控能力,帮助用户构建同时具备高精度和高性价比的agent应用 ● 针对企业客户对安全隐私的强需求,构建全方位的安全防护能力,包括不限于模型安全护栏、工具沙箱、细粒度权限管控等 ● 与阿里云大数据、智能搜索等业务产品合作,建设阿里云agent工具生态
1. 数据资产体系设计与搭建: 结合部门业务特点,负责设计并指导团队构建高效的数据资产体系; 2. 数据治理体系建设: 制定和完善数据治理策略,流程与规范,推动数据治理工作落地,提升数据资产价值,为业务提供可靠的数据支持; 3. 数据应用支持: 与算法团队紧密合作,深入了解数据应用需求,提供技术方案与实现路径; 4. 团队技术指导与协作: 作为技术专家,为团队成员提供技术指导与培训,提升团队整体技术水平,参与团队技术规划与决策,解决技术难题,确保项目顺利推进。
1、深入理解客户业务需求,帮助客户选择适合其业务场景的技术路径和产品组合,利用AI技术知识、架构方法、咨询技能来影响客户技术决策 2、熟悉大模型算法工程化,与客户合作进行模型训练、推理和模型应用等POC,含展示功能、调整模型、优化模型性能、测试分析、Agent搭建、模型调用等内容 3、依据客户需求和技术研判,推动产研部门持续优化产品,助力提升产品竞争力,同时沉淀最佳实践,以及脚本、模板、参考架构等可复用的技术资产 4、持续跟踪行业动态和技术趋势,并与产品团队协作,打造创新的人工智能(大模型、智算、一体机等)解决方案 5、支持市场活动,作为领域专家参与市场洞察、行业标准、市场排名报告、白皮书撰写等活动,并在行业峰会、技术沙龙等市场活动中进行技术传播和分享