阿里云阿里云智能-大模型算法专家/高级专家-北京/杭州
任职要求
1. 有大模型应用系统设计、分布式训练、大模型推理优化等实践经验优先; 2. 人工智能、计算机等相关学科的硕士及以上学历,在近3年内有国际顶会文章,或在知名开源项目、企业级大模型平台有核心贡献的优先; 3. 自我驱动力,动手能力强,对AI行业有浓厚的兴趣,较强的学习能力和责任心; 4. 熟练掌握pytorch等深度学习框架,熟悉python语言,优秀的coding/工程能力,良好的编码能力和编码风格; 5. 有良好的沟通能力和团队协作能力。 备注:持有阿里云ACA/ACP/ACE认证证书者优先
工作职责
1. 负责大模型(含多模态)及下游任务的训练及优化突破,包括但不限于:异构GPU混合训练和推理加速算法;对齐、强化学习、混合专家等大模型核心训练技术。 2. 分析和解决大模型在领域应用中的技术难题并进行突破,并与业界先进技术进行持续对比。 3. 持续关注业界最新研究动向和技术趋势,对技术方向研判选型,并进行落地。 4. 与产品和工程团队紧密合作,将先进的算法技术应用于实际产品开发。
1. 负责语音合成、语音识别、端到端语音交互大模型算法的基础研究和应用落地; 2. 参与语音合成与识别技术在业务场景落地,解决落地过程中的前沿问题,持续优化语音合成与识别核心技术效果; 3. 深入调研和关注音频/NLP/多模态/全模态等方向的前沿技术,持续探索语音技术的新能力和新应用。
1. 探索研究多模态理解、多模态生成、计算机视觉、自然语言处理、音频等前沿技术; 2. 参与研发多模态、全模态大模型等下一代人工智能核心技术,探索大规模/超大规模多模态理解与生成交织的基础模型,提升大模型能力; 3. 负责跟踪和研究多模态大模型前沿技术调研、落地、对业务进行优化。
● 设计和实现高效的训练推理框架,提升多节点、多GPU环境下特别是异构算力场景下的计算效率。具备良好的工程实践和算法理论基础,熟悉底层的硬件编程和常见GPU的算子库开发,能对算法的运行效率如速度、显存占用等进行优化,推动算法稳定、高效的运行。 ● 完善优化训练推理框架,针对市面上的国产信创卡能提出统一的优化方案,并推进在底层的通信效率、资源占用、稳定性方面持续建设。 ● 设计并实现能够处理大规模并发请求的系统架构,确保极端负载下的稳定性和性能。完善错误自愈机制,提升平台训练的MFU,打造行业内一流的异构算力混训混推GPU框架。 ● 技术方案设计:主导核心模块技术方案设计与评审,结合业务需求与系统现状,制定可落地的架构规划。 ● 基础服务开发:构建高可用、可扩展的基础服务组件,支持训练/推理框架的快速迭代与稳定部署。 ● 项目管理:主导跨团队协作项目的全生命周期管理,包括需求拆解、排期规划、进度跟踪与风险控制,确保项目高效交付。 ● 持续关注并跟进业界技术发展,比如超长上下文、端到端推理思维链、多模态等方向。
1. 负责大模型(LLM/MLLM)核心技术研发,包括预训练、垂域SFT、RLHF等,持续追踪和应用领域最新技术进展; 2. 负责大模型性能优化:研发模型加速技术,如量化、剪枝与知识蒸馏;优化数据特征与调度策略;构建高效推理链路、提升运行速度及降低成本; 3. 基于淘天用户丰富的消费行为,打造技术先进的电商用户理解大模型,提升对用户的异构行为本质的认知能力,支撑用户个性化的搜索、商详、互动等多种电商业务场景; 4. 基于淘天海量商品数据,打造技术先进的电商多模态大模型,提升对多模态异构的商品数据(图、文、视频等)的理解能力和结构化能力,输出底层算法能力和高质量结构化数据,支撑多种电商业务场景,并面向商家和消费者探索AIGC等创新业务应用; 5. 持续跟踪、探索大模型/多模态大模型方向的前沿技术,将各方向的SOTA能力集成到模型底座上,提升下游任务的效果,打造团队的技术先进性。