阿里巴巴业务技术-大模型算法专家-急招
任职要求
1. 学历背景 • 计算机科学、人工智能、数学、电子工程等相关专业硕士及以上学历 2. 技术能力 • 精通深度学习和机器学习基础理论,熟悉Transformer架构及LLM原理 • 熟练掌握PyTorch/TensorFlow等深度学习框架 • 精通Python编程,熟悉Java/C++中至少一门语言 • 具备分布式训练、大规模数据处理等工程能力 3. 经验要求 • 2 年以上大模型相关算法研发经验 • 有SFT、强化学习等后训练技术实践经验 • 具备…
工作职责
你可以获得: • 参与前沿AI技术研发,引领行业技术发展 • 与顶尖技术团队协作,攻克技术难题 • 技术成果直接服务海量用户,创造实际价值 • 完整的技术成长路径和职业发展机会 1. AI应用系统构建 • 设计和构建基于大模型的AI应用系统,包括智能客服、代码助手、AI运维等产品 • 运用指令微调(SFT)、强化学习(RLHF/DPO)等技术优化模型在特定场景的表现 • 构建完整的AI应用架构,涵盖数据处理、模型部署、用户交互等全链路 2. Agent智能体开发 • 设计和实现智能Agent系统,具备任务规划、工具调用、多轮交互等核心能力 • 构建多Agent协同框架,实现智能体间的分工协作和知识共享 • 探索Agent在复杂业务场景中的应用模式,如自动化运维、智能分析等 3. 业务场景优化 • 深入理解业务需求,将AI技术与实际场景深度结合,提升用户体验 • 优化AI应用在多轮对话、知识问答、决策支持等场景的效果和效率 • 与产品和工程团队协作,推动AI应用从原型到生产的完整落地
1. 负责大模型(LLM/MLLM)核心技术研发,包括预训练、垂域SFT、RLHF等,持续追踪和应用领域最新技术进展; 2. 负责大模型性能优化:研发模型加速技术,如量化、剪枝与知识蒸馏;优化数据特征与调度策略;构建高效推理链路、提升运行速度及降低成本; 3. 基于淘天用户丰富的消费行为,打造技术先进的电商用户理解大模型,提升对用户的异构行为本质的认知能力,支撑用户个性化的搜索、商详、互动等多种电商业务场景; 4. 基于淘天海量商品数据,打造技术先进的电商多模态大模型,提升对多模态异构的商品数据(图、文、视频等)的理解能力和结构化能力,输出底层算法能力和高质量结构化数据,支撑多种电商业务场景,并面向商家和消费者探索AIGC等创新业务应用; 5. 持续跟踪、探索大模型/多模态大模型方向的前沿技术,将各方向的SOTA能力集成到模型底座上,提升下游任务的效果,打造团队的技术先进性。

1.联动业务团队主导搜索体验优化,提升相关性、召回准确率和用户满意度 2.设计并优化搜索算法策略,包括query理解、召回、排序、个性化等核心环节 3.负责搜索架构的维护与升级,保障系统稳定性和性能 4.推动搜推一体,结合大模型推动生成式技术提升搜索体验 5.通过数据分析发现问题,持续迭代优化搜索策略
我们是谁? 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现厘米级高精地图、实时三维重建、多模态感知等核心技术的引擎,持续突破自动驾驶、AR导航、智慧交通等领域的技术边界。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 岗位职责: 团队主要聚焦多模态大模型及端到端模型在车端导航及定位应用,我们期待你的工作将覆盖以下至少一个技术方向即可: 1. 在端到端自动驾驶、BEV环境感知、多模态融合、强化学习等领域具备丰富且有独创性的研究经历; 2. 探索多模态大模型在下游任务中的技术能力,包括但不限于图文对齐/识别、跨模态理解生成、多模态检索、VLM端到端自动驾驶、世界模型等; 3. 了解大模型模型的训练/微调/推理加速方法,包括但不限于模型结构调优、训练效率提升、高效低成本微调、Muti-token推理,模型部署加速等; 4. 参与自动驾驶系统中机器学习算法的研究、开发与优化,包括但不限于深度学习算法在端到端感知大模型、规控大模型、视觉语言大模型等方面的应用; 5. 负责收集、整理和分析自动驾驶相关的数据集,进行数据预处理和标注,以提高模型的准确性和复杂场景泛化能力; 6. 设计和实现端到端自动驾驶模型的训练流程,包括选择合适的优化算法、调整超参数、评估模型性能等,确保模型在不同场景下的稳定性和可靠性。
1、全面跟进当前生成式模型及AI领域的能力边界,面向淘天集团复杂工程体系及海量数据建设智能化研发AI能力 2、主导基于大模型的AI Agent全生命周期研发,包括通用型及垂直领域AI Agent的架构设计、模型训练与评测; 3、运用知识图谱抽取、数据合成等方案,基于实际场景设计并持续优化领域知识语料,以及数据标注方法,优化机模型运料; 4、运用SFT、RL等Post-training训练方法,提升大模型在自主规划(Planning)、多步推理、RAG增强生成、工具调用、数据问答、文案生成等方面的能力; 5、持续优化Agent算法与系统架构,构建端到端的智能体评测体系,开发自动化评估工具与多维评价指标,提升Agent系统性能与效率,打造业内领先的AI Agent技术方案。