阿里巴巴淘宝平台事业部-大模型算法专家-量化计算
任职要求
1. 自然语言处理、人工智能、机器学习、计算机等相关专业硕士及以上学历; 2. 具备扎实的编码能力,精通至少一种编程语言,如C/C++、JAVA、Python等,熟悉至少一种开源深度学习框架,如Tensorflow、Pytorch等; 3. 具…
工作职责
量化计算部为淘天集团核心技术力量,部门通过大模型和量化算法的深度应用支持淘天集团各业务进行精准商业决策,目前覆盖淘宝天猫、1688、阿里资产、闲鱼、淘海外、金融等业务的营销、定价、估值、风控等诸多领域。 1. 基于手淘、闲鱼等核心行业,搭建智能体,深度理解买卖家的需求,包括但不限于用户多模态异构行为序列的意图分析能力、推理能力、大模型在线推理加速能力等; 2. 深入理解淘宝的业务特点,运用SFT、RL等Post-training训练方法,提升大模型对‘价格’背后的语义信息理解,推动定价相关的业务落地; 3. 面对海量的非结构化数据(文本、图片、语音等),优化大模型推理速度,解决实际落地中的性能问题; 4. 探索大模型定价技术前沿,如AIGP生成式权益定价,建模权益定价的约束轨迹和目标优化关系,从而取得更好业务收益。
1、与业务需求结合,设计并落地创新型实验及准实验,提升实验的效率和洞察深度,探索机器学习技术、动线挖掘、模型预测等方法在因果推断中的应用场景,解决观测数据中因果关系的识别,研发新型因果推断方法,优化业务决策; 2、从理解业务问题到因果因推断相关领域方法论研究、原型验证、直到与工程团队合作将成熟的技术产品化,推动方法从理论到实践的转化。设计可扩展的实验框架,支持大规模、多场景下的因果推算与效果评估; 3、负责通过AB实验设计、因果推断、深度学习等手段,量化运营策略效果和价值,科学评估运营手段,为业务决策提效。
1. 设计与开发基于LLM的智能体系统架构,实现复杂任务规划、工具调用、记忆存储等核心功能 2. 构建多智能体协作框架,探索Agent间的通信协议与协同决策机制 3. 集成外部工具API(搜索引擎/数据库/专业软件),扩展Agent能力边界 4. 优化Agent的实时交互能力,包括对话流畅性、任务分解准确性、异常处理鲁棒性 5. 开发Agent评估体系,设计自动化测试场景与量化评估指标 6. 研究Agent持续学习机制,实现长期记忆存储与经验复用
1.负责主流大模型(DeepSeek、通义、LLaMA等)的全栈性能优化,涵盖模型架构优化、训练/推理框架调优及底层算子优化,提升模型在单机/集群场景下不同GPU/NPU硬件平台的运行效率 2.开发创新推理加速方案,通过投机采样算法改进、MTP机制优化等框架级特性,提升MOE架构模型推理效率;并通过优化集群并行推理场景的专家负载均衡、计算/通信 Overlap 等特性,提升集群级别的推理效率 3.完成 W8A8 等量化算法研发,并在框架层面支持量化模式下的 TP、EP 等并行模式的性能优化 4.针对多种计算架构(NVIDIA/AMD GPU、国产化 NPU 等)进行深度硬件适配,开发高性能算子库与内存管理组件,实现跨平台性能优化与资源利用率的提升
我们是谁? 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现厘米级高精地图、实时三维重建、多模态感知等核心技术的引擎,持续突破自动驾驶、AR导航、智慧交通等领域的技术边界。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 岗位职责: 1. 多模态大模型研发与应用 负责多模态大模型的核心架构设计,研究并实现图片、视频、文本等跨模态特征对齐、融合与表征学习方法,负责多模态大模型的数据准备、高效训练(包括但不限于预训练、SFT、强化学习等)、推理加速等。 2. 模型优化与小型化部署 负责多模态大模型的轻量化设计、压缩与加速,确保模型在端侧设备上的高效运行。 针对高德地图的实际业务场景,优化模型性能,平衡精度与效率。 3. 创新性研究与落地 跟踪端侧生成式AI(Edge Generative AI)、强化学习(PPO、GRPO等)、智能Agent等前沿技术,探索多模态大模型在自动驾驶、智能导航等领域的潜在应用。 将研究成果快速转化为实际产品功能,推动技术创新与业务增长。