logo of antgroup

蚂蚁金服蚂蚁集团-推广搜推理引擎工程师-北京/杭州

社招全职3年以上技术-开发地点:北京 | 杭州状态:招聘

任职要求


1.计算机相关学科优秀院校毕业的研究生,基本功扎实,3~5年及以上相关工作经验
2.精通linux c++开发,熟悉cuda开发,熟悉python等语言开发
3.熟悉主流深度学习框架tensorflowpytorch,了解推荐广告稀疏模型的推理过程
4.熟悉模型推理引擎并有相关经验,如TensorRT/TVM/IREE/ONNXRuntime;了解图编译技术如XLA/MLIR/TVM等

工作职责


1.负责推荐业务模型推理全流程研发,支持蚂蚁集团推广搜等场景的模型打分业务。
2.深度优化GPU/CPU模型推理效率,打造高吞吐低延迟的模型推理服务。
3.支持大规模稀疏模型的分布式存储、实时更新、低延迟通信,提供行业先进的推理引擎
4.探索下一代推荐引擎,优化基于大规模稠密参数的推荐服务
包括英文材料
Linux+
C+++
CUDA+
Python+
深度学习+
TensorFlow+
PyTorch+
推理引擎+
TensorRT+
相关职位

logo of alibaba
社招技术类-开发

业务介绍: 我们是阿里巴巴国际数字商业集团的智能技术团队,负责阿里巴巴旗下多个国际化电商平台的搜索、推荐、广告、用增等技术。团队致力于将最前沿的AI技术与国际化电商业务问题深度结合,为用户打造更好更智能化的网上购物体验,同时赋能百万商家实现更高效的经营。 选择加入我们意味着投身入于高速发展的国际化电商业务,一起打造最先进的AI技术以驱动全球电商业务发展。 岗位描述: 1、负责支持业务迭代:推进来自搜索、推荐、广告、用增各域的产品需求快速落地。 2、负责系统架构设计:负责搜索、推荐、广告引擎的架构设计与优化,支撑多语言场景下的高并发请求处理,满足全球用户低延迟、高可用的服务需求。 3、负责性能调优:针对召回排序、模型训练&推理、特征计算等模块进行工程性能优化(如分布式计算加速、内存管理、GPU资源调度等),提升算法迭代效率。 4、负责工程平台开发:构建算法与工程协同的标准化平台,包括特征实时化平台、在线推理服务框架、AB实验平台等,支持算法快速迭代与业务效果验证。 5、负责大模型工程优化:负责生成式AI技术的工程落地,包含大模型训练、推理加速、多模态内容生成等技术工作。 补充说明:同时也招聘面向25年应届毕业的同学;

更新于 2025-04-02
logo of alibaba
社招技术类-开发

团队与角色介绍: 我们是阿里巴巴国际数字商业集团(AIDC)的智能技术-智能引擎团队,负责支撑包括Lazada、AliExpress、Miravia、Daraz等在内的阿里巴巴全球化电商平台的搜索、推荐、广告、用户增长等核心技术。我们致力于将AI领域最前沿的技术(如深度学习、大模型、Agent等)与全球化电商业务的复杂挑战深度融合,持续打造更智能、更极致的全球购物体验,并赋能数百万商家实现数字化经营提效。 岗位描述: 1、负责算法工程平台建设:构建算法与工程协同的标准化平台,包括特征平台、训练平台、在线推理框架等,支持算法在模型侧的快速迭代与业务效果验证。 2、负责大模型工程优化:负责生成式AI技术的工程落地,包含大模型训练、推理加速等技术工作。 3、负责AI创新应用探索:探索AI在搜推广场景的创新应用,如生成式召回,生成式排序、行为大模型等,以及AI agent在智能运维、资源优化、客服助手等场景上的应用。 补充说明:同时也招聘面向25年应届毕业的同学;

更新于 2025-06-19
logo of amap
社招2年以上技术类-算法

团队介绍: 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现高精度地图、三维重建、LLM/VLM,AI Agent等核心技术,持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕,更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。 作为高德地图的核心技术驱动部门,我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心,推动智能出行与真实世界连接的深度融合。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 1、跟进AI Agent领域最新技术动态,围绕LLM大模型、Agent框架、LLM Reasoning技术(如思维链、多步推理)、优化复杂查询的Deep Research模式、长期记忆机制、自动化数据合成、指令微调(Instruction Tuning)、偏好对齐(RLHF/DPO)等技术,持续推动算法创新与落地; 2、开展LLM Agent技术研发,构建端到端Agent系统,涵盖意图识别、知识检索、结果生成与偏好对齐,推动相关技术研究与算法落地,提升用户体验。

更新于 2025-09-11
logo of amap
社招3年以上技术类-算法

团队介绍: 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现高精度地图、三维重建、LLM/VLM,AI Agent等核心技术,持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕,更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。 作为高德地图的核心技术驱动部门,我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心,推动智能出行与真实世界连接的深度融合。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 我们正在寻找对多模态技术充满热情的算法工程师,加入我们的研发团队。您将专注于多模态理解与生成,推动其在高德扫街榜等热门应用中落地,为用户提供更智能、更沉浸的服务。 主要职责: 1、多模态大模型研发:开发业界领先的图文多模态大模型,实现高质量场景理解和内容生成; 2、模型优化与性能提升:优化多模态模型的推理速度和计算效率,支持端侧部署。探索适合大模型的压缩与加速技术(包括但不限于量化、剪枝、知识蒸馏等); 3、业务场景落地:将多模态技术应用于扫街榜等实际业务场景,与产品、工程团队合作,推动技术从研发到上线的全流程落地; 4、前沿技术探索:持续跟踪生成式AI、跨模态对齐、思维链、强化学习、多模态交互等最新技术趋势,提出创新性解决方案。

更新于 2025-09-29