logo of alibaba

阿里巴巴业务技术-AIGC 算法工程师(模型推理加速)-杭州

社招全职2年以上地点:杭州状态:招聘

任职要求


1. 熟悉 Stable Diffusion、LLM 等架构原理,2年以上工作经验。
2. 精通 PyTorch/TensorRT 等框架底层机制,具备模型剖…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责视觉生成模型(Diffusion Model) 的全流程加速优化,涵盖训练效率提升、推理时延优化、显存压缩等核心环节。
2. 研发前沿模型压缩技术,探索量化、蒸馏、剪枝等方法在图像/视频生成场景的创新应用。
3. 与产品团队深度协作,推动算法优化成果在 AIGC 实际场景的规模化落地。
4. 依托淘天集团亿级图像/视频数据的真实业务场景,直面高并发、低延迟的推理性能优化挑战,通过模型压缩、量化、编译优化等技术,在保障精度的同时实现推理效率的指数级提升。 你的算法优化将直接驱动用户体验升级,见证技术成果的规模化落地。
包括英文材料
大模型+
PyTorch+
还有更多 •••
相关职位

logo of alibaba
实习阿里国际2026

关于我们: AI Business 成立于2023年4月,是阿里国际数字商业集团设立的一层业务组织,专注于大模型技术能力建设和 AI 原生应用和产品的打造,旨在用最先进的 AI 技术重塑平台竞争力,为商家和用户带来极致电商体验。 作为跨境电商领域的 AI 先锋,我们坚定地相信人工智能对塑造未来电商的关键作用,并坚持对 AI 领域人才的培养和发展。我们已经汇聚了业内顶尖的 AI 算法专家、AI 工程师和AI产品团队,并诚挚邀请有共同使命感、追求创新与卓越的 AI 人才加入我们的团队,共同用AI技术书写数字商业领域的新篇章。 职位描述: 1、负责多语言大语言模型(LLM)的预训练、微调及优化,探索高效训练策略(如低资源语种能力迁移、任务调度优化等),提升模型性能与跨文化场景适应性; 2、构建多模态大模型技术体系,包括图文生成、视频内容生成、多模态检索与信息抽取,支持商品虚拟试穿、智能客服等业务场景。 3、推动大模型与业务深度融合,开发基于LLM的对话系统、Agent产品及RAG系统,优化电商文本生成、跨语言信息匹配、时间序列预测等场景的智能决策能力; 4、设计强化学习对齐算法(如RLHF/DPO),提升模型在垂直领域(如商品推荐、用户交互)的精准度与可控性。 4、实现大模型的高效推理部署,包括模型压缩量化、GPU并行计算优化(如CUDA加速),确保高并发场景下的服务稳定性; 5、探索生成式AI与电商场景结合的前沿技术(如AIGC内容生成、多模态商品检索),推动技术规模化落地。

更新于 2025-03-21杭州
logo of vivo
实习

1、跟进业界 AIGC(SD、GAN、LLM等)在图像生成、编辑、理解等方向的前沿进展,探索图像、文字、视频等多模态生成与编辑技术; 2、负责手机相册场景下的图文生成、图像画质增强、图像超分、风格迁移、可控编辑、长尾数据合成、幻觉抑制等 AIGC 相关算法的设计与优化; 3、参与 Camera 拍照、视频等图像相关算法的研发与异构部署工作,包括但不限于 3A、画质、人像算法、多模态理解算法等; 4、结合业务场景,提出具有通用性或定制化的算法解决方案,推动算法在实际产品中的落地; 5、参与大规模模型的训练与部署,持续优化模型性能与推理效率,提升整体用户体验; 6、持续进行算法创新,解决关键问题,提升团队整体技术能力。

更新于 2025-07-06杭州
logo of alibaba
社招2年以上

ꔷ 模型选型与评测:负责跟踪和深度评测业界前沿的Text/Image-to-3D模型(如混元、VAST、Meshy等),建立“文玩”品类的评测基准(Benchmark),从质量、速度、成本、可塑性等多维度输出评估报告,并参与制定技术共建方案。 ꔷ 训练框架搭建:主导或参与自建3D AIGC训练框架,实现SFT(监督微调)、PO(偏好优化)、RLHF以及模型蒸馏等全套“后训练”链路。 ꔷ 模型SFT与强化:深入“文玩”业务场景,构建高质量SFT数据集(如品类黑话、风格化),对底座模型进行微调,使其更懂品类。 ꔷ 可打印性优化:探索使用PO/RLHF技术,构建“高可打印性”偏好数据集,训练AIGC模型使其倾向于生成结构稳定、易于修复、符合制造标准的3D模型,构建核心数据与模型壁垒。 ꔷ 模型优化与部署: 负责3D生成模型的轻量化、蒸馏和加速,优化推理速度和成本,满足平台规模化应用需求。

更新于 2026-01-20杭州
logo of netease
社招3年以下网易云音乐

1、负责智能体(AI Agent)相关核心算法的研究与实现,构建具备多模态理解、规划、记忆、工具调用和任务执行能力的自主智能体体系; 2、参与大语言模型(LLM)在多轮对话、任务分解、知识检索、动作执行等环节的能力增强与优化; 3、设计并实现智能体的推理框架(Reasoning Framework),包括上下文记忆、长短期记忆融合(STM/LTM)、反思机制(Reflection Loop)、以及基于反馈的自我迭代策略; 4、负责Agent系统的工具生态构建,包括函数调用(Function Calling)、插件集成(Plugin Integration)、知识库检索(RAG)等,提升模型的可操作性与可解释性; 5、跟进业界前沿的大模型与Agent技术(如OpenAI o1、Anthropic Claude、MCP、LangChain、AutoGPT、OpenDevin等),并探索其在社交、内容、推荐、AIGC、商业化等场景的落地路径; 6、分析与解决模型在多轮推理、长上下文记忆、工具调用策略优化等过程中的技术瓶颈; 7、与产品、平台及算法团队紧密协作,将Agent能力嵌入真实业务流程中,并通过数据反馈实现持续演化。

更新于 2026-01-13杭州