logo of alibaba

阿里巴巴业务技术-AIGC 算法工程师(模型推理加速)-杭州

社招全职2年以上地点:杭州状态:招聘

任职要求


1. 熟悉 Stable Diffusion、LLM 等架构原理,2年以上工作经验。
2. 精通 PyTorch/TensorRT 等框架底层机制,具备模型剖析与性能调优实战经验。
3. 有模型分析、算子开发以及性能优化、算子测试等工作优先。
4. 在 AIGC 基础算法原理上有创新工作,有相关领域顶会论文者优先。

工作职责


1. 负责视觉生成模型(Diffusion Model) 的全流程加速优化,涵盖训练效率提升、推理时延优化、显存压缩等核心环节。
2. 研发前沿模型压缩技术,探索量化、蒸馏、剪枝等方法在图像/视频生成场景的创新应用。
3. 与产品团队深度协作,推动算法优化成果在 AIGC 实际场景的规模化落地。
4. 依托淘天集团亿级图像/视频数据的真实业务场景,直面高并发、低延迟的推理性能优化挑战,通过模型压缩、量化、编译优化等技术,在保障精度的同时实现推理效率的指数级提升。 你的算法优化将直接驱动用户体验升级,见证技术成果的规模化落地。
包括英文材料
大模型+
PyTorch+
TensorRT+
性能调优+
算法+
相关职位

logo of alibaba
实习阿里国际2026

关于我们: AI Business 成立于2023年4月,是阿里国际数字商业集团设立的一层业务组织,专注于大模型技术能力建设和 AI 原生应用和产品的打造,旨在用最先进的 AI 技术重塑平台竞争力,为商家和用户带来极致电商体验。 作为跨境电商领域的 AI 先锋,我们坚定地相信人工智能对塑造未来电商的关键作用,并坚持对 AI 领域人才的培养和发展。我们已经汇聚了业内顶尖的 AI 算法专家、AI 工程师和AI产品团队,并诚挚邀请有共同使命感、追求创新与卓越的 AI 人才加入我们的团队,共同用AI技术书写数字商业领域的新篇章。 职位描述: 1、负责多语言大语言模型(LLM)的预训练、微调及优化,探索高效训练策略(如低资源语种能力迁移、任务调度优化等),提升模型性能与跨文化场景适应性; 2、构建多模态大模型技术体系,包括图文生成、视频内容生成、多模态检索与信息抽取,支持商品虚拟试穿、智能客服等业务场景。 3、推动大模型与业务深度融合,开发基于LLM的对话系统、Agent产品及RAG系统,优化电商文本生成、跨语言信息匹配、时间序列预测等场景的智能决策能力; 4、设计强化学习对齐算法(如RLHF/DPO),提升模型在垂直领域(如商品推荐、用户交互)的精准度与可控性。 4、实现大模型的高效推理部署,包括模型压缩量化、GPU并行计算优化(如CUDA加速),确保高并发场景下的服务稳定性; 5、探索生成式AI与电商场景结合的前沿技术(如AIGC内容生成、多模态商品检索),推动技术规模化落地。

更新于 2025-03-21
logo of vivo
实习

1、跟进业界 AIGC(SD、GAN、LLM等)在图像生成、编辑、理解等方向的前沿进展,探索图像、文字、视频等多模态生成与编辑技术; 2、负责手机相册场景下的图文生成、图像画质增强、图像超分、风格迁移、可控编辑、长尾数据合成、幻觉抑制等 AIGC 相关算法的设计与优化; 3、参与 Camera 拍照、视频等图像相关算法的研发与异构部署工作,包括但不限于 3A、画质、人像算法、多模态理解算法等; 4、结合业务场景,提出具有通用性或定制化的算法解决方案,推动算法在实际产品中的落地; 5、参与大规模模型的训练与部署,持续优化模型性能与推理效率,提升整体用户体验; 6、持续进行算法创新,解决关键问题,提升团队整体技术能力。

更新于 2025-07-06
logo of kuaishou
社招D7630

1、负责全国TOP级别的直播电商在B端业务场景中大模型的技术落地,支持业务目标提升; 2、负责大模型在智能经营、诊断分析、多模态创意生成等内容生成类场景中的应用,降低平台和商家的运营成本,提升运营效率; 3、负责大型语言模型的微调、偏好对齐、知识增强等技术探索,积极跟进AIGC业内应用趋势,包括并不限于多模态、RLHF、Agent等方向; 4、负责低代码平台与AI大模型应用场景落地(D2C、AI生成业务流程等),采用先进的算法工程方法,打造下一代AI低代码研发体系。

更新于 2025-04-22
logo of aliyun
实习阿里云2026届

阿里云持续推进AI 技术深化战略布局, 围绕AI 和云计算的基础设施建设、AI基础模型平台、企业级AI应用方向构建核心场景。为此,我们正积极招募优秀人才: 1、智能预测与风控体系构建: 支持相关产品与能力的构建,包括销量预测、智能预警、异常检测、行为序列预测等场景。跟踪时序预测、时空预测、序列预测、异常检测、可解释机器学习、联邦学习、流程挖掘等前沿算法,并合理运用到实际产品中; 2、AI智能&NLP: 参与对话系统、舆情监控、知识图谱等自然语言理解与生成相关应用,构建领域内容大模型。设计并优化预训练语言模型,进行高效微调、模型压缩、推理加速等工作,将NLP、多模态内容理解和生成技术运用于实际产品中; 3、行业趋势与技术跟踪: 持续跟踪行业最新趋势和技术动态,通过深度行业洞察和市场分析,及时预警潜在问题,提出前瞻性的解决方案; 4、产品优化与决策支持: 参与供应链的数字化项目,推动技术实现与业务落地,提升决策质量、速度、规模和可解释性; 5、跨部门协作与项目落地: 与协作部门紧密合作,规划与设计数据集,推动供需预测相关问题解决,确保项目落地并取得预期结果。

更新于 2025-04-23