logo of alibaba

阿里巴巴淘天算法技术-搜索多模态大模型应用算法工程师-杭州/北京

社招全职地点:北京 | 杭州状态:招聘

任职要求


1. 自然语言处理机器学习数据挖掘、人工智能等相关专业的硕士生/博士生;
2. 熟悉多模态/大语言模型的基本原理和相关算法,如BLIP2、CLIP、GPTGPT-4等;
3. 熟练掌握TensorflowPytorch深度学习框架,扎实的编程基础,具备独立的算法实现能力;
4. 有LM实操经验,参与过大模型预训练,SFT,RLHF等项目者优先;
5. 良好的逻辑分析能力和数理基础,对算法原理及应用有较深入的理解,在人工智能相关的各类国际顶级会议/期刊中发表过论文者优先。

工作职责


1.跟进多模态大模型 (VLLM)预训练、SFT、RLHF等技术,调研与跟进最新进展;负责多模态相关性大模型、多模态大模型稀疏检索和稠密模型,多模态大模型个性化预训练方向,以及多模态大语言模型的训练和推理加速;
2. 多模态大模型个性化预训练:研发个性化预训练模型,探索在训练样本、模型参数量等维度上scale-up能带来的收益,研究在电商搜索场景下,CTR和CVR 模型中用户动线特征的挖掘和应用,包括用户行为模型的获取、特征设计、结构优化等个性化建模;
3. 多模态大模型的训练和推理加速:协助研究和开发多模态大语言模型的加速技术,包括但不限于量化、剪枝和蒸馏,以及数据特征和调度优化;实现和优化多模态大模型推理框架,以提高推理速度和效率;与工程团队合作,解决机器学习模型在部署过程中的性能问题;
4. 多模态大模型相关性模型:研发基于多模态大模型的相关性标注和评测大模型,应用到体验实验评测、体验监控、离线数据标注、线上相关性判断等方向;
5. 多模态大模型稀疏检索和稠密模型:研究方向包括不限于:电商词表生成、多模态稀疏词表和稠密表征技术、LLMs幻觉缓解等问题。
包括英文材料
NLP+
机器学习+
数据挖掘+
算法+
GPT+
TensorFlow+
PyTorch+
深度学习+
大模型+
SFT+
相关职位

logo of alibaba
实习淘天集团研究型实

1. 跟进多模态大模型(vLLM)预训练、SFT、RLHF等技术,调研与跟进最新进展;负责多模态相关性大模型、多模态大模型稀疏检索和稠密模型,多模态大模型个性化预训练方向,以及多模态大语言模型的训练和推理加速; 2. 多模态大模型个性化预训练:研发个性化预训练模型,探索在训练样本、模型参数量等维度上scale-up能带来的收益,研究在电商搜索场景下, CTR和CVR 模型中用户动线特征的挖掘和应用,包括用户行为模型的获取、特征设计、结构优化等个性化建模; 3. 多模态大模型的训练和推理加速:协助研究和开发多模态大语言模型的加速技术,包括但不限于量化、剪枝和蒸馏,以及数据特征和调度优化;实现和优化多模态大模型推理框架,以提高推理速度和效率;与工程团队合作,解决机器学习模型在部署过程中的性能问题; 4. 多模态大模型相关性模型:研发基于多模态大模型的相关性标注和评测大模型,应用到体验实验评测、体验监控、离线数据标注、线上相关性判断等方向; 5.多模态大模型稀疏检索和稠密模型:研究方向包括不限于:电商词表生成、多模态稀疏词表和稠密表征技术、LLMs幻觉缓解等问题。

更新于 2025-05-06
logo of liauto
校招算法与软件

1. 负责大语言模型以及多模态大模型的预训练、精调等研发及落地; 2. 负责大模型智能体记忆、规划、工具、RAG能力的研发以及大模型应用的研发。

logo of alibaba
实习淘天集团2026

1. 大模型驱动的算法革新: a. 参与大模型(LLM、多模态大模型)在电商核心场景(搜索、推荐、广告、多智能体对话等)中的算法创新与应用; b. 研究大模型与经典搜推广模型的融合方案,提升模型效果与用户体验; 2. 下一代AI系统构建: a. 通过分布式训练、模型压缩、低延迟推理等技术,面向工业级应用完成千亿级参数大模型的高效训练与部署; b. 尝试生成式AI、多智能体协作等前沿方向,推动AI技术在电商领域的创新应用; 3. 大模型在亿级用户规模落地的实战: a. 直面淘宝数亿用户、百亿级行为数据的挑战,落地大模型应用; b. 参与双11、618等顶级电商场景的算法优化,见证大模型技术驱动商业增长的完整链路。

更新于 2025-07-09
logo of liauto
校招算法

1. 负责大语言模型以及多模态大模型的预训练、精调等研发及落地; 2. 负责大模型智能体记忆、规划、工具、RAG能力的研发以及大模型应用的研发。