logo of xiaohongshu

小红书大模型压缩算法工程师实习生

实习兼职引擎地点:北京 | 上海状态:招聘

任职要求


任职要求
1、熟悉业界主流Dense、MOE大模型架构及主要特点,能识别出模型效果及主要使用场景,支持用户大模型的选型和使用需求;
2、了解至少一种大模型服务推理部署框架,如vLLMSGLang、Dynamo等,并有过大模型服务部署的经验;
3、优秀的代码能力、数据结构和基础算法功底,熟悉C++/Py…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、参与小红书万亿级Token量推理系统构建,包括但不限于大模型智能网关、大模型弹性伸缩、推理系统优化等方向,共同打造国内领先的大模型推理系统;
2、探索负载感知的推理系统流量调度算法,如基于Prefix Cache命中率调度、基于P/D分离的流量调度、基于KVCache使用率、推理排队负载感知的流量调度、长上下文请求调度优化等,持续提升MaaS系统的稳定性、成本效益;
3、探索并跟进业界开源SOTA模型,如Qwen系列、DeepSeek系列,多维度评估模型效果并建立相关的准入体系,及时上架到MaaS系统;
4、参与MaaS系统的国产卡适配,如华为910C、阿里PPU等;
5、参与攻克大规模分布式推理系统带来的复杂挑战,通过弹性调度、容量规划、链路压测等手段提升系统健壮性,确保平台能够弹性扩展,支撑业务的飞速增长。
包括英文材料
大模型+
vLLM+
SGLang+
数据结构+
还有更多 •••
相关职位

logo of alibaba
实习阿里国际2026

关于我们: AI Business 成立于2023年4月,是阿里国际数字商业集团设立的一层业务组织,专注于大模型技术能力建设和 AI 原生应用和产品的打造,旨在用最先进的 AI 技术重塑平台竞争力,为商家和用户带来极致电商体验。 作为跨境电商领域的 AI 先锋,我们坚定地相信人工智能对塑造未来电商的关键作用,并坚持对 AI 领域人才的培养和发展。我们已经汇聚了业内顶尖的 AI 算法专家、AI 工程师和AI产品团队,并诚挚邀请有共同使命感、追求创新与卓越的 AI 人才加入我们的团队,共同用AI技术书写数字商业领域的新篇章。 职位描述: 1、负责多语言大语言模型(LLM)的预训练、微调及优化,探索高效训练策略(如低资源语种能力迁移、任务调度优化等),提升模型性能与跨文化场景适应性; 2、构建多模态大模型技术体系,包括图文生成、视频内容生成、多模态检索与信息抽取,支持商品虚拟试穿、智能客服等业务场景。 3、推动大模型与业务深度融合,开发基于LLM的对话系统、Agent产品及RAG系统,优化电商文本生成、跨语言信息匹配、时间序列预测等场景的智能决策能力; 4、设计强化学习对齐算法(如RLHF/DPO),提升模型在垂直领域(如商品推荐、用户交互)的精准度与可控性。 4、实现大模型的高效推理部署,包括模型压缩量化、GPU并行计算优化(如CUDA加速),确保高并发场景下的服务稳定性; 5、探索生成式AI与电商场景结合的前沿技术(如AIGC内容生成、多模态商品检索),推动技术规模化落地。

更新于 2025-03-21杭州
logo of alibaba
实习淘天集团T-St

T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 1. 大模型驱动的算法革新: a. 参与大模型(LLM、多模态大模型)在电商核心场景(搜索、推荐、广告、多智能体对话等)中的算法创新与应用; b. 研究大模型与经典搜推广模型的融合方案,提升模型效果与用户体验; 2. 下一代AI系统构建: a. 通过分布式训练、模型压缩、低延迟推理等技术,面向工业级应用完成千亿级参数大模型的高效训练与部署; b. 尝试生成式AI、多智能体协作等前沿方向,推动AI技术在电商领域的创新应用; 3. 大模型在亿级用户规模落地的实战: a. 直面淘宝数亿用户、百亿级行为数据的挑战,落地大模型应用; b. 参与双11、618等顶级电商场景的算法优化,见证大模型技术驱动商业增长的完整链路。 T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper

更新于 2025-08-13北京|杭州
logo of alibaba
实习淘天集团2026

1. 大模型驱动的算法革新: a. 参与大模型(LLM、多模态大模型)在电商核心场景(搜索、推荐、广告、多智能体对话等)中的算法创新与应用; b. 研究大模型与经典搜推广模型的融合方案,提升模型效果与用户体验; 2. 下一代AI系统构建: a. 通过分布式训练、模型压缩、低延迟推理等技术,面向工业级应用完成千亿级参数大模型的高效训练与部署; b. 尝试生成式AI、多智能体协作等前沿方向,推动AI技术在电商领域的创新应用; 3. 大模型在亿级用户规模落地的实战: a. 直面淘宝数亿用户、百亿级行为数据的挑战,落地大模型应用; b. 参与双11、618等顶级电商场景的算法优化,见证大模型技术驱动商业增长的完整链路。

更新于 2025-07-09北京|杭州
logo of alibaba
实习淘天集团2026

T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 1. 大模型驱动的算法革新: a. 参与大模型(LLM、多模态大模型)在电商核心场景(搜索、推荐、广告、多智能体对话等)中的算法创新与应用; b. 研究大模型与经典搜推广模型的融合方案,提升模型效果与用户体验; 2. 下一代AI系统构建: a. 通过分布式训练、模型压缩、低延迟推理等技术,面向工业级应用完成千亿级参数大模型的高效训练与部署; b. 尝试生成式AI、多智能体协作等前沿方向,推动AI技术在电商领域的创新应用; 3. 大模型在亿级用户规模落地的实战: a. 直面淘宝数亿用户、百亿级行为数据的挑战,落地大模型应用; b. 参与双11、618等顶级电商场景的算法优化,见证大模型技术驱动商业增长的完整链路。 T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper

更新于 2025-05-08北京|杭州