
文远知行大模型研发实习生(2026届在校生)
任职要求
计算机科学、人工智能、机器学习等相关专业硕士及以上学历。 熟练掌握 Python、C++等编程语言,具备扎实的代码实现能力。 深入理解深度学习理论,熟练使用至少一种深度学习框架,如 PyTorch、TensorFlow 等。 在LLM、VLM、VLA等相关领域有扎实的研究基础和实践经验,熟悉常用的大模型架构和训练方法。 具备较强的数学基础,能够运用数学工具解决实际问题。 有良…
工作职责
一、工作地点 上海 二、 负责自动驾驶领城LLM、VLM、VLA相关算法的设计与优化,探索其在自动驾驶各环节的创新应用,以提升自动驾驶系统的整体性能和安全性。 基于海量自动驾驶数据,进行模型训练和调优,挖掘数据价值,构建高质量数据集,提高模型的泛化能力和准确性。 开发基于大模型的数据分析工具和平台,为自动驾驶研发提供数据驱动的决策支持,推动自动驾驶技术的持续进步。 推动大模型算法在实际自动驾驶产品中的部署与落地性,满足自动驾驶在各种场景下的应用需求。 三、
1、负责大模型研发的全流程工作,包括但不限于数据、训练、评测、推理部署; 2、LLM算法应用研究与算法落地工作,包括但不限于语言LLM、多模态大模型,VLM,Agents/SFT/RL等相关前沿技术; 3、持续探索在各种用户场景下,利用AI能力增强业务迭代效果; 4、深度参与产品研发项目,和产品经理/业务研发同学密切配合,提高项目整体收益。
T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 你的挑战: 攻克LLM全链路训练难题:主导大模型训练,优化模型Scaling Law,结合应用需求突破分布式性能瓶颈,基于RL增强模型推理能力,打造电商领域最懂用户需求的超级大脑(含多模态VLM研发)。 为什么选择淘天? 1.坐拥电商领域最大规模场景:每天处理数亿次用户交互,覆盖搜索/推荐/广告/客服/营销全链路,你将直接面对全球最复杂的电商需求场景。 2.定义未来购物标准:你研发的模型将服务数亿消费者,结合大语言和多模态模型能力满足用户偏好,影响海量商家经营决策。 3.顶级科研配置:超大规模GPU集群支持大规模参数模型训练,自研分布式框架实现训练推理效率大幅提升,顶级会议发表,前沿技术成果即时输血。 加入我们,你将获得: 1.与NLP/多模态领域顶尖团队共创,解锁大模型在商品理解、智能创作、消费决策、购物对话等场景的无限可能。 2.弹性化的技术路线选择权,既可在大模型基础技术方面突破能力上限,也可深入应用层打造现象级AI产品。 3.打通产学研用全链路:支持技术成果转化顶会论文和专利+百万级ai native用户产品。 T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper ꔷ 投递T-Star实习生,提前解锁淘天顶级技术岗位,实习与T-Star正式批/应届秋招投递不冲突。拿到T-Star意向书的同时,将获得直通正式批次终面的机会;参与T-Star实习且表现优秀的同学,提供T-Star转正Offer。
岗位课题: 1.电商视频生成模型研发 2.多个视频应用模型研发 3.原生支持中文的图像生成模型研发 4.有语义泛化性的图像编辑模型研发 课题背景: AIGC 生成已成为广告创意制作的主流制作形式,基于AIGC 图像和视频生成模型提供了丰富的素材并持续提升创意制作的美观度和多样性。同时视频和图像生成模型也是各科技公司在AI 领域争夺的中心领域之一。 阿里妈妈在过去两年从业务需求出发,持续研发电商领域的多模态生成模型,推出了淘宝星辰视频生成模型、图生视频模型、短视频模型、服饰模特生图模型、图文海报制作等多个原创能力,并成功落地万相营造、万相台无界版、千牛、光合平台、生意管家等多个工具平台和展示、搜索、外投等多个投放场景的创意制作。 岗位职责: 你将有机会参与核心多模态大模型研究工作,深入到数据准备 | Caption | 训练系统搭建 | Encoder | Pretraining | Continuous training | SFT | Post training 等多模态生成的方方面面, 亲手解决大模型研发的问题,并最终交付电商场景领先的生成模型,以及有机会提前获得校招T-Star的正式Offer。

作为大模型算法工程师(应届生),您将加入哈啰出行AI团队,参与出行领域大模型算法应用研发,通过构建智能Agent系统优化业务全流程。直接参与亿级用户规模的AI项目,用技术推动出行变革。 1.大模型研发与优化:参与出行领域大模型(如LLM、多模态模型)的微调与优化,针对业务场景(如需求预测、路径规划、客服交互)进行模型适配。 探索轻量化模型部署方案,平衡性能与资源消耗,适配移动端及边缘计算场景。 2.Agent系统开发:协助开发智能Agent(如调度Agent、客服Agent、风控Agent),实现自动化任务处理与实时决策。参与设计多Agent协同框架,优化跨业务场景(如单车-打车联动、租车-保险推荐)的交互逻辑。 3.算法场景落地:深入理解两轮/四轮出行、租车等业务痛点,通过AI技术辅助提升运营效率(如动态定价、营销推荐、用户留存)。与产品、运营团队协作,将算法能力转化为可落地的功能模块。 4.技术创新与学习:跟踪AI领域前沿技术(如强化学习、联邦学习、生成式AI),参与技术预研项目。 在导师指导下完成从理论到实践的转化,提升技术落地能力。