阿里云研究型实习生 - 大语言模型的应用迁移与效果评估关键技术研究
任职要求
产出知识抽取、通用鉴赏力优化、Judge-in-the-loop等研究内容的核心算法设计与实现,协同产出一套达到开源标准的源代码,产出1-2篇高水平的学术论文。
工作职责
在人工智能领域,大语言模型(LLMs)已成为实现通用人工智能(AGI)的一大驱动力。随着计算力的提升、数据资源的丰富和算法的革新,LLMs在机器翻译、文本生成、语义理解、通用问答等诸多任务上达到了令人瞩目的成就。它们不仅在一般性任务上展现出精准的语言理解和生成能力,也在特定行业领域展现了深度定制化的应用前景。 经历过去一年的发展,业界达成共识:在国内市场,具备商业化潜力的基础模型数量将限于十个以内。在此基础上,模型的应用迁移微调成为新的主流趋势。尽管如此,LLMs在迁移学习与新任务适应中的效果波动、泛化能力不足以及对特定数据敏感性等问题凸显出挑战。这些问题突出了大模型高效应用迁移及迁移后自动评测技术的重要性,成为PAI等人工智能开发平台在大模型时代的核心竞争力所在。因此,本项目意在深入开发大模型的高效迁移方法和自动评测技术,顺应行业趋势,推进模型应用生态的健康发展。
欢迎加入阿里巴巴数字人团队! 如果你对以下领域感兴趣,并希望在实际项目中积累经验,欢迎加入我们! 你将参与的工作: 个性化数字人形象生成系统 在海量用户数据和先进技术支持下,协助开发能够生成千人千面个性化虚拟形象的系统。 学习并应用基础的图像处理和生成模型,帮助提升系统的定制化能力。 高表现力肢体表情驱动技术研发 参与研发基于动作捕捉、表情合成和实时渲染技术的数字人表情和肢体动作驱动系统。 协助优化现有技术,使数字人的表情和动作更加自然流畅,增强情感表达能力。 核心技术难题攻克 在导师指导下,学习和探索基于扩散模型的高质量数字人生成技术。 多模态统一大模型的应用 了解并参与多模态信息融合的研究,结合图像、文本、音频等多种信息,构建具备理解能力和生成能力的数字人系统。 协助解决业界尚未突破的技术瓶颈,推动技术创新。 相关研究课题细分方向: 数字人形象定制与风格化迁移 协助开发和优化数字人形象定制生成能力,适配不同的实时互动场景。 学习并应用基本的图像处理和生成算法,提升系统的灵活性和适应性。 数字人表情与肢体动作驱动 在导师指导下,参与数字人表情和肢体动作驱动技术的研发。 协助测试和优化现有系统,使其表现力更接近真人水平。 数字人多模态理解感知能力 参与构建数字人与用户的实时交互系统,提升其理解和响应能力。 协助进行多模态信息融合实验,增强数字人的个性化服务能力。 我们期待你是: 计算机科学、软件工程、人工智能等相关专业的在校学生(本科或研究生)。 对数字人技术有浓厚兴趣,愿意在实践中学习和成长。 具备一定的编程基础(如Python、C++),熟悉常用的数据处理和机器学习框架(如PyTorch、TensorFlow)者优先。 良好的团队合作精神和沟通能力。 加入我们,你将获得: 丰富的实战经验和前沿技术的学习机会。 导师一对一指导,助力你的职业发展。 参与影响亿级用户的大规模项目,感受技术带来的巨大价值。 开放包容的工作环境和充满活力的团队氛围。 让我们一起定义未来数字人的无限可能,期待你的加入!
1. 探索多模态(去ID化)在电商冷启场景的落地,优化冷启商品/内容的分发效率; 2. 探索冷启动与跨域推荐,构建可迁移的统一冷启推荐大模型,实现不同业务场景下的高效迁移和应用; 3. 优化大规模模态编码器的训练及推理策略,提高资源利用效率,降低模型训练时间和GPU内存消耗; 4. 结合以上方向的探索和研究,撰写发表论文,和业界、学术界保持良好的交流。
我们是淘天集团淘宝用户算法团队,致力于通过外投广告、商品推荐、权益激励与消息触达等,全面提升淘宝用户的增长效率与长期价值。团队聚焦用户全生命周期管理,以算法驱动精细化运营,持续优化获客效率、增量GMV与用户LTV。 在权益策略场景中,传统模型面临选择性偏差、高噪声干扰、多场景异构等挑战,难以准确识别微弱增量信号。为此,我们正在构建下一代因果Transformer框架。 你将承担以下核心职责: 1. 增量建模与因果推断:深入解决观测数据中的选择偏差与时变混杂问题,基于淘天用户特征体系,提升权益效果的归因准确性; 2. 算法创新与模型研发:探索并设计基于因果推断Transformer的新型架构,设计提升微弱信号识别能力,推动CDUT等前沿模型落地;多场景协同建模:统一建模大促、日常、会员等多权益场景,实现跨场景知识迁移与泛化能力提升; 3. 前沿成果输出:在KDD、ICML、NeurIPS等顶级会议发表高水平论文,拓展因果推断与个性化营销领域的影响力; 4. 应用场景覆盖淘天多个权益体系,完成算法的线上应用及取得线上效果提升。 加入我们,你将参与最具挑战性的工业级因果推断课题,定义智能营销与用户增长的未来技术范式。
POI部门介绍: POI智能化致力于智能化的手段,真实还原现实世界兴趣点(Point of Interest),为高德出行和生活服务提供支撑,是高德用户信息获取、交易履约和出行体验的基础; 每个POI背后都有精彩的故事,我们作为链接POI和用户的第一步,每一分努力都是与现实世界的一次互动。欢迎加入我们,从另一个视角来观察世界! 职位描述: 1. 研究、训练、使用预训练模型,解决地图领域POI数据相关业务,包括但不限于文本理解,文本生成以及语义匹配等相关任务。 2. 从事预训练模型研究、训练、应用,包括但不限于多语言、多模态、训练任务优化、下游任务迁移、知识融入更新、模型性能提升等; 3. 负责多模态、跨语言预训练等相关底层技术的研究与实现,并应用于下游的文本/图像的理解与生成; 4. 将预训练模型与搜索/地图领域实际问题相结合,包括但不限于训练任务优化、任务迁移、知识融入更新、模型性能提升等;