logo of antgroup

蚂蚁金服研究型实习生-用户多源行为序列预训练表征建模算法研究

实习兼职研究型实习生地点:北京 | 杭州状态:招聘

任职要求


研究领域:
-目前正在攻读计算机科学或相关STEM领域的学士,硕士或博士学位
-具有一种或多种通用编程语言的经验,包括但不限于: Java,C/C ++ 、PythonJavaScriptGo
-具有上述研究领域的相关经验,包括行业经验或作为参与实验室研究
优先录用:
-对技术研究充满热情,具有产生新思想和创新的能力; 在自学,问题分析和解决方面表现出色
-在国际会议上或核心期刊发表一份或多份出版物或论文
-至少3个月的全职工作

工作职责


研究领域:
  人工智能
项目简介:
  支付宝用户行为数据(包括用户的点击浏览页面、账单、APP小程序使用等)的挖掘与建模,在支付宝的搜推广、贷前风控、贷后催收等多项场景中,帮助业务上取得了效果提升。目前业务迭代的方向逐渐聚焦精细化建模,例如针对年轻客群进一步拆分为大学生与低龄学生,白领职业进一步细分为律师、理财师等。针对更加复杂细碎的场景,需要一套统一的用户行为预训练方案,以提供预训练模型与预训练表征的方式,支持下游多种场景,提升建模效率与业务效果。
包括英文材料
学历+
Java+
C+
Python+
JavaScript+
相关职位

logo of antgroup
实习研究型实习生

研究领域: 隐私计算 项目简介: 1.项目背景 在人工智能技术快速发展的今天,UIAgent(用户界面智能代理)正成为下一代人机交互的核心入口。然而,如何获得或构建海量多模态数据(如行为轨迹、界面标注信息、系统动线日志等)是研究的关键。但如何在保障数据隐私合规的前提下,完成高质量的场景重建与语料建模,已成为制约技术落地的关键瓶颈。本课题聚焦这一核心矛盾,探索隐私保护与数据效用之间的最优平衡,为UIAgent提供安全、合规、可用的基础数据支撑。 2.研究目标 本项目旨在构建一套全流程隐私保护框架,解决以下核心问题: 多源异构数据脱敏:针对文本、图像、时序行为等多模态数据,设计可组合的隐私擦除策略; 场景语义保真重建:在去除个人身份信息(PII)的同时,保留用户行为模式与系统交互逻辑的语义完整性; 隐私-效用博弈建模:通过理论分析与实验验证,量化隐私预算与模型性能间的权衡关系。 3.核心亮点 生成式隐私增强技术:基于扩散模型/VAE生成合成数据,既还原真实场景分布又规避隐私泄露风险; 行为轨迹知识蒸馏:将原始轨迹中的高敏感操作(如输入内容)抽象为低维符号序列,保留系统动线拓扑结构; 极致数据压缩技术:UIAgent的核心目标是理解和预测用户的界面交互行为,而非复现像素级视觉细节,将探索最小必要数据的边缘。

logo of bytedance
实习A96776

团队介绍:广告业务原为商业产品与技术部门,为抖音集团的商业变现提供广告产品与技术,负责端到端大型广告系统建设,覆盖抖音、今日头条、西瓜视频、番茄小说、穿山甲等产品矩阵,践行"激发生意新可能"理念,致力于让营销更省心、更高效、更美好,推动商业的可持续增长,让不分体量、地域的企业及个体,都能通过数字化技术激发创造、驱动生意。连接广告主、用户及生态伙伴、成为开放共赢的全球最佳智能营销平台之一。在这里,你将投身建设面向未来的数字营销能力,接触到全球先进的商业产品架构、模型和算法,在互联网广告行业始终创新。 课题介绍: 1、核心技术架构: 1)下一代广告技术栈: 模型算法层:搭建基于强化学习的智能出价与流量预估系统,攻克深层转化场景下的数据稀疏、多源异构数据融合(延迟数据/埋点噪声/跨平台行为)等行业难题; 系统工程层:构建支持基于长序列特征的实时预估框架,研发支持动态创意组合的自动化投放引擎; AIGC融合层:建立文/图/视频多模态生成技术中台,实现从IP素材生成到智能投放的全链路闭环; 2)行业首创的AIGC解决方案: 正在搭建全球领先的"小说→漫剧"智能生产线,攻克三大技术堡垒: 多模态叙事引擎:研发支持角色一致性保持(Character-aware Diffusion)、分镜自动生成(Storyboard LLM)、动态运镜控制(Camera ControlNet)的复合型生成框架; 工业化工作流:构建支持分布式渲染、多版本AB测试、合规性审核的智能生产管线,实现日均千级素材产能; 投放增效系统:开发生成质量量化评估模型(QAGAN),建立素材生成-投放效果的反哺优化机制; 2、岗位挑战: 你将主导: 构建支持沿模型的混合推理框架,优化多卡并行下的生成效率; 设计跨模态对齐算法,提升文字指令到视觉元素的可控生成精度; 研发基于用户行为分析的智能素材变异系统,实现CTR提升30%+的个性化内容生成; 打造从内容生产到实时竞价的全自动化广告引擎; 3、我们期待这样的开拓者: 精通Diffusion Models技术栈,具有LoRA/ControlNet/T2I-Adapter等微调框架的实战调优经验; 熟悉多模态大模型(如VideoPoet、Sora等视频生成技术原理),具备跨模态表征学习研究背景; 拥有广告算法背景者优先,熟悉CVR预估、智能出价等核心模块与生成式AI的结合点; 出色的工程化能力,主导过至少一个完整AIGC项目的端到端落地(从模型训练到服务部署)。

更新于 2025-05-26
logo of amap
实习高德研究型实习生

业务丰富,技术领先 高德打车算法团队深度赋能打车业务全链路,涵盖 用户增长、风控、服务管控、路线与上下车点推荐、ETA 预估、智能客服 等核心场景。多样化的业务挑战为算法创新提供了广阔的发挥空间,团队已在 AI 顶级会议发表成果。 精英阵容,国际视野 团队成员来自泰晤士世界大学排名 Top 10 的高校,以及美国常青藤、清华、北大等顶尖院校,兼具国际化背景与一流技术视野。 持续成长,共享共进 团队每周固定进行技术分享,氛围开放、互助友好;除了解答算法与工程难题,资深同事还会分享项目经验,并传授业务理解与问题解决的方法论,助你快速成长。 高德打车算法团队致力于用前沿AI技术重塑每一次打车体验。我们不是在做“推荐路线”,而是在理解用户为什么这样出行——他们偏爱哪条路?为何总在某个路口取消订单?哪些投诉背后藏着未被听见的需求? 我们正在寻找对用户行为洞察和大模型落地充满热情的实习生,与我们一起,用AI读懂出行的“潜台词”,让平台更懂你。 在这里,你将: • 构建用户出行偏好画像 基于海量行程数据,利用大模型(LLM)挖掘用户在路线选择、上下车点偏好、出行时段等方面的隐性行为模式,构建个性化出行画像,驱动个性化推荐与服务预判。 • 挖掘路线与上下车点的“隐藏特性” 分析亿级路线片段与上下车点的时空特征,通过大模型语义理解与多源信息融合,提炼可量化、可解释的“路段 / POI 质量标签”,优化点线相关推荐服务的质量。 • 提升投诉反馈的智能响应与信息透出能力 构建基于大模型的客诉理解与归因系统,自动识别投诉核心诉求(如“绕路”“司机态度”“等太久”),关联具体路线/上下车点/时段,生成结构化反馈报告,推动产品优化与客服话术升级,实现“从听抱怨到改体验”的闭环。 • 推动大模型技术在真实场景中的闭环落地 应用RAG、SFT、DPO、AI Agent等技术,构建可解释、可追踪、可迭代的智能系统,让模型不只是“跑得准”,更能“说得清、改得动、用得好”。 你的工作将直接服务全国数亿用户,每一次模型优化,都可能让一位用户少等5分钟、多一份安心、少一次投诉。你不是在写代码,你是在重塑人与出行之间的信任关系。

更新于 2025-09-25
logo of antgroup
实习研究型实习生

研究领域: 人工智能 项目简介: 在监管合规对话聊天场景中,需要针对用户给出的法规/态势/舆情等相关问题给出对应建议及观点,而用户问题涉及知识相对比较宽泛,依赖于多源数据(联网数据及内部知识库),且不同类型问题依赖检索逻辑不一。传统的RAG中通常通过改写步骤来保证问题的召回,在涉及专业领域知识时需要大量领域人员进行标注,耗费人力且效果不佳。