高德地图AI Agent算法工程师-AI项目实习生
任职要求
职位要求 在校硕/博士,计算机科学、人工智能、自然语言处理等相关专业,实习时间6个月以上; 熟练使用PyTorch / TensorFlow等主流框架,具备GPT、LLaMA等大规模语言模型训练、微调与性能优化实战经验; 至少满足以下任一技术栈的深度实践: 检索增强生成(RAG)、Agent架构、搜索/推荐算法 Prompt Engineering、强化学习微调对齐技术,并在搜索场景中对Query理解与结果生成有系统性研究; 热衷纯粹技术,主动性强,沟通协作佳,能快速验证新想法并推动团队技术演进; 加分项: KDD / ACL / EMNLP / NeurIPS / ICLR 等顶会发表LLM或搜索相关论文; LangChain、AutoGPT 等开源项目贡献者,或独立AI Agent开发经验; 有多模态模型(如GPT-4V)或强化学习(RL)实践经验。
工作职责
职位描述 跟进AI Agent领域最新技术动态,围绕LLM大模型、Agent框架、LLM Reasoning技术(如思维链、多步推理)、优化复杂查询的Deep Research模式、长期记忆机制、自动化数据合成、指令微调(Instruction Tuning)、偏好对齐(RLHF/DPO)等技术,持续推动算法创新与落地。 开展LLM Agent技术研发,构建端到端Agent系统,涵盖意图识别、知识检索、结果生成与偏好对齐,推动相关技术研究与算法落地,提升用户体验。
1、参与智能创作Agent核心系统的研发与迭代,学习如何融合多模态理解、交互与生成能力,探索AI在内容创作中的应用场景; 2、协助搭建创作领域的多模态认知体系,结合行业知识库,理解镜头美学、剪辑节奏、叙事逻辑等要素,支持图片/视频/音乐生成模型的优化与应用; 3、参与大模型后训练相关探索(如SFT、RLHF 等),通过高质量数据合成、指令设计、偏好对齐等方法,提升Agent的长推理和复杂规划能力; 4、参与Agent相关核心模块的开发与实验,包括任务编排、工具调用、多Agent协作、长期记忆和个性化能力探索。
关于我们: AI Business 成立于2023年4月,是阿里国际数字商业集团设立的一层业务组织,专注于大模型技术能力建设和 AI 原生应用和产品的打造,旨在用最先进的 AI 技术重塑平台竞争力,为商家和用户带来极致电商体验。 作为跨境电商领域的 AI 先锋,我们坚定地相信人工智能对塑造未来电商的关键作用,并坚持对 AI 领域人才的培养和发展。我们已经汇聚了业内顶尖的 AI 算法专家、AI 工程师和AI产品团队,并诚挚邀请有共同使命感、追求创新与卓越的 AI 人才加入我们的团队,共同用AI技术书写数字商业领域的新篇章。 职位描述: 1、负责多语言大语言模型(LLM)的预训练、微调及优化,探索高效训练策略(如低资源语种能力迁移、任务调度优化等),提升模型性能与跨文化场景适应性; 2、构建多模态大模型技术体系,包括图文生成、视频内容生成、多模态检索与信息抽取,支持商品虚拟试穿、智能客服等业务场景。 3、推动大模型与业务深度融合,开发基于LLM的对话系统、Agent产品及RAG系统,优化电商文本生成、跨语言信息匹配、时间序列预测等场景的智能决策能力; 4、设计强化学习对齐算法(如RLHF/DPO),提升模型在垂直领域(如商品推荐、用户交互)的精准度与可控性。 4、实现大模型的高效推理部署,包括模型压缩量化、GPU并行计算优化(如CUDA加速),确保高并发场景下的服务稳定性; 5、探索生成式AI与电商场景结合的前沿技术(如AIGC内容生成、多模态商品检索),推动技术规模化落地。
阿里云持续推进AI 技术深化战略布局, 围绕AI 和云计算的基础设施建设、AI基础模型平台、企业级AI应用方向构建核心场景。为此,我们正积极招募优秀人才: 1、智能预测与风控体系构建: 支持相关产品与能力的构建,包括销量预测、智能预警、异常检测、行为序列预测等场景。跟踪时序预测、时空预测、序列预测、异常检测、可解释机器学习、联邦学习、流程挖掘等前沿算法,并合理运用到实际产品中; 2、AI智能&NLP: 参与对话系统、舆情监控、知识图谱等自然语言理解与生成相关应用,构建领域内容大模型。设计并优化预训练语言模型,进行高效微调、模型压缩、推理加速等工作,将NLP、多模态内容理解和生成技术运用于实际产品中; 3、行业趋势与技术跟踪: 持续跟踪行业最新趋势和技术动态,通过深度行业洞察和市场分析,及时预警潜在问题,提出前瞻性的解决方案; 4、产品优化与决策支持: 参与供应链的数字化项目,推动技术实现与业务落地,提升决策质量、速度、规模和可解释性; 5、跨部门协作与项目落地: 与协作部门紧密合作,规划与设计数据集,推动供需预测相关问题解决,确保项目落地并取得预期结果。
工作内容:语言大模型技术的研究和应用 负责大模型方向技术的研究和应用,构建汽车垂域智能系统,工作内容包括以下三个方向: a. 负责追踪大模型学术进展,预研前沿技术问题,打造行业领先技术影响力 b. 负责根据业务场景,抽象技术问题,预研和实现大模型技术,赋能整车业务 技术方向包括但不限于: 1. 模型架构、预训练方法、高效微调、模型评估及迭代 2. 知识增强、工具增强、AI Agent、RAG 3. 安全、时效性等问题解决 4. 训练和推理加速、模型量化、端测落地 5. 大模型核心能力提升,包括理解能力、知识能力、推理能力、生成能力和语言能力等 6、制定相关规范并形成项目管理文档。