logo of alibaba

阿里巴巴AI Agent算法工程师(大模型方向)

实习兼职淘天集团2026届春季实习生招聘地点:杭州状态:招聘

任职要求


1、计算机/人工智能/数学等相关专业硕士及以上学历(博士及顶会论文发表者优先);
2、对大模型前沿技术充满热情,具备攻克复杂技术难题的能力,能够快速实现Paper→Code→Solution的技术转化;
3、精通PythonPyTorch/TensorFlow等框架,具备Qwen、Llama、Deepseek等模型的二次开发经验者优先;
4、深入理解Transformer架构、SFT/RL训练范式及Prompt工程,了解LangChainAutoGenAgent开发框架,有完整智能体系统搭建经验者优先。
(注:实习申请者需保证3个月或以上的实习周期,提供充足的GPU算力资源及丰富的业务场景实践机会)

工作职责


1、主导基于大模型的AI Agent全生命周期研发,包括通用型及垂直领域AI Agent的架构设计、模型训练与评测;
2、运用SFT、RL等Post-training训练方法,提升大模型在自主规划(Planning)、多步推理、RAG增强生成、工具调用、数据问答、文案生成等方面的能力;
3、跟踪LLM与Agent领域的国际前沿技术动态,推动技术创新在业务场景中的落地应用,重点突破复杂推理、数据洞察、AI搜索、文案创作、图像连续编辑等方向的应用创新;
4、持续优化Agent算法与系统架构,构建端到端的智能体评测体系,开发自动化评估工具与多维评价指标,提升Agent系统性能与效率,打造业内领先的AI Agent技术方案。
包括英文材料
学历+
大模型+
Python+
PyTorch+
TensorFlow+
Llama+
Transformer+
SFT+
Prompt+
LangChain+
AutoGen+
AI agent+
开发框架+
相关职位

logo of amap
实习高德研究型实习生

团队介绍: 我们是高德渲染平台研发团队,专注于大模型等前沿技术在地图渲染领域的创新应用。我们的目标是打造智能化的渲染平台,提升渲染效果和质量,为用户带来更优质的体验。如果你对AI赋能渲染、智能化产品升级充满热情,欢迎加入我们! 具体职责包括但不限于: 1、结合大模型、机器学习技术,优化高德渲染平台,提升渲染效果和质量 2、针对特定业务场景,优化大模型,对大模型进行微调,实现专属技能模型的能力升级。

更新于 2025-03-27
logo of amap
社招2年以上技术类-算法

团队介绍: 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现高精度地图、三维重建、LLM/VLM,AI Agent等核心技术,持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕,更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。 作为高德地图的核心技术驱动部门,我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心,推动智能出行与真实世界连接的深度融合。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 1、跟进AI Agent领域最新技术动态,围绕LLM大模型、Agent框架、LLM Reasoning技术(如思维链、多步推理)、优化复杂查询的Deep Research模式、长期记忆机制、自动化数据合成、指令微调(Instruction Tuning)、偏好对齐(RLHF/DPO)等技术,持续推动算法创新与落地; 2、开展LLM Agent技术研发,构建端到端Agent系统,涵盖意图识别、知识检索、结果生成与偏好对齐,推动相关技术研究与算法落地,提升用户体验。

更新于 2025-09-11
logo of kuaishou
社招3-5年D10702

随着LLM、多模态、Agent应用技术的发展,优化和完善AI短视频、AI直播等AIGC应用的表现。主要工作包括: 1、模型微调: 使用微调技术对大模型进行业务适配和效果优化; 2、Agent化: 优化大模型调用Agent的工程链路,最终实现对优秀人类行为的端到端学习和拟人化对标; 3、数据驱动优化: 基于业务数据统计和挖掘,发现当前系统问题和待提升方面,进而制定优化计划; 4、行业对标: 紧跟基模和行业产品发展趋势,推动新技术的产品化落地。

更新于 2025-08-11
logo of bilibili
社招3年以上技术类

1.负责将大模型AI算法落地到游戏领域,包括并不局限于以下方向: - 游戏制作:大模型机器翻译,LLM问答机器人,LLM客服机器人,强化学习AIBot等 - 生态维护:基于图or行为序列大模型的异常行为识别,大模型内容安全治理-小广告、涉黄、涉政等 - 提升LTV:游戏内礼包or道具推荐、销量预测等(召回、排序、重排) - 提升留存:大模型流失预测,舆情监控,玩家召回等

更新于 2025-06-03