阿里巴巴1688-算法工程师-AI native

社招全职2年以上2025-11-27地点：杭州状态：招聘

扫码手机上打开

任职要求

1. 计算机、人工智能或数学相关专业科班生，有扎实的计算机知识和LLM功底，熟悉搜索技术栈。
2. 掌握Qwen/DeepSeek等LLM post-training训练方法，以及PPO/GRPO等RL算法原理，有RLVR/AgenticRL等实操落地经验。
3.…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 负责AI搜推助手类创新产品的技术落地，从业务问题抽象到LLM全链路研发，持续提升用户体验与业务指标。
2. 负责通过强化学习，提升LLM对超长上下文建模和多步骤工具调用能力，实现新一代高精度用户模拟器。
3. 负责通过DeepResearch技术，实现从店铺分析-智能选品-下游效果提升的全自动电商开店Agent。
4. 持续关注AI技术的发展趋势，负责LLM的前沿技术探索，进行紧贴业务的技术创新。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

大模型+

算法+

还有更多 •••

登录查看完整学习资料

相关职位

蚂蚁集团-算法工程师/专家-AI智能体

社招技术类-数据

AI智能体以强大的自主规划执行能力和广阔的应用前景引发了科技界的密切关注和巨大投入。本项目重点关注智能体的能力突破，在以下领域深耕创新、探索前沿，打造Agent Native Model和AI Native的智能体产品。 1. UI Agent：AI自主完成复杂的Phone/Computer/Browser Use任务 2. 深度研究：AI自主完成通用的深度研究型的任务，动态规划、灵活调用多种工具或智能体 3. 安全深度分析：深入理解安全风控领域的任务要求，掌握领域工具，提供专业深度的分析、提前发现风险/治理漏洞

更新于 2025-04-01北京|上海|杭州

AI Native Scientist (LLMs, Computer Vision & Factory Automation)

社招AI与数据分析

无

上海

【Hi Lab】大模型AI native算法工程师

社招1-3年大模型

1、Post-Training Pipeline 设计与迭代：搭建并持续优化 SFT、RM、RLHF / RLAIF / RLVF 等后训练流水线，支持多模态模型的高效迭代，让千亿级大模型在一次次“后训练”中真正变得聪明、智慧、安全 2、可扩展监督与反馈系统：设计低成本人类 + AI 组合反馈机制，自动化完成偏好采集、对齐传递与数据质量评估，通过 Product-Research co-design 探索构建真实用户反馈的模型迭代机制 3、通用推理与工具使用能力提升：构建跨模态强化学习环境和多样化奖励体系，帮助模型学会调用外部工具、提升模型利用文本-图像-语音跨模态信息进行复杂推理和问题解决能力 4、长期记忆、个性化与终身学习：探索持久记忆与动态偏好建模，使模型能够跨会话记住用户偏好、持续学习而不遗忘核心能力 5、安全评估与价值观对齐：搭建安全对齐机制、红队测试、越狱防御与自动化评测框架，量化模型幻觉、稳定性及价值观一致性，制定风险缓解策略，确保模型在开放场景中始终行为可控 6、跨职能落地：与产品、设计、人文训练师及数据团队，把研究成果迅速推向真实场景，打造小红书下一代战略级 AI native 应用产品

更新于 2025-10-23上海|北京|杭州

【Hi Lab】大模型AI native算法工程师（垂类）

社招大模型

更新于 2026-01-05北京|上海