logo of alibaba

阿里巴巴1688-算法工程师-AI native

社招全职2年以上地点:杭州状态:招聘

任职要求


1. 计算机、人工智能或数学相关专业科班生,有扎实的计算机知识和LLM功底,熟悉搜索技术栈。
2. 掌握Qwen/DeepSeek等LLM post-training训练方法,以及PPO/GRPO等RL算法原理,有RLVR/AgenticRL等实操落地经验。
3.…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责AI搜推助手类创新产品的技术落地,从业务问题抽象到LLM全链路研发,持续提升用户体验与业务指标。
2. 负责通过强化学习,提升LLM对超长上下文建模和多步骤工具调用能力,实现新一代高精度用户模拟器。
3. 负责通过DeepResearch技术,实现从店铺分析-智能选品-下游效果提升的全自动电商开店Agent。
4. 持续关注AI技术的发展趋势,负责LLM的前沿技术探索,进行紧贴业务的技术创新。
包括英文材料
大模型+
算法+
还有更多 •••
相关职位

logo of antgroup
社招技术类-数据

AI智能体以强大的自主规划执行能力和广阔的应用前景引发了科技界的密切关注和巨大投入。本项目重点关注智能体的能力突破,在以下领域深耕创新、探索前沿,打造Agent Native Model和AI Native的智能体产品。 1. UI Agent:AI自主完成复杂的Phone/Computer/Browser Use任务 2. 深度研究:AI自主完成通用的深度研究型的任务,动态规划、灵活调用多种工具或智能体 3. 安全深度分析:深入理解安全风控领域的任务要求,掌握领域工具,提供专业深度的分析、提前发现风险/治理漏洞

更新于 2025-04-01北京|上海|杭州
logo of xiaohongshu
社招1-3年大模型

1、Post-Training Pipeline 设计与迭代:搭建并持续优化 SFT、RM、RLHF / RLAIF / RLVF 等后训练流水线,支持多模态模型的高效迭代,让千亿级大模型在一次次“后训练”中真正变得聪明、智慧、安全 2、可扩展监督与反馈系统:设计低成本人类 + AI 组合反馈机制,自动化完成偏好采集、对齐传递与数据质量评估,通过 Product-Research co-design 探索构建真实用户反馈的模型迭代机制 3、通用推理与工具使用能力提升:构建跨模态强化学习环境和多样化奖励体系,帮助模型学会调用外部工具、提升模型利用文本-图像-语音跨模态信息进行复杂推理和问题解决能力 4、长期记忆、个性化与终身学习:探索持久记忆与动态偏好建模,使模型能够跨会话记住用户偏好、持续学习而不遗忘核心能力 5、安全评估与价值观对齐:搭建安全对齐机制、红队测试、越狱防御与自动化评测框架,量化模型幻觉、稳定性及价值观一致性,制定风险缓解策略,确保模型在开放场景中始终行为可控 6、跨职能落地:与产品、设计、人文训练师及数据团队,把研究成果迅速推向真实场景,打造小红书下一代战略级 AI native 应用产品

更新于 2025-10-23上海|北京|杭州
logo of bytedance
社招A205490

1、负责对应团队的搜索推荐算法工作,和团队同学一起探索AI时代AI-Native的搜索推荐系统(LLM和搜推结合),为用户提供一流的产品体验; 2、和产品、运营团队紧密合作,通过对产品和用户的深入理解和分析,持续提升产品体验和用户留存。

更新于 2025-03-26北京
logo of bytedance
社招A66926

1、负责对应团队的搜索推荐算法工作,和团队同学一起探索AI时代AI-NATIVE的搜索推荐系统(LLM和搜推结合),为用户提供一流的产品体验; 2、和产品、运营团队紧密合作,通过对产品和用户的深入理解和分析,持续提升产品体验和用户留存。

更新于 2024-04-18杭州