蚂蚁金服蚂蚁数字科技-数科技术部-大模型算法工程师
社招全职3年以上技术类-算法地点:上海 | 杭州状态:招聘
任职要求
1. 硕士研究生及以上学历,计算机、软件工程、人工智能等相关专业; 2. 具有1年以上算法相关工作经验,有大模型、深度学习、强化学习等方面的丰富实践经验; 3. 对大模型核心技术有深入系统的理解,包括但不限于数据合成、模型架构、训练算法、优化策略等;在大模型领域,参加过大影响力的项目或论文者优先,有推理模型和强化学习研发经验者优先; 4. 具备较强的问题分析与解决能力,能够快速落地方案并进行效果验证; 5. 良好的沟通协作能力,能和团队一起探索新技术,推进技术进步。
工作职责
1. 负责蚂蚁数科垂类大模型的研发,包括SFT、RL等后训练技术的应用;推理能力增强和小型化;智能体原生的扩展推理模式大模型研发和落地。
包括英文材料
学历+
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
强化学习+
https://cloud.google.com/discover/what-is-reinforcement-learning?hl=en
Reinforcement learning (RL) is a type of machine learning where an "agent" learns optimal behavior through interaction with its environment.
https://huggingface.co/learn/deep-rl-course/unit0/introduction
This course will teach you about Deep Reinforcement Learning from beginner to expert. It’s completely free and open-source!
https://www.kaggle.com/learn/intro-to-game-ai-and-reinforcement-learning
Build your own video game bots, using classic and cutting-edge algorithms.
相关职位
社招5年以上技术类-算法
1. 负责研发行业多模态大模型,包括但不限于快慢思考的数据收集、训练调优、架构设计、以及行业知识库的建立,探索前沿大模型训练和优化方法,提升大模型在执行各种难度任务的执行正确性以及效率,打造领先的内容安全、智驾、具身智能等行业大模型; 2. 推动多模态大模型的产品化和商业化,提升多模态大模型的感知理解、定位、快思考和慢思考决策等能力; 3. 跟踪最新的研究趋势和技术进展,评估其对当前和未来项目的影响; 4. 与高校等研究团队合作,发表高水平的学术论文,提升团队在产学界的影响力。
更新于 2025-06-05
社招2年以上技术类-算法
1. 负责行业/领域大模型算法能力研发,包括但不限于数据合成、安全对齐、模型后训练等,支持大模型SaaS化服务与本地部署类的商业化产品,满足内外部客户对内容安全、抑制模型幻觉、模型性能提升、智能体安全的需求; 2. 深入研究大模型相关技术,跟进业务最新趋势,包括benchmark构建、CoT数据合成、模型微调与强化学习等方面,建设公司在领域的影响力。
更新于 2025-05-08
社招3年以上技术类-算法
1. 从模型数据角度深入研究大模型相关技术,跟进大模型训练最新趋势,包括但不限于数据合成、数据质量、数据使用(SFT、RL等)等方面,为模型效果提升贡献数据价值; 2. 负责行业/领域大模型应用算法研发,包括但不限于安全对齐、模型后训练等,支持大模型SaaS化服务与本地部署类的商业化产品,满足内外部客户对模型能力专用能力需求; 3. 通过行业分享、技术报告、论文等方式提升团队行业影响力。
更新于 2025-10-14