蚂蚁金服蚂蚁集团-大模型算法工程师-杭州
社招全职技术类-算法地点:杭州状态:招聘
任职要求
1、计算机相关专业获得硕士及以上学位, 有实际AI项目经验优先; 2、有NLP基础背景,对NLP主流大模型如GPT4/O1/Claude/PaLM/LLaMA等的原理和差异有深入的理解,发表过大模型相关研究AI顶会论文优先; 3、熟练掌握主流深度学习框架pytorch/tensorflow,大模型训练框架Megatron-LM/Deepspeed等多机多卡方案,有百亿/千亿NLP大模型训练调优经验优先; 4、熟悉常见的模型轻量化技术,如量化/剪枝/蒸馏等,熟悉onnx/tensorRT; 5、有良好的代码开发能力,有开源项目开发经验优先;有良好的沟通能力和项目主导经验。
工作职责
1、聚焦大模型的应用侧创新,包括RAG检索增强/Agent复杂规划执行能力、LLM可控知识生产、LLM推理加速等问题,解决大模型业务落地的技术障碍; 2、协同跨团队技术和业务同学共同达成技术和业务目标; 3、NLP大模型前沿探索,推动大模型子领域的技术创新,沉淀行业领先的技术能力。
包括英文材料
学历+
NLP+
https://www.youtube.com/watch?v=fNxaJsNG3-s&list=PLQY2H8rRoyvzDbLUZkbudP-MFQZwNmU4S
Welcome to Zero to Hero for Natural Language Processing using TensorFlow!
https://www.youtube.com/watch?v=R-AG4-qZs1A&list=PLeo1K3hjS3uuvuAXhYjV2lMEShq2UYSwX
Natural Language Processing tutorial for beginners series in Python.
https://www.youtube.com/watch?v=rmVRLeJRkl4&list=PLoROMvodv4rMFqRtEuo6SGjY4XbRIVRd4
The foundations of the effective modern methods for deep learning applied to NLP.
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
TensorFlow+
https://www.youtube.com/watch?v=tpCFfeUEGs8
Ready to learn the fundamentals of TensorFlow and deep learning with Python? Well, you’ve come to the right place.
https://www.youtube.com/watch?v=ZUKz4125WNI
This part continues right where part one left off so get that Google Colab window open and get ready to write plenty more TensorFlow code.
Megatron+
https://www.youtube.com/watch?v=hc0u4avAkuM
ONNX+
https://github.com/onnx/tutorials
Open Neural Network Exchange (ONNX) is an open standard format for representing machine learning models.
[英文] Introduction to ONNX
https://onnx.ai/onnx/intro/
This documentation describes the ONNX concepts (Open Neural Network Exchange).
相关职位
社招1年以上技术类-算法
菜鸟平台人工智能部致力于探索前沿AI技术在产业互联网的落地与应用: 1、算法研发: 参与建设大模型、多模态、文档理解、AI Agent、知识图谱,强化学习等人工智能技术与行业领域模型的深度融合,实现相关产品的创新与升级。 2、算法应用:参与建设相关技术在业务场景的落地,包括但不限于知识库问答、客服智能、语音智能、数据智能、文档智能、MultiAgent等; 3、深入跟踪调研大模型以及相关方向(包括但不限于NLP/CV/多模态/Agent/具身智能)的前沿技术。
更新于 2025-08-26
社招2年以上
1、深度参与 1688 销服大模型建设工作,主导大模型的训练与调优工作,运用先进的技术和算法,不断提升模型的性能与表现; 2、负责销售 copilot、人机协同服务、电销数字人、运营服务数字孪生等 AI 原生应用的设计与研发,确保产品的创新性与实用性; 3、推动 AI 原生应用在销服服务场景中的落地,深入分析业务需求,通过技术手段提升作业效率与用户体验; 4、持续关注行业内拟人交互技术的发展趋势,引入前沿技术并进行创新应用,保持团队在技术上的先进。
更新于 2025-06-11
社招3年以上技术类-算法
负责 LLM 在软件研发领域的应用与落地,包括但不限于LLM、Agent/Multi-agent、 Tool Learning、RAG、RLHF等技术,探索大模型和软件研发领域的结合,实现在业务中的应用落地。 1、负责算法模型研发,包含但不限于Embedding、Pre-train、SFT、Self-instruct; 2、参与领域模型的全流程工作,包括但不限于数据、训练、评测、推理部署,保证数据的高质量和有效性; 3、探索Agent在复杂任务中的应用,实现基于LLM的复杂任务在软件研发领域场景的应用落地。
更新于 2025-08-19