蚂蚁金服蚂蚁集团-大模型评测技术专家-北京/杭州Z
社招全职3年以上技术类-开发地点:北京 | 杭州状态:招聘
任职要求
1. 计算机或相关专业研究生以上学历。 2. 具备扎实的算法编程能力,熟练使用TensorFlow、PyTorch等主流深度学习框架。 3. 独立思考能力,良好的沟通能力,喜欢探索,有责任心,能主动发现问题并通过技术解决问题。 4. 具有自然语言处理、计算机视觉、语言大模型…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1. 建设一站式的大模型自动化评测平台,负责大模型评测基准建设和评测算法研究应用。 2. 为蚂蚁AI业务建设科学的评测体系,参与AI业务评测基准建设,对数据、模型和业务进行全面评估验证。系统化业务问题识别与优化机制,帮助指引算法和技术迭代方向,推动业务落地并取得效果。
包括英文材料
学历+
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
TensorFlow+
https://www.youtube.com/watch?v=tpCFfeUEGs8
Ready to learn the fundamentals of TensorFlow and deep learning with Python? Well, you’ve come to the right place.
https://www.youtube.com/watch?v=ZUKz4125WNI
This part continues right where part one left off so get that Google Colab window open and get ready to write plenty more TensorFlow code.
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
NLP+
https://www.youtube.com/watch?v=fNxaJsNG3-s&list=PLQY2H8rRoyvzDbLUZkbudP-MFQZwNmU4S
Welcome to Zero to Hero for Natural Language Processing using TensorFlow!
https://www.youtube.com/watch?v=R-AG4-qZs1A&list=PLeo1K3hjS3uuvuAXhYjV2lMEShq2UYSwX
Natural Language Processing tutorial for beginners series in Python.
https://www.youtube.com/watch?v=rmVRLeJRkl4&list=PLoROMvodv4rMFqRtEuo6SGjY4XbRIVRd4
The foundations of the effective modern methods for deep learning applied to NLP.
OpenCV+
https://learnopencv.com/getting-started-with-opencv/
At LearnOpenCV we are on a mission to educate the global workforce in computer vision and AI.
https://opencv.org/university/free-opencv-course/
This free OpenCV course will teach you how to manipulate images and videos, and detect objects and faces, among other exciting topics in just about 3 hours.
还有更多 •••
相关职位
社招5年以上技术类-质量保证
1. 构建端到端的数据与MLOps基础设施,支撑语音、图像、文本、传感器等多模态数据的大规模处理及模型的后训练、评估与部署。 2. 设计自动化数据管线,实现多模态数据的收集、清洗、标注、版本管理、质量监控及隐私合规处理。 3. 主导MLOps核心能力建设,包括实验跟踪、特征管理、训练调度、A/B测试、模型版本控制、灰度发布与在线监控。 4. 搭建覆盖模型能力(如ASR准确率、NLU F1、LLM任务完成率)、系统性能(延迟、资源占用)和用户体验(上下文连贯性、任务成功率)的自动化评测体系。 5. 推动AI驱动的测试创新,探索基于大模型的测试用例自动生成、用户行为模拟、对抗测试等前沿方法。
更新于 2025-11-24北京|杭州
社招3年以上技术类-算法
负责蚂蚁集团语言大模型的评测算法研究与应用,搭建业界领先的大模型评测体系,精准全面地评估大模型的能力。基于AIGC等技术建设高质量评测数据集,与业界公开评测集有机结合,深入大模型预训练、后训练、深度思考等各个阶段,利用大模型等技术提高评测效率和准确性,通过高效高质量评测提升语言大模型、垂域大模型的能力和用户体验。
更新于 2025-11-07北京|杭州
社招3年以上技术类-开发
1、模型服务API: 开发实现端到端的模型服务,涵盖LLM/VL/embedding/rerank等大语言模型, 也包含diffusion model方向的生图生视频的模型服务,构建高效的服务框架提升模型接入效率, 优化端到端服务性能,确保稳定性; 2、百炼大模型开发平台上各领域模型服务架构设计迭代、性能优化以及核心服务开发; 3、百炼大模型开发平台模型微调、模型评测技术架构设计、算法开发以及对应业务能力建设。
更新于 2025-08-14北京|杭州