logo of antgroup

蚂蚁金服蚂蚁集团-大模型算法工程师-杭州

社招全职技术类-算法地点:杭州状态:招聘

任职要求


1、计算机相关专业获得硕士及以上学位, 有实际AI项目经验优先;
2、有NLP基础背景,对NLP主流大模型如GPT4/O1/Claude/PaLM/LLaMA等的原理和差异有深入的理解,发表过大模型相关研究AI顶会论文优先;
3、熟练掌握主流深度学习框架pytorch/tensorflow大模型训练框架Megatron-LM/Deepspeed等多机多卡方案,有百亿/千亿NLP大模型训练调优经验优先;
4、熟悉常见的模型轻量化技术,如量化/剪枝/蒸馏等,熟悉onnx/tensorRT;
5、有良好的代码开发能力,有开源项目开发经验优先;有良好的沟通能力和项目主导经验。

工作职责


1、聚焦大模型的应用侧创新,包括RAG检索增强/Agent复杂规划执行能力、LLM可控知识生产、LLM推理加速等问题,解决大模型业务落地的技术障碍;
2、协同跨团队技术和业务同学共同达成技术和业务目标;
3、NLP大模型前沿探索,推动大模型子领域的技术创新,沉淀行业领先的技术能力。
包括英文材料
学历+
NLP+
大模型+
深度学习+
PyTorch+
TensorFlow+
Megatron+
ONNX+
相关职位

logo of cainiao
社招1年以上技术类-算法

菜鸟平台人工智能部致力于探索前沿AI技术在产业互联网的落地与应用: 1、算法研发: 参与建设大模型、多模态、文档理解、AI Agent、知识图谱,强化学习等人工智能技术与行业领域模型的深度融合,实现相关产品的创新与升级。 2、算法应用:参与建设相关技术在业务场景的落地,包括但不限于知识库问答、客服智能、语音智能、数据智能、文档智能、MultiAgent等; 3、深入跟踪调研大模型以及相关方向(包括但不限于NLP/CV/多模态/Agent/具身智能)的前沿技术。

更新于 2025-08-26
logo of alibaba
社招2年以上

1、深度参与 1688 销服大模型建设工作,主导大模型的训练与调优工作,运用先进的技术和算法,不断提升模型的性能与表现; 2、负责销售 copilot、人机协同服务、电销数字人、运营服务数字孪生等 AI 原生应用的设计与研发,确保产品的创新性与实用性; 3、推动 AI 原生应用在销服服务场景中的落地,深入分析业务需求,通过技术手段提升作业效率与用户体验; 4、持续关注行业内拟人交互技术的发展趋势,引入前沿技术并进行创新应用,保持团队在技术上的先进。

更新于 2025-06-11
logo of antgroup
社招3年以上技术类-算法

负责 LLM 在软件研发领域的应用与落地,包括但不限于LLM、Agent/Multi-agent、 Tool Learning、RAG、RLHF等技术,探索大模型和软件研发领域的结合,实现在业务中的应用落地。 1、负责算法模型研发,包含但不限于Embedding、Pre-train、SFT、Self-instruct; 2、参与领域模型的全流程工作,包括但不限于数据、训练、评测、推理部署,保证数据的高质量和有效性; 3、探索Agent在复杂任务中的应用,实现基于LLM的复杂任务在软件研发领域场景的应用落地。

更新于 2025-08-19
logo of eleme
社招1年以上技术类-算法

1.参与系统的需求分析、架构设计与开发工作,确保算法模型的高效落地与业务目标的达成。 2.结合大语言模型(LLM)与强化学习(RL)技术,设计并实现智能化的文本生成模型,助力商家运营效率和服务质量的全面提升。 3.持续关注并研究强化学习领域的前沿技术动态,探索新方法与新思路,推动技术创新在实际业务中的落地应用。

更新于 2025-09-25