logo of antgroup

蚂蚁金服蚂蚁集团-大模型应用算法-杭州

社招全职技术类-算法地点:杭州状态:招聘

任职要求


1.计算机科学、运筹学、人工智能等相关专业硕士及以上学历,具备扎实的机器学习理论基础;
2.精通以下至少两个技术方向:
大模型Agent技术栈(ReAct、AutoGPT等范式,LangChain开发经验)
深度强化学习算法(PPO、DQN、SAC等)及分布式训练框架
复杂系统建模与优化(MDP、POMDP建模经验)
大规模深度学习系统开发(TensorFlow/PyTorch分布式训练)
3.具备智能决策系统实战经验,有以下经历者优先:
主导过基于LLMAgent系统在金融场景的落地
发表过ICML/NeurIPS/ICLR等顶会相关论文
4.熟悉金融业务特性,能设计符合监管要求的可信AI优化方案;
---加分项---
• 有基于大模型的序列决策优化、动态环境建模经验
• 掌握多智能体强化学习(MARL)在分布式系统中的应用
• 熟悉运筹优化与神经网络的融合方法(神经动态规划、神经启发式搜索等)
• 具备亿级参数模型训练调优经验或大模型Agent编排系统开发经验

工作职责


1.围绕蚂蚁信贷业务场景中的复杂优化问题,构建融合大模型Agent技术的智能决策系统,结合深度强化学习、动态规划等算法实现业务策略的自主演进与精细化运营;
2. 研发面向金融场景的大规模混合优化求解框架,集成深度学习表征学习、大模型推理优化等前沿技术,打造新一代智能优化算法引擎;
3.探索大模型Agent与运筹优化的深度融合,通过LLM驱动的自动化建模、强化学习策略迭代等技术突破传统优化边界;
4.构建跨领域协同创新机制,推动AI Agent技术与风控策略、资源调度等业务系统的端到端整合。
包括英文材料
学历+
机器学习+
大模型+
AI agent+
AutoGPT+
LangChain+
强化学习+
算法+
深度学习+
TensorFlow+
PyTorch+
ICML+
NeurIPS+
分布式系统+
运筹优化+
相关职位

logo of alibaba
社招

1、负责淘天自营业务AI大模型的应用和研发工作,深度参与商品全链路智能运营工作、研发基于大模型的内容生成、优化的各项工作,参与ai助手和agent建设,负责大模型结合搜推相关的场景落地。 2、负责大语言模型、多模态大模型的预训练、持续训练、SFT、RLHF等技术,持续提升模型在业务场景应用的效果。 3.、深入分析业务需求,通过技术手段提升作业效率与用户体验,和工程侧同学一起探索AI相关创新产品。 4.、持续关注行业内人工智能技术的发展趋势,引入前沿技术并进行创新应用。

更新于 2025-07-14
logo of alibaba
社招技术类-算法

阿里巴巴国际数字商业集团的智能技术团队,负责阿里巴巴旗下多个国际化电商平台的搜索、推荐、广告、用增、营销、大模型应用等技术。 团队致力于将最前沿的AI技术与国际化电商业务问题深度结合,为用户打造更好更智能化的网上购物体验,同时赋能百万商家实现更高效的经营。 选择加入我们意味着投身入于高速发展的国际化电商业务,一起打造最先进的AI技术以驱动全球电商业务发展。 ● 聚焦前沿大模型技术在电商场景的应用与创新,推动商品理解领域的智能化转型; ● 负责大模型算法的研究、优化及落地实施,涵盖大模型后训练、领域专用大模型、多模态大模型、RAG、Agent等前沿技术; ● 针对电商场景,探索并实现大模型在商品属性挖掘以及抽取,结合搜索及商家服务等环节中的应用,全面提升搜索体验与运营效率; ● 深入挖掘行业数据特性,与产品及研发团队紧密协作,将技术成果转化为实际产品竞争力。

更新于 2025-07-14
logo of dingtalk
社招5年以上技术类-算法

1. 参与大模型Post-Training(SFT, RM, RLHF等)算法的研发与迭代,深入研究并解决训练过程中的效率瓶颈与收敛性问题,持续提升模型的逻辑、推理及生成能力,直接对用户体验负责。 2. 探索并实践面向各领域的高质量数据自动化合成技术(如Self-Instruct, Constitutional AI等),设计并构建高效、可扩展的线上数据飞轮(Data-Flywheel)闭环系统,实现模型能力的自我迭代与增强。 3. 与产品、工程团队紧密协作,洞察并挖掘LLM在企业垂直场景的巨大潜力,参与从0到1的创新产品孵化,推动技术成果的商业化落地。

更新于 2025-09-03
logo of antgroup
社招3年以上技术类-算法

1.数据整理与分析:负责收集、整理征信、信贷、司法领域的资料,对数据进行清洗、标注和分类,确保数据的准确性和可用性,为模型训练提供高质量的数据基础; 2.模型调优与评估:基于现有大模型架构,针对信用管理对话场景,通过调整模型参数、优化训练策略等方式,提升模型对征信、信贷相关问题的理解和回答能力,确保输出的准确性和专业性;运用各种评估指标,如准确率、召回率、F1 值等,对模型效果进行客观评估,及时发现问题并提出改进方案; 3.对话策略制定: 深入理解征信知识和客户需求,结合模型特点,制定合理的对话策略,包括问题引导、答案推荐、情绪安抚等,使客服对话更加自然、流畅和高效,提升客户满意度;根据业务发展和市场变化,及时调整对话策略,确保模型能够适应不断变化的客户需求; 4.知识库建设与维护:协助构建和维护征信知识库,将征信基础知识、信贷知识、司法知识、常见问题解答等内容进行系统整理和更新,为模型提供丰富的知识支持,确保模型能够快速准确地回答客户问题;定期对知识库进行审核和优化,确保知识的准确性和时效性。

更新于 2025-06-20