logo of antgroup

蚂蚁金服蚂蚁集团-AI研发平台技术专家-杭州/上海/北京【数据平台】

社招全职3年以上技术类-开发地点:北京 | 上海 | 杭州状态:招聘

任职要求


1. 具备扎实的计算机相关基础知识,如Linux编程环境、数据库应用、基础网络、常用算法等;
2. 精通Java/Python/Golang中至少一门语言的工程化实践,具备高并发/分布式系统开发经验,熟悉语言生态下的主流框架与工具链
3. 对如下一个或多个领域有深入理解和实践,或有浓厚兴趣:
  (1)机器学习工程化方向:深度参与过LLM/NLP/多模态/搜索推荐系统等领域的全链路技术实现。具备MLOps体系建设经验,包括但不限于训练框架适配、模型服务平台开发、监控治理系统设计
    (2)大模型前沿技术方向: 掌握大模型高效微调技术体系(Lora/P-Tuning/RLHF),精通量化压缩、动态批处理等推理优化方案;具备大模型应用架构能力:提示工程(Prompt Engineering)、RAG增强检索、Agent框架开发(LangChain/LlamaIndex)
   (3) 云原生架构方向:精通Kubernetes扩展开发(Operator/CRD设计),具备分布式调度系统研发经验(任务编排/资源仲裁;主导过异构计算集群管理、弹性伸缩调度策略优化等生产级解决方案
4. 对ML生态系统(PyTorch/Kubeflow/MLflow等)有开源代码贡献、知名竞赛(ACM/IOI/topcoder/kaggle)排名靠前、有顶会论文( NIPS/KDD等)优先考虑。
5. 具备产品思维,有产品化工程经验者优先考虑。

工作职责


1. 支撑蚂蚁集团在各个业务领域的MLOps&LMOps算法研发工作,覆盖机器学习系统多个子方向领域的工作,包括:数据配比&全链路血缘建设、数据实验&分析、深度学习/大模型预训练/后训练/推理等,建设支持AI全链路的研发平台与AI垂类应用开发平台,实现算法研发效率、和资源利用率的最大化,灵活可扩展的支持不同领域的个性化应用开发需求,为蚂蚁大模型研发链路及应用研发探索新的研发模式;
2. 对平台进行全局性和前瞻性的架构设计和核心技术细节实现,帮助团队攻克各种技术难关,保障和提升平台稳定性。
包括英文材料
Linux+
算法+
Java+
Python+
Go+
高并发+
分布式系统+
机器学习+
大模型+
NLP+
推荐系统+
系统设计+
Prompt+
RAG+
AI agent+
LangChain+
LlamaIndex+
Kubernetes+
PyTorch+
Kubeflow+
Kaggle+
RLHF+
MLflow+
NeurIPS+
相关职位

logo of aliyun
社招5年以上云智能集团

1、技术方案设计 • 收集、识别、分析平台设计目标及管理需求,围绕资源管理平台确定相应技术方案的目标、范围和交付成果; • 基于需求分析,进行技术可行性分析和方案评审,结合当前的技术架构进行合适的技术选型、功能设计、技术架构、数据架构和开发流程等。 2、技术实现 • 基于技术方案的拆解,按照任务目标和产出规范,完成任务/子任务的设计、编码开发和系统功能实现; • 负责核心功能的架构与代码模板的编写,开发与维护资源管理平台核心业务模块,优化程序性能等; • 对编码进行阶段性的讨论和CodeReview,并通过调试优化,推动代码成功部署; • 对开发中和部署后的程序进行必要的维护和迭代,包括值班oncall、bug排查、问题诊断、产品体验改善、性能和成本优化等; • 编写技术文档,如操作手册、故障排除指南、API文档等,以支持日常答疑运维工作。 3、安全、稳定、效率和性能优化 • 运用产品优化技术和方法,实现安全保障和优化系统性能,提高平台系统安全性及客户使用体验。 4、技术预研 • 跟踪和了解国内外资源管理平台技术发展和趋势,结合业务实际需要提供有效的技术支持和架构建议。 5、技术规划 • 理解业务重点,基于业务需求作出高可用、高可靠、高拓展性的技术架构规划和落地。

更新于 2025-09-22
logo of antgroup
社招2年以上技术类-开发

蚂蚁 PaaS 平台是基于蚂蚁多年在金融级云原生领域的技术积累,围绕 Kubernetes 等云原生技术打造的应用 PaaS 平台,并通过下沉技术风险、安全可信、数据智能等能力,实现效率与风险的极致平衡,满足蚂蚁多元化业务需要。 1、基于 Kubernetes 的云原生 PaaS 平台研发,解决蚂蚁超大规模场景下云原生系统性能、高可用与稳定性等问题 2、参与云原生大模型推理服务平台建设,包括模型部署、推理服务高可用高吞吐等能力建设 3、参与变更管控与智能变更平台建设,包括策略代码化、风险分析、根因定位与变更Agent等能力建设 4、面向客户端到端需求分析、技术选型、架构设计、代码实现与功能交付 5、参与云原生 PaaS 开源技术品牌 KusionStack 的建设

更新于 2025-06-10
logo of bytedance
社招A116723

团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok直播研发团队,旨在实现TikTok直播业务的研发工作,搭建及维护业界领先的产品。 加入我们,你能接触到包括:社交互动、营收活动、主播生态、消费订阅、游戏直播、公会&运营平台等核心业务场景,支持产品在全球赛道上高速发展; 也能接触到包括服务架构、大模型算法、基础技术等方向上的技术挑战,保障业务持续高质量、高效率、且安全地为用户服务;同时还能为不同业务场景提供全面的技术解决方案,优化各项产品指标及用户体验。 在这里, 有大牛带队与大家一同不断探索前沿, 突破想象空间。 在这里,你的每一行代码都将服务亿万用户。 在这里,团队专业且纯粹,合作氛围平等且轻松。 目前在北京,上海,杭州、广州、深圳分别开放多个岗位机会。 1、参与直播容量管理、成本管理和预算优化工作; 2、深入理解直播业务,理解产品视角下完整的营收和成本的逻辑,熟悉公司财务和经营分析体系; 3、深入理解国际化技术体系,设计或指导成本相关的优化工作; 4、构建数据驱动的成本优化模式,应用AI提升效率。

更新于 2025-03-03
logo of aliyun
社招5年以上云智能集团

1、负责渠道商业合作伙伴的赋能和售前支撑工作,通过与伙伴合作面向客户,共同拿到业务结果,提升阿里云的销售额 2、作为技术专家,向合作伙伴和客户提供业务上云或者支撑关键需求实现的云计算解决方案,指导客户构建弹性、高可用的互联网架构;帮助客户构建业务系统、云底座、监控体系、DevOps、大数据、AI等系统;从成本、效率、稳定性三个维度提升客户的IT能力;确保方案可落地、有竞争力 3、负责典型细分行业(游戏、音视频、媒体资讯、在线教育、数字营销、人工智能等)的市场洞察、解决方案、打法策略、伙伴合作策略的制定及落地,深入理解该行业的商业模式,能够把握行业的市场和技术发展趋势,推动行业产品、解决方案和合作生态的落地 4、建立行业影响力,组织内外部行业沙龙,做技术分享,传播结合阿里云的落地最佳实践 5、赋能合作伙伴进行客户方案设计及落地全流程,包括POC演示、功能/性能测试、项目交付风险分析、项目交付沟通等,在保证性能和安全性的前提下做到成本、性价比、客户价值的最优 6、为伙伴和客户提供整体技术平台的咨询服务,通过赋能并与合作伙伴深入合作共创,增强解决方案的竞争力,提高解决方案交付的成熟度

更新于 2025-08-19