字节跳动大模型算法工程师(推荐大模型)-抖音-筋斗云人才计划(北京/上海/杭州/深圳)
任职要求
1、获得博士学位,计算机/数学等相关专业的优先; 2、具有扎实的机器学习基础和编码能力,在机器学习、NLP、CV等有较深入的研究经验,熟练掌握主要的算法和数据结构; 3、在搜索推荐广告和大模型领域,有参与或…
工作职责
团队介绍:Data-抖音团队,负责抖音APP的推荐算法、内容算法、对话算法及大数据工作,对接各场景业务(短视频,直播,图文,电商,社交,生态,投稿,消息,同城,生活服务,音乐,评论,内容理解&安全、智能对话等)。我们的工作涉及大规模推荐算法的优化、复杂约束的优化问题的解决、内容理解、LLM应用以及新业务方向探索、CV/NLP等多个学术领域的算法改进工作、对多种场景的推荐架构的设计和实现和对产品数据的复杂深入的分析工作。在这里,你可以深入钻研机器学习算法的改进和优化,探索工业界最领先的推荐系统架构和推荐大模型算法、可以通过使用最新的大模型等技术支持抖音的数字人、智能客服、AI工具等创新探索;可以通过对产品的深度理解和思考,将算法应用到业务中去;也可以通过对产品和内容生态的深度分析,影响产品未来的发展方向。 课题背景:探索推荐领域下的大模型新范式,突破现在持续了较长时间的推荐模型结构和Infra的方案,且效果大幅好于现在的基线模型,在抖音短视频/直播/电商/头条/剪映等多个业务场景上得到应用。推荐领域的大模型是比较有挑战的事情,推荐对工程效率的要求更高,且用户的推荐体验上是个性化的,本课题会以下多个方向来做深入的研究,探索和建设推荐场景的大模型方案,大幅提升推荐模型的天花板。 课题挑战:自然语言领域LLM的出现,效果在众多垂直任务上都好于sota模型,从推荐领域看过去工业级推荐系统在较长的时间没有大幅的变化过。本项目旨在探索推荐领域下的大模型方案,改变现在持续了较长时间的推荐模型结构和Infra的基本范式,且效果大幅好于现在的模型,在抖音短视频/直播等多个业务场景上得到应用。但是怎么做好推荐领域的大模型也是一个比较有挑战的事情,推荐对工程效率的要求更高,且用户的推荐体验上是个性化的,以及如何短视频、直播等体裁上做号内容的表征也是需要被解决的问题,这里会从模型参数scaling up、内容和用户的表征学习、内容理解多模态、超长序列建模、生成式推荐模型等多个方向来做深入的研究,对推荐场景的模型做系统性的升级。 课题内容: 1、跨模态的对齐和统一表征学习(推荐、内容多模态、自然语言); 2、推荐模型参数和算力scaling up; 3、超长序列建模; 4、生成式推荐模型; 5、涉及研究方向:推荐算法、推荐大模型。
【岗位概述】 我们正在寻找一位AI驱动大使,负责 50-100 万级成长型 KA 客户的全生命周期管理。你将是中小企业智能化转型的布道者与合伙人——通过客户拓展、商机转化、流失客户赢回,深度推广阿里云 AI 大模型及 GPU 算力产品,为客户配置“AI+云”融合解决方案,推动企业上云与业务智能增长,重新定义上云的价值边界。 【成长与未来】 在这个岗位,你将掌握AI 原生时代的客户经营方法论,成长为既懂业务又懂技术的复合型销售人才,深度参与阿里云 AI 产品的商业化闭环,积累从需求挖掘到方案落地的完整经验。未来,你可向区域 KA 负责人、AI 行业解决方案专家、产品战略等多方向发展——你的成长路径,由你创造的价值决定! 【工作职责】 1. 负责目标 KA 客户的线下拜访与深度关系建立,运用三图一表等工具梳理客户业务架构、关键干系人,精准挖掘AI 与云融合的潜在项目机会。 2. 制定并执行数据驱动的客户覆盖计划,通过预判客户需求实现从“响应式销售”到“预测式价值共创”的跃迁,确保重点客户获得持续高效的覆盖与服务。 3. 建立并动态维护客户档案,跟踪AI 项目 POC 验证、测试、部署等关键节点,保障客户信息与项目进展的准确性、时效性。 4. 敏锐识别客户云化及 AI 相关核心需求(如智能客服、企业知识库、AIGC 内容生成等场景),转化为有效销售线索,协同解决方案架构师(SA)设计高适配性的“AI+云”技术方案。 5. 主导项目商务全流程,制定针对性商务策略,统筹报价、谈判及签约工作,推动客户完成 AI 产品与云服务的落地。 6. 执行 Winback 专项任务,识别流失至他云或 IDC 的客户,结合AI 产品差异化优势制定赢回策略,协同服务与迁移团队降低客户切换成本,提升回流成功率与满意度。 7. 基于阿里云七大件产品,为客户配置高性价比的“AI+云”融合解决方案,优化客户成本结构的同时保障销售毛利。 8. 对接财务、法务等部门完成合同审批与签约,确保项目合规落地。
【岗位概述】 我们正在寻找一位AI驱动大使,负责 50-100 万级成长型 KA 客户的全生命周期管理。你将是中小企业智能化转型的布道者与合伙人——通过客户拓展、商机转化、流失客户赢回,深度推广阿里云 AI 大模型及 GPU 算力产品,为客户配置“AI+云”融合解决方案,推动企业上云与业务智能增长,重新定义上云的价值边界。 【成长与未来】 在这个岗位,你将掌握AI 原生时代的客户经营方法论,成长为既懂业务又懂技术的复合型销售人才,深度参与阿里云 AI 产品的商业化闭环,积累从需求挖掘到方案落地的完整经验。未来,你可向区域 KA 负责人、AI 行业解决方案专家、产品战略等多方向发展——你的成长路径,由你创造的价值决定! 【工作职责】 1. 负责目标 KA 客户的线下拜访与深度关系建立,运用三图一表等工具梳理客户业务架构、关键干系人,精准挖掘AI 与云融合的潜在项目机会。 2. 制定并执行数据驱动的客户覆盖计划,通过预判客户需求实现从“响应式销售”到“预测式价值共创”的跃迁,确保重点客户获得持续高效的覆盖与服务。 3. 建立并动态维护客户档案,跟踪AI 项目 POC 验证、测试、部署等关键节点,保障客户信息与项目进展的准确性、时效性。 4. 敏锐识别客户云化及 AI 相关核心需求(如智能客服、企业知识库、AIGC 内容生成等场景),转化为有效销售线索,协同解决方案架构师(SA)设计高适配性的“AI+云”技术方案。 5. 主导项目商务全流程,制定针对性商务策略,统筹报价、谈判及签约工作,推动客户完成 AI 产品与云服务的落地。 6. 执行 Winback 专项任务,识别流失至他云或 IDC 的客户,结合AI 产品差异化优势制定赢回策略,协同服务与迁移团队降低客户切换成本,提升回流成功率与满意度。 7. 基于阿里云七大件产品,为客户配置高性价比的“AI+云”融合解决方案,优化客户成本结构的同时保障销售毛利。 8. 对接财务、法务等部门完成合同审批与签约,确保项目合规落地。
大模型具备很强的泛化及理解世界能力,在小红书内的众多生产场景遍地开花,大模型的训练和部署已成为许多算法工程师的日常。在多团队、多业务频繁使用的大规模GPU集群上,如何能够通过高效的GPU调度策略,使大家不仅能丝滑地完成训练及部署任务,同时也能充分激发大规模GPU集群的效能,是行业公认的关键挑战。在这里,你可以聚焦LLM场景,接触到超大规模GPU集群,并使用真实负载数据进行深入分析及技术探索。欢迎加入我们,一起探索领先技术改变世界! 工作职责: 1、负责万卡规模GPU集群效能分析及优化,通过调度策略优化、在离线混部、集群调度、GPU虚拟化、故障快速恢复、存储&网络加速等手段,提升大规模GPU集群的整体使用效率。 2、负责构建面向大模型训练、微调、推理、部署全流程LLMOps,与下游云原生平台深度融合,支撑大模型在公司内各业务生产链路稳定高效地落地。 3、持续关注业界最新的GPU资源调度相关技术动态,探索建设业界领先的资源调度策略及方法,构建下一代大规模AI资源调度系统。
【业务介绍】 我们是小红书内稠密类模型(LLM/MLLM/SD/CV/NLP)统一的AI平台QuickSilver,负责调度公司内所有稠密类模型训练与推理资源,基于自建的训推引擎,为公司所有AI算法同学迭代业务模型提供端到端一站式AI服务;包括数据管理,模型管理,模型训练、压缩、推理、部署,服务管理,资源调度等一系列能力。 工作职责: 1、负责稠密类模型训练推理开发平台的架构设计和核心功能研发 2、设计和实现大模型训练部署流程,包括模型fine-tuning、推理服务化等 3、构建云原生架构,设计高可用、高性能的微服务体系 4、优化平台性能,提升系统稳定性和可扩展性