字节跳动大模型算法工程师Leader-商业化智能销售
任职要求
1、机器学习、人工智能、数理统计等相关专业背景; 2、熟悉大模型相关基础知识,熟悉LLM的训练或Fine-tuning的方法,例如SFT/RLHF经验,或熟悉强化学习(RL)概念,深入了解PPO相关算法知识; 3、优秀的代码工程能力、数据结构和基础算法功底,熟练掌握C/…
工作职责
1、自助服务技术团队,致力于打造业界领先的广告业务(ToB)智能销售,从经营到投广全方位服务广告主的成长,也要预期为平台带来更多收入; 2、相比一般的智能客服机器人,除了回答问题之外,智能销售还要理解客户深层需求、诊断客户问题,在不同渠道、触点位置进行主动服务,提供合适的广告产品或投广建议; 3、主要工作内容:探索销售业务形态,带领团队深度参与智能销售的完整系统建设与优化,包括但不限于模型训练、推理、Agent系统工程建设等。
1、自助服务技术团队,致力于打造业界领先的广告业务(ToB)智能销售,从经营到投广全方位服务广告主的成长,也要预期为平台带来更多收入; 2、相比一般的智能客服机器人,除了回答问题之外,智能销售还要理解客户深层需求、诊断客户问题,在不同渠道、触点位置进行主动服务,提供合适的广告产品或投广建议; 3、主要工作内容:探索销售业务形态,带领团队深度参与智能销售的完整系统建设与优化,包括但不限于模型训练、推理、Agent系统工程建设等等。
● 作为海外AI业务高级解决方案架构师SA,同时承担SA leader职责,支持 AI MaaS(模型即服务)销售团队拓展国际客户的 AI 大模型业务,提升阿里大模型产品在海外市场的 Token 调用量。 ● 与全球客户就 AI 业务需求与技术架构进行深入沟通,准确理解业务与技术诉求,识别并引导AI MaaS商机落地。 ● 基于阿里云百炼平台上的 Qwen、Wan 等大模型产品,为客户设计可落地的 AI 大模型与云上解决方案,涵盖但不限于 Qwen、Wan、GPU、云IaaS/PaaS等产品。 ● 针对客户所处行业及具体业务场景(如社交平台、模型平台、视频平台、AI 数据服务、企业 AI 提效等),提供包括模型选型、架构设计、提示词工程(Prompt Engineering)、RAG 构建、Agent 开发等方面的咨询建议,助力客户业务高效落地。 ● 根据客户需求,设计并开发相关业务场景的 Demo,通过 Prompt 工程、工作流编排等方式,向客户进行产品演示与技术交流,推动项目顺利落地。 ● 承担AI MaaS SA leader的管理职责,负责组内SA的培养和管理责任,并针对区域和场景化的方案抽象,组织方案规模化GTM和赋能。 ● 协同并推动内部 AI 产品研发团队,将客户需求转化为产品改进需求,持续优化 AI 模型能力,并为重点客户提供 AI 产品及运维问题的专项支持。

● 作为海外AI业务高级解决方案架构师SA,同时承担SA leader职责,支持 AI MaaS(模型即服务)销售团队拓展国际客户的 AI 大模型业务,提升阿里大模型产品在海外市场的 Token 调用量。 ● 与全球客户就 AI 业务需求与技术架构进行深入沟通,准确理解业务与技术诉求,识别并引导AI MaaS商机落地。 ● 基于阿里云百炼平台上的 Qwen、Wan 等大模型产品,为客户设计可落地的 AI 大模型与云上解决方案,涵盖但不限于 Qwen、Wan、GPU、云IaaS/PaaS等产品。 ● 针对客户所处行业及具体业务场景(如社交平台、模型平台、视频平台、AI 数据服务、企业 AI 提效等),提供包括模型选型、架构设计、提示词工程(Prompt Engineering)、RAG 构建、Agent 开发等方面的咨询建议,助力客户业务高效落地。 ● 根据客户需求,设计并开发相关业务场景的 Demo,通过 Prompt 工程、工作流编排等方式,向客户进行产品演示与技术交流,推动项目顺利落地。 ● 承担AI MaaS SA leader的管理职责,负责组内SA的培养和管理责任,并针对区域和场景化的方案抽象,组织方案规模化GTM和赋能。 ● 协同并推动内部 AI 产品研发团队,将客户需求转化为产品改进需求,持续优化 AI 模型能力,并为重点客户提供 AI 产品及运维问题的专项支持。
我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 1、参与设计实现支持RLHF/DPO等对齐技术的高效训练框架,优化强化学习阶段的Rollout、Reward Model集成、多阶段训练 Pipline; 2、研发支持多机多卡 RL 的分布式训练框架,开发TP/PP/ZeRO-3与RL流程的动态协同机制,解决 RL 算法在超长时序下的显存/通信瓶刭 3、构建端到端后训练工具链,主导框架与 MLOps 平台集成,提供训练可视化、自动超参搜索等生产级能力 4、与公司各算法部门深度合作,参与大语言模型LLM、多模态大模型 MLLM等业务在 SFT/RL领域的算法探索和引擎迭代; 5、参与分析各业务 GPU 利用率与饱和度等指标,结合业务场景持续优化训练框架能力,提升框架领先性。