字节跳动大模型赋能交易与商业场景的技术创新及落地实践研究(VLM)-Commercial AI
任职要求
1、2027届毕业,获得博士学位,人工智能、计算机、数学相关专业优先; 2、立志于将大模型相关技术(LLM/VLM/Omni/Agent等)落地到工业界产生关键影响,作为职业长期发展的目标; 3、优秀的代码能力、数据结构和基础算法功底,熟练Python、C+…
工作职责
团队介绍:Commercial AI 负责中国交易与广告的to B应用统一模型建设,包含基础模型能力、AI Infra、统一商业数据、评测等方向。 课题介绍: 本课题围绕商业、广告、交易等技术场景,以大型语言模型(LLM)、视觉语言模型(VLM)、智能体(Agent)、强化学习、多模态生成等前沿技术为核心支撑,重点聚焦搜索、广告、推荐、电商、生活服务、广告营销、内容生产等关键业务场景,针对性破解传统技术体系存在的瓶颈问题。课题的核心研究目标为:借鉴大模型规模法则(Scaling Law)与生成式人工智能技术思路,深入探索技术与商业业务的深度融合路径,构建适配各垂直商业场景的智能模型及系统架构。同时,着力解决技术落地过程中的效率优化、场景适配、合规管控等关键问题,助力业务规模增长、运营效能提升与用户体验优化,推动商业场景数字化、智能化转型进程。 课题挑战: 1、技术适配性:通用LLM与MLLM在垂直商业交易场景存在领域知识薄弱、工具调用不足、语义对齐偏差等问题,需突破多模态协同、时空建模、低标注学习及搜广推融合技术; 2、效率与性能:大模型时延高、耗算力、吞吐低,难以满足高并发低延迟交易与搜广推需求,需通过轻量化、量化、分布式推理等优化性能与成本; 3、决策与规划:复杂商业决策对长周期建模、多目标优化、自适应要求高,AIGC与Agent易产生幻觉、决策偏差与因果缺失,需强化可信推理与风险约束; 4、落地与合规:需解决系统集成、数据质量、内容可控、隐私安全与合规问题,保障大模型规模化稳定、安全、合规落地。 课题价值: 1、理论价值:探索大模型在多商业场景的Scaling Law可行性,完善推荐大模型、Agent决策、多模态融合等技术体系,丰富AI在商业领域的应用理论; 2、实践价值:破解各商业场景核心痛点,如提升推荐转化、广告ROI、内容生产效率、客服质量等;降低人工成本,实现商业流程自动化;推动搜广推、电商、广告等领域的技术范式革新,支撑业务规模化增长,同时优化用户体验与商家服务能力,构建可持续的商业生态。
我们正在寻找一位兼具商业洞察力与落地执行力的AI产品解决方案专家,您将与我们的AI产品经理紧密协作,成为连接前沿AI技术与支付行业真实业务场景的关键桥梁。您的核心任务是深入支付行业的客户与商家服务一线,设计并交付能够创造真实业务价值的AI解决方案。您不仅要通过这些方案优化我们内部的服务体系,还将负责将其沉淀、包装,打造为可对外商业化的产品,赋能整个支付生态。具体职责包括: 1. 场景深耕与方案设计: 聚焦支付行业的客户服务(如交易咨询、账户问题、权益问答)与商家服务(如入网、对账、风险申诉、营销支持)场景,识别高价值的AI应用机会点,设计可落地的、端到端的整体解决方案。 2. 内部运营与落地验证: 主导AI解决方案在公司内部服务团队的试点和推广,与GBSS服务团队合作,优化业务流程,建立评估指标,确保方案能切实提升服务效率、降低成本、改善客户/商家满意度。 3. 产品反哺与需求提炼: 系统性地收集和分析解决方案在实际应用中的反馈、数据和新的需求,提炼成清晰的产品迭代建议,反哺给AI产品经理,驱动核心AI能力的持续进化。 4. 方案价值塑造与商业拓展: 将内部验证成功的解决方案进行标准化、产品化包装,提炼核心价值主张,撰写方案白皮书、客户案例、产品手册等市场材料,将技术能力转化为客户易于理解的商业价值。协同销售和市场团队,制定解决方案的GTM策略,作为产品专家为潜在客户提供咨询和演示,支持商业谈判,打造行业标杆案例,驱动商业化目标的达成
AI应用解决方案设计与落地 ● 负责企业级AI应用解决方案的设计和落地实施,通过分析客户业务需求,利用钉钉AI工具和平台快速构建业务应用,确保方案能直接支撑客户业务增长和效率提升 ● 打造可复制的商业化解决方案,提供切实可行的AI应用方案,并明确量化商业价值和投资回报率 技术支持与问题解决 ● 提供AI应用相关的技术支持,确保技术实现与商业目标一致,协助销售团队进行技术赋能,提升商业转化率 ● 参与客户商业谈判,提供技术支持以促进交易达成,追踪解决方案实施后的客户业务增长数据,建立成功案例库 效果评估与持续优化 ● 建立AI应用的效果评估体系,关注商业化关键指标的达成情况 ● 跟踪AI技术发展,及时更新应用方案,确保解决方案的商业竞争力,定期分析解决方案的市场表现,提出商业化策略优化建议
我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 1、负责大模型平台的架构设计和核心功能研发,构建云原生架构,设计高可用、高性能的微服务体系; 2、负责构建面向大模型全流程的DevOps,与下游云原生平台深度融合,支撑大模型在公司内各业务生产链路稳定高效地落地; 3、负责万卡规模GPU集群效能分析及优化,通过调度策略优化、在离线混部、GPU虚拟化、存储&网络加速等手段,提升GPU集群使用效率; 4、将平台和框架结合,通过任务调度、弹性容灾、性能优化等措施端到端提升AI生产效率,涉及k8s/kubeflow、网络通信、分布式训练等; 5、优化各AI平台性能,提升系统稳定性和可扩展性,保障大规模并发场景下的服务质量与用户体验; 6、持续研究分析业内创新AI平台产品,优化技术方案,改进产品功能,提升创新能力与产品体验。
我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 1、参与设计实现支持RLHF/DPO等对齐技术的高效训练框架,优化强化学习阶段的Rollout、Reward Model集成、多阶段训练 Pipline; 2、研发支持多机多卡 RL 的分布式训练框架,开发TP/PP/ZeRO-3与RL流程的动态协同机制,解决 RL 算法在超长时序下的显存/通信瓶刭 3、构建端到端后训练工具链,主导框架与 MLOps 平台集成,提供训练可视化、自动超参搜索等生产级能力 4、与公司各算法部门深度合作,参与大语言模型LLM、多模态大模型 MLLM等业务在 SFT/RL领域的算法探索和引擎迭代; 5、参与分析各业务 GPU 利用率与饱和度等指标,结合业务场景持续优化训练框架能力,提升框架领先性。