滴滴模型应用|用户与策略产品
任职要求
1. 本科及以上学历,计算机、软件工程、产品设计、数据分析、人工智能等相关专业优先,在校生(本科或研究生),需保证至少6个月全职实习时间,2027年毕业者优先考虑。 2. 具备良好的产品思维,能够快速理解智能出行行业业务逻辑及AI打车产品场景,精准捕捉用户需求与业务痛点。 3. 有AI…
工作职责
1. 协助产品团队完成智能出行AI助手相关产品的规划、需求梳理及方案落地,参与产品从需求调研到上线迭代的全流程,辅助输出产品需求文档(PRD)、产品原型等核心资料。 2. 负责智能出行AI领域相关竞品监测与分析,定期输出竞品分析报告,提炼竞品优势、不足及行业趋势,为产品优化、功能创新及策略调整提供可落地的参考依据。 3. 对接业务端与算法端需求,深度参与AI算法模型的需求拆解、场景适配及效果评估,搭建业务需求与算法模型之间的沟通桥梁,推动算法模型在打车场景中的落地应用,保障AI产品体验与业务目标达成。 4. 协助开展项目管理工作,跟进产品需求落地进度,协调研发、运营、测试等跨部门资源,同步项目进展、同步问题并推动解决,确保项目按计划迭代、高效运转。 5. 辅助收集用户反馈、业务端反馈及产品数据,参与产品效果复盘,提出产品优化建议,助力AI打车产品体验持续提升。
1.针对用户分群和内容场景的特性,通过包括但不限于Prompt 工程和传统工程等方式,设计,执行和验证个性化策略,优化用户体验; 2.与模型和工程团队合作,进行深入的产品策略研究,定期评估现有策略的效果,并根据业务需求进行调整。
Team Introduction: The ByteDance Recommendation Architecture Team is responsible for the design and development of the recommendation system architecture for ByteDance's related products. It ensures the stability and high availability of the system, optimizes the performance of online services and offline data streams, resolves system bottlenecks, and reduces cost overheads. The team also abstracts the common components and services of the system, builds the recommendation middle - office and data middle - office to support the rapid incubation of new products and enable ToB services. 团队介绍: 字节跳动推荐架构团队,负责字节跳动旗下相关产品的推荐系统架构的设计和开发,保障系统稳定和高可用;负责在线服务、离线数据流性能优化,解决系统瓶颈,降低成本开销;抽象系统通用组件和服务,建设推荐中台、数据中台,支撑新产品快速孵化以及为ToB赋能。 课题背景: 在当今数字化时代,推荐系统已成为众多领域(如电商、信息资讯等)实现个性化服务、提升用户体验和竞争力的关键技术。然而,随着技术的不断发展和业务场景的日益复杂,推荐系统面临着诸多严峻挑战。 一方面,推荐系统自身的复杂性急剧增加。大量推荐策略不断演进迭代,且系统状态动态变化,但缺乏有效手段自动跟踪评估策略有效性并下线低 ROI 策略,导致系统存在较多低效策略。同时,推荐系统依赖多种基础组件,其复杂负载模型给底层组件参数配置和性能调优带来巨大困难,日常开发迭代中的问题排查等工作消耗大量人力,亟需提升开发效率、降低人力成本。 另一方面,随着电商行业等领域的激烈竞争,传统推荐系统在多样性、创新性和个性化方面的短板愈发凸显,难以满足用户日益增长的多元需求。生成式人工智能技术虽带来新突破,但在实际应用中面临成本效率、全域数据协同、数据隐私与安全以及技术变革应对等诸多难题。 此外,随着大模型的快速发展,推荐系统对用户行为序列数据的存储和质量要求不断提高,数据质量对模型性能的影响愈发关键。同时,模型规模的扩大和多模态数据的涌现,使得推荐系统在数据处理环节面临冗长、资源利用不合理以及传统数据处理框架难以满足多模态数据处理需求等问题。 课题挑战: 策略管理与优化:构建一套智能化系统,实现推荐策略的规范化定义、长期及离线评估、无效策略自动识别与下线,以及相关代码配置的下线。 自适应调优与故障诊断:针对推荐系统多样化业务负载,利用大模型能力完成系统及底层组件的参数和配置调优,并探索自适应故障诊断方案,提供全局视角的故障追踪、定位和分析能力。 成本与效率平衡:在推荐系统应用生成式技术时,解决模型训练和运行的高成本问题,平衡成本与效率,在有限资源下实现高效推荐。 全域数据处理:应对电商等横向全域场景下海量异构数据,提升和保障数据质量与准确性,标准化供给数据给全域推荐模型,并实现低成本跨端服务,同时,确保数据隐私与安全,合规使用数据。 数据存储与质量提升:研发低成本高性能存储引擎,设计灵活的Schema Evolution机制,实现数据高并发实时写入与训推一致性,深入探究数据质量与模型预测性能的量化关系,构建基于DCAI理念的数据和模型相关性分析工具及训练数据自动化处理链路。 多模态数据与异构计算:构建适用于推荐系统的多模态数据异构计算处理框架,解决数据读取、框架整合、高性能算子编排等问题,提高数据处理和模型训练效率,建立以Python为核心的开发者生态。 推荐大算力模型效率优化:随着大模型在CV/NLP/多模态以至于AGI领域的不断突破,推荐场景下的大算力驱动能够帮助模型更全面深刻理解用户偏好,进而更好地理解用户需求,挖掘用户潜在兴趣,进而带来更好地用户体验。更大规模的推荐模型需要更大的算力,如何平衡好算力开销和效果收益,需要架构和算法工程师深度Co-Design。
我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 1、参与设计实现支持RLHF/DPO等对齐技术的高效训练框架,优化强化学习阶段的Rollout、Reward Model集成、多阶段训练 Pipline; 2、研发支持多机多卡 RL 的分布式训练框架,开发TP/PP/ZeRO-3与RL流程的动态协同机制,解决 RL 算法在超长时序下的显存/通信瓶刭 3、构建端到端后训练工具链,主导框架与 MLOps 平台集成,提供训练可视化、自动超参搜索等生产级能力 4、与公司各算法部门深度合作,参与大语言模型LLM、多模态大模型 MLLM等业务在 SFT/RL领域的算法探索和引擎迭代; 5、参与分析各业务 GPU 利用率与饱和度等指标,结合业务场景持续优化训练框架能力,提升框架领先性。
【业务介绍】 作为公司统一的机器学习平台团队,负责调度公司所有模型训练与推理资源;基于自建的训推引擎,构建公司统一的机器学习平台,为公司所有算法同学(稀疏 & 稠密,含 LLM) 模型迭代提供端到端的一站式服务;包括 数据生产,模型训练,模型上线,特征管理,模型测试,资源管控等一系列能力。 【岗位职责】 1、负责机器学习链路,离在线数据相关的开发工作,包括样本数据、特征数据等的数据链路搭建、任务运维和调优、性能优化等 2、负责小红书大规模机器学习平台的后台系统设计和开发工作;包括样本平台,特征平台,训练平台,推理平台等AI应用后台建设等; 3、研究分析业内AI平台产品,优化技术方案,改进产品功能,完善产品体验。