快手大模型垂类应用算法工程师实习生
任职要求
1、自然语言处理、机器学习、人工智能、计算机科学等相关专业硕士及以上学历; 2、在NLP、LLM、CV、RL等领域具有实践或理论经验,熟悉主流大模型和算法,有扎实的算法知识; 3、具备较强的工程实现能力,熟悉主流的大语言模型(如Deepseek、Qwen、L…
工作职责
1、专注于大语言模型(LLM)的前沿技术研究,包括但不限于CPT、SFT、RL,以提升复杂指令遵循能力、多模态大模型、多智能体系统、RAG等方向; 2、探索多模态大模型在电商领域的应用,以及检索增强的LLM等创新应用; 3、搭建自动化的数据处理管道和训练框架,实现模型的快速迭代和评估; 4、参与模型评估工作,包括评估流程的建设与完善、评估方法的设计与优化。
1、深入了解影视剧作业务场景特点及需求,负责相关文本算法的研究及模块研发,满足业务需求,沉淀积累算法技术经验; 2、把高水平成果以论文/专利等形式发表; 3、持续密集跟进学界及业界相关领域的成果,探索在我们工作中的应用价值。
【课题说明】 传统销售模式中,销售人员通过电销系统触达商户,对商户进行营销/运营触达,整体链路人工依赖率高。随着大模型技术的快速发展,基于大模型的智能外呼在提升电销覆盖率和转化率方面展现出极大潜力。 本课题致力于将大模型技术和智能外呼任务相结合,优化美团智能外呼系统,增强其在复杂对话环境下的意图理解与灵活应对能力。力图实现更自然的语音交互、更精准的营销策略,以及更灵活的应答处理等。 【建议研究方向】 1.转化信号奖励建模:依托业务场景多轮对话的真实转化信号,构建商家画像、对话文本特征信号以及交互环境特征,预估对话的转化率,进而通过强化学习(DPO/GRPO/RLHF)引导模型营销话术生成。 2.销售领域垂类大模型:通过收集多场景销售数据以及美团广告产品知识,通过continue-Pretraining构建垂类通用销售模型基座,支持多业务场景快速支持应用。 3.Multi-Agent交互式外呼系统:通过构建任务规划、流程监督、对话营销等多个agent交互逻辑,在较低响应耗时条件下,实现最佳的电话沟通效果。
大模型训练工程师 工作内容: 深入参与垂类场景Agent大模型的预训练和后训练,构建领域对话大模型。 具体内容: 1. 支持预训练和后训练任务,并在导师指导下完成 PPO/DPO/GRPO 等算法应用及改进,支持大模型分布式训练实验。 2. 协助构建奖励模型:偏好数据清洗、特征工程、鲁棒性测试,跟踪实验指标及可视化分析。 3. 驱动效果闭环:搭建离线多维度指标与在线 A/B 体系,打造自迭代数据飞轮。
团队介绍:数据平台是字节跳动数据中台部门,为公司多业务线(包括抖音、电商、直播和生活服务等)提供一站式大数据解决方案,涵盖数据的生产、清洗、传输、建模、分析等全流程链路,提供数据开发、实验评估、画像标签、增强分析等多元场景解决能力。同时,数据平台部门也致力于把字节跳动积累沉淀的数据中台解决方案做商业化输出,让更多行业能够应用我们的产品能力构建自己的数据中台。在火山引擎上,我们提供了营销增长套件,数据中台等相关产品解决方案,为泛互联网、金融、汽车、新零售等行业提供了行业解决方案。 1、负责多模态数据处理的算法建设; 2、基于豆包家族模型、开源模型或垂类领域模型研发多种模态数据处理的算子,使其性能和效果达到SOTA水平。