拼多多大模型应用算法专家/工程师
任职要求
1)计算机、人工智能、数学、统计学等相关专业,硕士及以上学历; 2)1年+大模型相关项目经验(如LLM预训练、LLM后训练、Prompt Engineering、RAG、Agent等); 3)熟悉Transformer架构和RL算法,理解注意力机制、位置编码、RoPE、ALiBi、PPO、DPO、GRPO等关键设计; 4)熟练掌握Python,熟悉PyTorch/DeepSpeed/HuggingFace/Megatron/Verl等训练框架; 5)具备扎实的NLP基础,熟悉BERT、T5、GPT等模型结构及其应…
工作职责
1)模型应用落地:负责Prompt设计、Few-shot/Zero-shot优化、Continual Pretrain、SFT/RL、RAG链路搭建,提升模型在垂直场景的效果与稳定性,并落地业务解决方案,如AI搜索、智能问答、内容生成、对话系统等; 2)数据构建与评估:构建高质量指令数据、偏好数据、评估集,设计自动化评估指标(如BLEU、ROUGE、人工一致性、幻觉率); 3)系统协同优化:与工程团队协作,提升模型的训练效率和推理效率,包括但不限于KV-Cache、量化、投机解码等技术,以及部署链路(如vLLM、TensorRT、Triton)的优化; 4)业务效果闭环:建立A/B实验体系,跟踪模型上线效果,持续迭代优化,推动业务指标(如CTR、转化率、用户满意度)提升。
1、围绕高德核心业务场景,结合大模型技术实现端到端简化,提升业务效果。负责大模型应用的开发落地工作,包括但不限于LLM应用、Prompt工程、SFT、多模态理解、知识库构建和优化等方面; 2、负责将大模型应用到实际业务场景,包括但不限于销售流程、商家经营、内容生成等业务领域和环节; 3、能够运用多模态理解大模型,实现对非结构化服务数据(店铺装修素材、菜单、评价、商品等)的深度理解和使用。
1、围绕高德核心业务场景,结合大模型技术实现端到端简化,提升业务效果。负责大模型应用的开发落地工作,包括但不限于LLM应用、Prompt工程、SFT、多模态理解、知识库构建和优化等方面; 2、负责将大模型应用到实际业务场景,包括但不限于销售流程、商家经营、内容生成等业务领域和环节; 3、能够运用多模态理解大模型,实现对非结构化服务数据(店铺装修素材、菜单、评价、商品等)的深度理解和使用。
1、LLM模型应用落地:参与LLM在搜索内部的应用,探索LLM的创新落地场景; 2、RAG技术研究与落地:参与RAG技术在搜索内部的应用与创新,提升快手搜索智能问答效果; 3、技术优化与创新:持续优化现有的算法技术,推动算法创新,不断业务效果和用户体验; 4、跨团队合作:与产品团队、工程团队和业务团队紧密合作,理解业务需求,将算法技术转化为实际的产品和解决方案; 5、算法评估与改进:负责对算法模型进行评估和改进,提高算法的准确性、效率和可解释性。
1. 参与大模型Post-Training(SFT, RM, RLHF等)算法的研发与迭代,深入研究并解决训练过程中的效率瓶颈与收敛性问题,持续提升模型的逻辑、推理及生成能力,直接对用户体验负责。 2. 探索并实践面向各领域的高质量数据自动化合成技术(如Self-Instruct, Constitutional AI等),设计并构建高效、可扩展的线上数据飞轮(Data-Flywheel)闭环系统,实现模型能力的自我迭代与增强。 3. 与产品、工程团队紧密协作,洞察并挖掘LLM在企业垂直场景的巨大潜力,参与从0到1的创新产品孵化,推动技术成果的商业化落地。