拼多多【商业化】大模型应用算法工程师
任职要求
1)熟悉GPT、QWen、QWen-VL、InternVL、GLM等大模型的原理、预训练、SFT、RL训练方法,掌握PyTorch、TensorFlow框架,有相关AIGC项目实践经验; 2)熟悉Diffusion Model、Flux、GAN、VAE等图像视频生成算法原理,有相关项目实践经验; 3)熟悉Agent WorkFlow设计,了解Agent开源框架(如LangChain、LlamaIndex、AutoChain)使用方法,有一定的大模型训练加速平台(如DeepSpeed、Megatron-LM、Ray)使用经验; 4)对大模型应用开发,效果迭代优化方向有热情,有较好的团队合作能力,能够与工程、产品团队紧密合作,高效推进项目进展。
工作职责
1)负责拼多多核心电商搜索、推荐、商业化场景大模型AIGC算法的开发与优化,支持业务场景(如AI交互式对话搜索,智能导购,图文创意生成、数字人等)高效落地; 2)负责大模型Agent、RAG系统全流程研发工作,包括样本标注,数据处理,模型训练(PreTrain、SFT、RL等),Prompt Engineer,WorkFlow设计与开发,评价指标设计; 3)负责Diffusion、Flux等算法在电商图像、视频生成领域的算法优化,追踪前沿技术,持续提升大模型内容生成的质量,赋能业务创新。
1.负责拼多多核心电商搜索、推荐、商业化场景大模型Agent的开发与优化工作,支持业务场景(如AI交互式对话搜索,智能导购,图文创意生成、数字人等)高效落地; 2.负责大模型Agent、RAG系统全流程研发工作,结合业务需要,与算法团队搭档,推进 AIGC 项目在各个场景落地以及效果的持续优化。 3.设计高并发分布式架构,优化检索-生成链路性能,解决高并发环境下的延迟问题,保障服务高性能和SLA。 4.探索大模型在电商推荐、搜索、广告投放等场景的落地,推进技术、产品、数据的闭环协同。
1、跟踪大语言模型、多模态、强化学习等算法的最前沿进展,将相应技术赋能到小红书实际的业务场景中,包括社区,商业化,交易等,持续推动AGI在业务场景下的落地应用; 2、基于成熟的AI平台服务,构建完善的AI原生应用和X+AI应用,包括如智能助理、知识问答、深度研究等,打造具有核心用户价值的热点应用; 3、探索大语言模型、多模态模型、扩散模型等在搜广推场景的落地方案。
1. 行业垂直大模型训练与优化:负责针对特定行业进行垂直大模型的端到端训练与精调,深度挖掘行业数据价值,构建具备专业知识壁垒的AI核心能力。 2. 前沿技术探索与落地: 跟踪大语言模型、多模态及强化学习等前沿算法,并将其创造性地应用于钉钉的核心业务场景(如行业解决方案、商业化产品等),负责从技术到产品的全链路落地,持续推动AGI在真实世界中的价值实现。 3. AI原生应用构建: 依托钉钉强大的AI平台与自研的垂直大模型,主导构建AI原生应用。重点方向包括但不限于:高级认知搜索、可自主执行任务的智能体 (Agentic AI)、以及深度内容洞察与生成工具,打造具有核心用户价值和行业影响力的产品。 4. 智能化场景创新: 探索大语言模型、多模态及扩散模型等技术,在搜索、推荐、广告等场景的创新应用,设计并实现新一代智能化解决方案,提升用户体验与商业效率。