拼多多【出海电商】大模型算法工程师
社招全职技术类地点:上海状态:招聘
任职要求
1、有良好的数据分析和挖掘能力,熟练使用数据分析工具和编程语言,有良好的团队协作和沟通能力优先; 2、对新技术和算法有强烈的学习欲望,能够快速适应工作中的挑战; 3、熟悉主流大模型的训练和微调流程、Prompt E…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、大模型算法研发:构建电商领域的大模型LLM底座,融合电商的知识,快速落地业务。持续建设和优化NLP/LLM/CV/多模态模型预训练算法,利用RAG、Long Context、RLHF、COT等技术,提升模型的理解、推理能力; 2、负责设计、开发和优化电商领域的自然语言处理(NLP)算法,提高搜索、推荐系统的性能和效果; 3、使用NLP/LLM/CV/多模态大模型,对搜索推荐全链路进行算法优化,改进商品创意生成、理解用户行为、理解商品内容等,以提升用户体验和系统智能化水平; 4、大模型评估与调优:设计和实施算法评估框架,对模型性能进行监测和评估,并根据结果进行模型调优,确保系统的稳定性和可靠性; 5、跨团队协作:与产品团队、工程团队和数据团队等紧密合作,理解业务需求,制定并实施相应的算法解决方案; 6、持续学习与创新:跟踪最新的NLP/LLM/CV/多模态大模型研究进展,不断学习新技术和算法,将最新的科研成果应用到实际工程中,保持团队的竞争力;
包括英文材料
数据分析+
[英文] Data Analyst Roadmap
https://roadmap.sh/data-analyst
Step by step guide to becoming an Data Analyst in 2025
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
还有更多 •••
相关职位
社招技术类
1、负责实现和优化大模型分布式训练以及在线推理系统,提升训练效率和推理性能,包括不限于:架构设计、算子开发、数据处理加速、Checkpoint保存与加载、通信优化等; 2、研究和优化大规模异构加速集群调度、存储、通信互联、监控、Profiling等组件,提升整体硬件利用效率; 3、研究并实现各种模型并行策略(DP/TP/PP/EP/CP)、混合精度、Zero、FSDP、MOE、FP8等技术,加速模型训练,优化显存开销; 4、设计和开发高效的离线、在线推理系统,优化TensorRT-LLM、ONNX-Runtime、vLLM等推理框架,加速整体推理性能;
更新于 2025-12-22上海
社招技术类
1、负责出海电商平台搜索、推荐、广告等核心业务的CTR/CVR/创意优化/商业化模型算法研发与优化,持续优化用户体验与业务效率; 2、优化从召回、粗排、精排到混排的全链路排序模型体系,驱动GMV和商业化增长; 3、深入分析用户行为与业务数据,挖掘业务增长点,构建数据模型并推动算法策略落地与迭代; 4、应用前沿深度学习技术如多任务学习、多模态建模、超长序列建模、强化学习、图神经网络等,解决业务中的关键问题; 5、探索生成式AI技术在电商领域的应用,包括但不限于用户/商品理解、生成式推荐、智能创意生成等,打造下一代智能电商体验。
更新于 2025-10-30上海
社招技术类
1. 训练/对齐领域大模型:面向评价理解、商品知识处理、内容生成;探索混合专家(MoE)、多模态指令跟随、长上下文检索与记忆增强。 2. 以“生成式排序/生成式推荐”为方向:将生成式信号融入召回/排序/重排,探索 LLM rerank、生成式特征、以及端到端的多目标优化。 3. 推动线上高性能推理:多租户资源编排、弹性扩缩容、SLA、成本治理;模型压缩与加速使得单位成本持续下降。
更新于 2026-01-07上海