百度网盘文库-多模态大模型算法工程师-2026AIDU(J85311)
校招全职AIDU项目地点:北京状态:招聘
任职要求
-包含但不限于计算机、信息工程、模式识别、人工智能、自动化、软件工程、电子工程、统计学、应用数学、物理学/量子计算、信息安全、信号与信息处理等专业的博士和优秀硕士; -精通Transformer/CLIP/Diffusion等技术,具备多模态预训练实战经验(图文/视频/3D等领域),熟悉MoE、模型蒸馏,深入理解对比学习、提示工程、RLHF等技术原理; -对新技术和新算法保持敏锐的触觉,具备快速学习和应用的能力;良好的沟通能力、团队合作精神以及较强的问题解决能力; -主导过大模型训练优化或模型调优,兼具工程实现能力与理论推导功底; -顶级会议论文(CVPR/ACL/ICML等)或开源项目核心贡献者优先。
工作职责
-研发突破性多模态大模型架构,探索视觉-语言-语音-3D跨; -优化大模型训练策略,攻克模态对齐、知识蒸馏、强化学习等技术难题; -推动前沿技术产品化落地,在百度网盘、百度文库、TeraBox、橙篇等产品场景实现价值闭环,改变十亿级用户产品体验; -持续跟踪ICLR/NeurIPS/CVPR等顶会最新进展,保持技术领先性; -深入挖掘产品潜在价值和需求,通过技术创新推动产品成长。
包括英文材料
模式识别+
https://www.mathworks.com/discovery/pattern-recognition.html
Pattern recognition is the process of classifying input data into objects, classes, or categories using computer algorithms based on key features or regularities.
https://www.microsoft.com/en-us/research/wp-content/uploads/2006/01/Bishop-Pattern-Recognition-and-Machine-Learning-2006.pdf
Pattern recognition has its origins in engineering, whereas machine learning grew out of computer science.
Transformer+
https://huggingface.co/learn/llm-course/en/chapter1/4
Breaking down how Large Language Models work, visualizing how data flows through.
https://poloclub.github.io/transformer-explainer/
An interactive visualization tool showing you how transformer models work in large language models (LLM) like GPT.
https://www.youtube.com/watch?v=wjZofJX0v4M
Breaking down how Large Language Models work, visualizing how data flows through.
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
CVPR+
https://cvpr.thecvf.com/
ICML+
https://icml.cc/
相关职位
社招MEG
-研发突破性多模态大模型架构,探索视觉-语言-语音-3D跨模态融合新范式 -优化大模型训练策略,攻克模态对齐、知识蒸馏、强化学习等技术难题 -推动前沿技术产品化落地,在百度网盘、百度文库、TeraBox、橙篇等产品场景实现价值闭环,改变十亿级用户产品体验 -持续跟踪ICLR/NeurIPS/CVPR等顶会最新进展,保持技术领先性 -深入挖掘产品潜在价值和需求,通过技术创新推动产品成长
更新于 2025-05-21
校招AIDU项目
-研发新一代Agent架构,实现感知-决策-执行-进化的闭环能力突破; -构建多智能体协作系统,攻克任务分解、知识共享、动态协调等群体智能难题; -优化长期记忆与推理机制,实现复杂场景下的自主学习能力与策略泛化; -推动智能体在百度网盘、百度文库、TeraBox、橙篇等产品场景实现价值闭环,改变十亿级用户产品体验。
更新于 2025-05-19
社招MEG
-研发新一代Agent架构,实现感知-决策-执行-进化的闭环能力突破 -构建多智能体协作系统,攻克任务分解、知识共享、动态协调等群体智能难题 -优化长期记忆与推理机制,实现复杂场景下的自主学习能力与策略泛化 -推动智能体在百度网盘、百度文库、TeraBox、橙篇等产品场景实现价值闭环,改变十亿级用户产品体验 核心技术栈
更新于 2025-05-23