logo of baidu

百度AI计算部-大模型基础设施工程师-2026AIDU(J85290)

校招全职AIDU项目地点:北京状态:招聘

任职要求


-计算机、电子或自动化等计算机和人工智能相关专业应届博士/硕士毕业生;
-熟练掌握PyTorch,有正式的项目研发经验;熟悉C++CUDA编程;
-了解大模型训练和推理常见的框架以及关键技术,有实际项目经验者优先;
加分项:
-有大规模超算集群或者AI集群系统软件开发经验,支持过大规模…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


-参与万卡GPU集群的建设与核心技术的研发工作;
-设计并实现自适应的分布式系统框架,算子与通信极致优化,并行策略自动切分,提升大模型训练和推理效率;
-探索多芯混合集群高效的训练策略,让任意集群的算力效率都充分发挥出来;
-探索算法与算力(芯片设计、集群设计)协同优化的方案,跨数量级降低大模型训练和推理的成本。
包括英文材料
PyTorch+
C+++
CUDA+
还有更多 •••
相关职位

logo of baidu
社招ACG

-AI大模型方案设计与优化。负责为客户构思、设计并实施AI大模型的先进解决方案,旨在从AI算力基础设施、AI开发工具、AI大模型的数据与算法,以及AI大模型的应用场景等多个层面,推动客户在百度云平台上实现AI应用快速实验与落地 -深度客户管理。主动与客户进行深度沟通,洞察其业务需求与挑战,最终实现客户成功的结果。通过持续的实践经验积累,形成具有行业特色的AI解决方案,并致力于在行业中实现突破性的应用 -项目执行与推动。担任关键角色,推动客户上云、用云的项目顺利进行,确保项目从商务合作、技术方案、业务进度、风险把控、资源分配等各方面的协同工作得以落地执行 -产品创新与升级。不断将客户的需求转化为实际的云标准产品功能,积极推动百度云平台上产品的持续进步与迭代,确保我们的产品与服务始终保持在行业的前沿

更新于 2024-01-31北京|上海
logo of antgroup
校招蚂蚁星计划 -

蚂蚁国际全球技术AI智能部正在寻找有激情并且具有创新能力的算法专家,通过使用AI 特别是生成式人工智能技术,推动蚂蚁国际化业务的发展。蚂蚁集团是一家AI驱动的公司,国际化是蚂蚁集团的重点方向,在这个职位上,你有机会接触到互联网金融,人工智能,国际化这3个当前最热门领域。 国际AI智能部负责大模型算法的创新应用与落地,同时也负责蚂蚁国际的 AI 基础设施和应用平台的建设。我们正在寻找热爱大模型的优秀人才加入我们。 其中,金融 AI 与大模型应用平台团队负责蚂蚁国际的金融 AI 业务,如基于大模型的金融助理在海外钱包的落地,以及蚂蚁国际的 AI 平台与基础设施建设,通过更加高效的训练和推理能力,以及结合 Agent 的平台研发助力蚂蚁国际全面拥抱生成式人工智能达成 AI 为先的战略。 1.负责大模型技术前沿技术跟踪、创新和落地。负责文本以及多模态大模型算法研发,对图片语音文本进行跨模型理解和生成。通过大模型算法创新和优化,致力提升大模型算法的场景落地和业务增效; 2.负责研发知识增强大语言模型技术,包括大模型领域适配、知识对齐、知识增强等,深入挖掘垂直行业、开源以及蚂蚁的海量数据,构建行业知识库,以支持相关技术的蚂蚁国际各个业务中的持续创新和实践应用; 3.负责垂直领域大模型算法开发,通过持续预训练和多任务模型微调,提升垂直大模型的核心技术价值和平台化落地; 4.深度参与产品研发项目,与团队成员合作,共同推动人工智能技术在实际业务中的应用和落地; 5.深入跟踪调研大语言模型以及相关方向(包括但不限于LLM/多模态等)的前沿技术,并适时进行技术分享。推动相关领域技术创新,进行专利申请和学术文章发表。

上海|杭州
logo of kuaishou
社招5年以上D8039

1.负责AI平台架构设计和AI工程化技术实现; 2.通过AI基础设施和软硬件协同优化来提升公司AI模型训练和推理的效率; 3. 负责云侧或端侧大模型和小模型推理服务开发、性能优化、上线部署等工作。

更新于 2025-04-01杭州
logo of bytedance
校招A21770

团队介绍:字节芯片研发团队隶属于系统部,目前工作主要集中在芯片设计环节。该团队主要围绕字节自身业务展开芯片探索,为字节多项业务的专用场景定制硬件优化,设计多款基于先进半导体工艺的云端复杂芯片,以期提升性能、降低成本。早期若干芯片项目已经进入到量产部署阶段,有多次一版成功的投片经历,所用工艺包含多个主流的先进工艺节点。和系统部基础设施工作的整体协同,能更容易和更好地发挥芯片研发的价值。 课题介绍:探索电路、SoC和算法的协同架构;负责创新电路、架构和系统设计;与硬件设计团队合作,实现高协同的架构和系统设计。 研究方向:电路设计系统、芯片设计、半导体、机器学习、深度学习、计算机架构。 一、架构设计 1、负责AI芯片架构的探索与设计方案,包括计算/互联/存储等方向; 2、负责AI推理/训练系统的软硬件协同优化方案; 3、负责不同业务场景下AI模型结构和算子特性分析、硬件实现方案制定以及性能优化。 二、ASIC设计 1、负责数据中心内ASIC芯片的微架构探索、RTL设计和集成,包括计算/互联/访存几个方向; 2、支持AI加速芯片的Power/Performance/Area优化和设计流程优化; 3、跟踪调研业界最新AI芯片微架构,并进行量化分析和总结,梳理AI微架构benchmark。 三、AI工具链 1、负责硬件加速器训练框架研发; 2、参与软硬件协同设计,对关键硬件参数进行仿真; 3、负责实际业务模型训练任务调研; 4、负责训练中通信算子研发以及性能优化。

更新于 2025-05-26北京