logo of deepseek

深度求索深度学习研发工程师(北京/杭州)

实习兼职全职地点:杭州 | 北京状态:招聘

任职要求


1. 了解机器学习深度学习)的各类模型,具备较强的工程能力;
2. 编程能力出色,熟练掌握PythonC++,掌握Pyt…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 既懂算法又懂系统;
2. 既能调精度也能调性能;
3. 既考虑训练也考虑推理部署。
包括英文材料
机器学习+
深度学习+
Python+
还有更多 •••
相关职位

logo of aliyun
社招技术类-开发

1. 负责灵骏集群的AI系统性能分析与优化,支持客户多个AI作业场景在不同平台芯片和多种集群规模下的适配和性能调优,能快速且以工具/产品化方式识别性能瓶颈并提出解决方案; 2. 针对主流深度学习框架、分布式训练和模型部署场景等,进行性能调优,优化算子性能、通信性能、内存利用率等关键指标,提升集群整体运行效率; 3. 对AI系统进行性能建模与仿真,建立Roofline模型等性能分析工具。通过仿真结果辅助系统设计和资源分配,为集群建设提供数据支持;同时推荐最佳训练和模型部署配置,辅助用户拿到最佳性能实践; 4. 负责开发和维护性能分析工具,支持系统性能监控、瓶颈定位和优化效果评估,提供性能分析报告,为团队和客户提供性能优化建议。

更新于 2025-06-18北京|杭州
logo of liauto
社招3年以上汽车研发

岗位职责 负责分析和优化大模型的分布式训练全链路过程,以提升训练性能和效率

北京
logo of aligenie
社招1年以下技术类-算法

我们正在构建面向下一代机器人智能的具身智能大模型(Embodied Foundation Model),致力于实现机器人在真实世界中的自主感知、理解、规划与操作能力。本岗位将参与具身感知、具身规划与操作基础模型的研发,包括多模态理解、3D空间建模、机器人决策推理以及大规模仿真训练等核心方向。 你将与算法工程师、机器人系统工程师以及规控工程师团队密切合作,推动具身智能从模拟环境走向真实世界应用。 以下方向可根据候选人背景匹配(不限于): 1. 具身感知基础模型 ○ 多模态视觉语言模型(Vision-Language Model) ○ 3D感知建模(Depth / Occupancy / NeRF / Scene Graph) ○ 视频理解与时序建模 ○ 开放世界场景理解(Open-world Perception) 2. 具身规划与决策大模型 ○ 长时序任务规划(Long-horizon Planning) ○ LLM + Robotics 推理系统 ○ Tool-use 与 Agent 系统设计 ○ 多机器人协同决策 3. 具身操作基础模型 ○ 视觉-语言-动作模型 (VLA) 以及视频-动作模型(Video-Action Model) ○ 模仿学习 (Behavior Cloning, DAgger等) ○ Offline & Online Reinforcement Learning ○ 多来源数据融合(Human + Robot + Simulation) 4. 大规模仿真与Scaling Law验证 ○ GPU大规模并行仿真 ○ Sim2Real迁移 ○ 数据生成与自动标注系统 ○ Scaling Law验证与数据效率研究 5. 推理优化与系统方向 ○ 大模型推理加速 ○ 多GPU/多节点训练 ○ 模型压缩与蒸馏 ○ 机器人端侧部署优化 岗位职责: ● 参与具身智能基础模型算法设计与研发 ● 构建机器人多模态数据训练体系 ● 推动模型在真实机器人平台上的落地验证 ● 跟踪前沿研究进展并推动技术创新 ● 与跨团队协作完成系统级集成

更新于 2026-03-27北京|杭州
logo of tongyi
社招3年以上技术类-开发

● 为大语言模型和多模态模型设计和实现高效的分布式推理架构,支持多节点、多角色、多模型的异构复杂部署模式,以统一、可扩展的方式支持PD分离、多模态多模型分离等部署方式,以及灵活的配比、伸缩等能力。 ● 设计和实现智能的请求与模型调度能力,在高度动态的负载工况下以及多模态模型异构的子模型间做高效的调度,让分布式推理系统具备充分的动态性和适应能力,提升服务的整体效率和质量。 ● 对分布式和多模态推理引擎运行时进行深度优化,提升分布式推理的效率和稳定性:提升组件间协调的效率,降低请求延迟、提升服务吞吐;结合各类推理引擎层面优化以及量化等算法方法提升多模态模型推理效率,同时保证模型效果;提升系统在高并发下的鲁棒性,确保极端负载下的稳定性和性能;引入容错机制、自动恢复和监控报警系统,保证系统的高可用性。 ● 为分布式推理实现高效、通用的数据平面,以统一的方式支持各类数据传输(如PD分离中的KV cache、多模态推理中的中间结果)和存储(KV cache storage)等需求。 ● 持续关注并跟进业界技术发展,尤其是超长上下文、COT思维链、多模态融合等方向;积极尝试和探索新的推理优化方向,提出并验证创新性的解决方案。

更新于 2026-06-01北京|杭州