大疆高级机器学习平台专家(AI Infra)
任职要求
1. 硕士及以上学历,具备计算机科学、信息工程、电子工程、机器人学等相关专业背景; 2. 了解深度学习算法基本原理,熟悉神经网络基本架构和各算子计算方式,有视觉类训练&推理任务优化经验,有7B/70B规模大模型训练&推理优化经验; 3. 熟悉FSDP/DeepSpeed/Megatron等分布式训练框架;有 CUDA 开发经验,有TensorRT/Triton/Cutlass相关经验; 4. 具有开阔的技术视野以及较强的技术规划能力和落地能力,能指导一线工程师解决高难度技术问题; 5. 具备良好的沟通能力和团队合作习惯。
工作职责
1. 负责业界/学界SOTA方案调研和原型验证; 2. 结合公司业务特点,给出AI Infra建设规划(重点是训练&推理优化); 3. 针对不同技术方案的成本、收益,给出方案选型建议; 4. 方案落地过程中进行风险把控和方向纠偏; 5. 指导一线工程师解决新方案落地过程中的卡点。
1、结合电商的业务特性,进行模型和算法创新,打造业行领先的机器学习/深度学习算法平台能力。 2、超大规模的机器学习模型优化,包括但不限于深度学习、强化学习、表征学习等,最大效率地提升电商流量效率。
岗位职责: 该职位通过大模型训练、Agent、RAG、N2SQL、NLP、语音处理等技术创新和突破,构建Agent通用平台、大模型训练平台等工具产品,同时支持对话机器人等垂直应用及智能产品的建设。欢迎敢于接受挑战的候选人加入我们,一起赋能企业客户。我们的研究方向包括但不限于: 1、通用大模型、推理大模型预训练、微调、强化对齐等技术的持续研究创新; 2、多语言大模型、领域大模型的训练技术研究与落地; 3、AI数据清洗、加工、合成、自动标注技术研究与落地; 4、文本机器人、语音机器人、质检机器人等客服域技术的研发与落地; 5、多Agent、RAG、N2SQL、自主决策等技术的研究与落地; 6、入呼大模型机器人、外呼大模型机器人研发经验;熟悉VAD, ASR, TTS等语音相关技术; 以上方向擅长其中1个即可
关于我们: 我们是一家致力于构建下一代AI Agent生态的创新科技公司。我们的核心产品——AI Agent Marketplace,旨在连接全球开发者、服务提供者与终端用户,打造一个繁荣、智能的自动化服务生态。我们相信,全球开发者是驱动生态繁荣的核心引擎。尤其在北美市场,与顶尖开发者的深度合作是我们的战略重心。 现诚邀对AI与全球开发者生态充满热情的合作专家加入,共同构建全球领先的AI Agent开发者社区。 岗位职责: ● 全球开发者招募与拓展 (重点:北美): ● 制定并执行以北美(美国为核心)为重点,辐射欧洲及其他关键区域的全球开发者(独立开发者、技术博主、AI研究者、自动化专家、小型开发团队等)招募战略。 ● 主动、深入地发掘、接触并说服美国硅谷及全美范围内的顶尖AI、自动化、开发者工具领域的个人开发者和团队加入我们的Marketplace。 ● 建立并维护高效的开发者线索获取渠道(如美国技术社区Meetup、知名开发者论坛、开源项目、KOL推荐、行业会议等)。 ● 开发者入驻、落地与赋能: ● 深入理解开发者需求(尤其是美国开发者的偏好和工作方式),提供个性化的入驻咨询、产品培训和技术支持,确保其Agent顺利开发、测试和发布。 ● 策划并组织面向全球,特别是美国开发者的线上/线下工作坊、培训营、黑客松等活动,提升开发者技能与社区凝聚力。 ● 优质Agent上架与质量把控: ● 核心职责: 对招募的开发者及其上架的Agent质量负责,尤其关注来自美国市场的高质量Agent引入。 ● 与产品、技术团队紧密合作,收集并反馈开发者(特别是美国开发者)在开发过程中的痛点和需求,推动产品改进。 ● 开发者生态合作与激励: ● 设计并落地针对全球开发者,特别是美国开发者的激励计划(如有竞争力的收入分成、流量扶持、专项奖金、认证体系等),提升开发者活跃度和忠诚度。 ● 探索并建立与美国及全球的开发者社区、开源组织、技术媒体、知名大学CS系、孵化器/加速器等的战略合作,共同拓展生态。 ● 重点管理美国核心开发者关系,成为其可信赖的本地化合作伙伴,定期沟通,高效解决其问题。 ● 跨文化沟通与协作: ● 与产品、市场、技术、设计及全球团队高效协作,确保开发者生态策略与公司整体目标一致。 ● 具备卓越的跨文化沟通能力,深刻理解美国开发者的技术文化、沟通习惯和商业诉求。
我们是淘天集团阿里妈妈工程平台团队,致力于打造面向搜推广场景及AIGX应用的业界最强AI在线服务平台。团队服务于淘天电商核心业务,承担 广告模型超大规模特征工程和AI推理、LLM/Diffusion等大模型服务 的研发和优化等关键职责,在高性能在线服务(推荐系统/多模态大模型/大语言模型)、分布式系统(计算/存储/网络)、异构计算和AI编译优化(CPU/GPU/XPU)等课题上都具有业界最前沿的挑战。 1)负责超大规模生成式模型在线服务系统架构设计并推进落地; 2)负责大规模异构硬件系统inference在离线计算资源优化; 3)负责模型交付pipeline整体优化。