大疆高级机器学习平台专家(AI Infra)
任职要求
1. 硕士及以上学历,具备计算机科学、信息工程、电子工程、机器人学等相关专业背景; 2. 了解深度学习算法基本原理,熟悉神经网络基本架构和各算子计算方式,有视觉类训练&推理任务优化经验,有7B/70B规模大模型训练&推理优化经验; 3. 熟悉FSDP/DeepS…
工作职责
1. 负责业界/学界SOTA方案调研和原型验证; 2. 结合公司业务特点,给出AI Infra建设规划(重点是训练&推理优化); 3. 针对不同技术方案的成本、收益,给出方案选型建议; 4. 方案落地过程中进行风险把控和方向纠偏; 5. 指导一线工程师解决新方案落地过程中的卡点。
团队背景:淘宝文本搜索算法团队是淘天集团内专注于创新和优化搜索技术的核心团队。我们的任务是通过持续研发高效、精准的搜索算法,以提升用户的在线购物体验和满意度,进而推动电商平台的商业成功。 工作职责 1. 和淘宝电商搜索业务紧密结合,设计和改进机器学习模型的架构,实现高效的搜索大型模型训练和推理系统(特别是大规模语言模型,GPT、LLaMA、通义千问等),确保其高效性和准确性,以提高计算性能和加速模型收敛 2. 负责百亿参数以上超大模型的推理训练与性能优化:进行搜索在线模型的性能分析和调优,识别和解决瓶颈问题,提高模型的训练和推理速度,以适应并充分利用硬件资源,确保在高效计算资源利用的前提下,提供快速响应的搜索业务体验 3. 应用不限于剪枝、量化、知识蒸馏,各种并行策略(DP/TP/PP/EP等)等技术来优化模型的复杂度和运行速度,同时探索模型在样本、训练、存储和推理的极致性能 4. 在大模型的Token压缩方面进行性能探索,包含入图前的超长token压缩甚至长token直接入图等性能优化,以满足大模型结合超长token在海量数据以及极致在线性能的应用 5. 和工程团队协同,依据训练推理机器资源水位以及优化空间,简化和加速模型训练和推理的部署过程,实现离线在线资源的高性价比利用。 6. 参与设计和优化淘宝整体搜索系统,包括多阶段漏斗设计和整体链路设计,确保系统的稳定性和高效性
1、结合电商的业务特性,进行模型和算法创新,打造业行领先的机器学习/深度学习算法平台能力。 2、超大规模的机器学习模型优化,包括但不限于深度学习、强化学习、表征学习等,最大效率地提升电商流量效率。
高级/资深后台开发/技术专家(AI算法工程化)-上海南京 1. 算法工程化支持:负责支持跨境治理和商品治理方向的算法工程化落地,包括算法服务化、模型部署、性能优化、A/B测试与监控体系搭建。 2. 系统开发与维护:基于Java与Python开发高性能、可扩展的算法平台和治理系统,保障算法稳定运行和高可用性。 3. 算法研发协同:与算法研究人员、产品经理紧密协作,推动图像理解、NLP、多模态及大模型等算法从研发到线上应用的全流程闭环。 4. 数据与质量评估:建设和维护治理效果数据采集、评估和监控体系,持续迭代优化模型与策略,驱动业务降本增效。 5. 技术方案创新:关注业界最新算法工程化与MLOps实践,推动内部平台能力升级,提升算法迭代效率。
岗位职责: 该职位通过大模型训练、Agent、RAG、N2SQL、NLP、语音处理等技术创新和突破,构建Agent通用平台、大模型训练平台等工具产品,同时支持对话机器人等垂直应用及智能产品的建设。欢迎敢于接受挑战的候选人加入我们,一起赋能企业客户。我们的研究方向包括但不限于: 1、通用大模型、推理大模型预训练、微调、强化对齐等技术的持续研究创新; 2、多语言大模型、领域大模型的训练技术研究与落地; 3、AI数据清洗、加工、合成、自动标注技术研究与落地; 4、文本机器人、语音机器人、质检机器人等客服域技术的研发与落地; 5、多Agent、RAG、N2SQL、自主决策等技术的研究与落地; 6、入呼大模型机器人、外呼大模型机器人研发经验;熟悉VAD, ASR, TTS等语音相关技术; 以上方向擅长其中1个即可