哔哩哔哩高级/资深机器学习训练框架研发工程师
任职要求
1. 熟悉Linux下的c/c++及python语言开发,编码基本功扎实 2. 至少掌握一种机器学习框架,例如tensorflow、pytorch 3. 至少有以下一项经验:GPU编程,并行计算,分布式编程 4. 良好的团队合作精神,积极主动,具备独立解决问题的能力 5. 加分项:熟悉GPU软件栈,具备GPU性能分析经验,熟悉常见模型结构及算子实现,熟悉TVM、MLIR、XLA等模型优化工具
工作职责
1. 负责机器学习训练框架的研发,打造一流的分布式CPU及GPU训练系统 2. 支撑商业技术中心的推荐、NLP、CV等业务 3. 与算法部门深度合作,进行算法与系统的联合优化
1. 负责设计、研发和优化商业化模型推理服务和训练服务。 2. 负责商业化模型工程架构的持续迭代和发展。 3. 负责推动先进的模型技术应用于商业化业务场景。 4. 负责提升离在线服务的性能,优化资源分配和治理。
1、负责网易大神的算法研发,包括推荐、搜索、用增、商业化、大模型等多场景方向,及短视频、图文、直播等多内容载体的算法开发与迭代,提升DAU、用户留存、转化率等核心指标; 2、负责推荐相关技术的持续优化,包括特征工程、检索、排序等全链路优化工作,逐步完善和优化推荐系统各模块的模型和算法; 3、跟进前沿LLM技术,推动大模型相关技术在实际业务场景中应用。
自动驾驶模型训练优化高级/资深工程师/专家 : 1、模型训练效率优化:深入研究并优化模型训练过程中的效率问题,包括但不限于减少训练时延,通过调整训练策略、优化数据加载与预处理流程、改进算法实现等方式,确保模型能够快速、高效地完成训练任务,以满足公司自动驾驶技术研发对模型迭代速度的要求。 2、硬件资源利用率提升:专注于提高SM利用率、GPU利用率等硬件资源的使用效率。分析现有模型训练在硬件资源上的瓶颈,运用专业知识和技术手段,如合理配置训练任务的并行度、优化模型结构以更好地适配硬件特性、探索新的硬件加速技术等,充分挖掘硬件的计算潜力,降低硬件资源的浪费,提升整体训练性能。 3、训练策略与算法改进:持续关注和研究前沿的训练策略与算法,结合公司自动驾驶模型的特点和需求,对其进行评估、引入和改进。例如探索更高效的优化器、采用混合精度训练等方法,以进一步提升模型训练的效果和效率,为自动驾驶系统的性能优化提供有力支持。 4、性能监控与分析:建立和完善模型训练性能的监控体系,实时监测训练过程中的各项关键指标,如训练速度、资源占用情况等。通过对海量性能数据的深入分析,快速定位问题所在,并制定针对性的优化方案,确保模型训练过程始终处于高效、稳定的状态,及时解决可能出现的性能瓶颈问题。
高级/资深算法工程师(国际支付风控方向),base上海/南京 1.支付风险识别与防控 ●负责跨境电商业务中支付风险的全面识别与防控,重点治理欺诈(盗卡、盗账户 友好欺诈)等方面风险,确保支付全链路安全可靠。 ●利用数据分析和机器学习技术,精确识别支付风险,建立有效的风控模型体系。 2.风控模型全链路管理 ●主导支付风控模型的全链路开发与上线工作,包括需求调研、风险探索、方案设计、模型开发、系统集成、部署上线、效果评估、持续优化和监控预警。 ●与产品、工程、业务团队紧密合作,确保风控模型精准全面覆盖业务场景,并能够及时应对市场变化。 3.前沿技术应用与创新 ●深入探索全球各大市场的新型支付作弊行为,利用多模态大数据进行风险评估与预测。 ●应用异常检测、集成学习、强化学习、序列模型、图模型、大规模预训练模型等前沿技术,提升风险识别的准确率和召回率。