京东算法工程师
任职要求
1.包含但不限于计算机、信息工程、模式识别、人工智能、自动化、软件工程、电子工程、统计学、应用数学、物理学/量子计算、信息安全、信号与信息处理等专业硕士或博士; 2.在NLP和大模型领域有3年以上的实际项目研发经验和模型训练经验; 3.熟练掌握NLP基础理论和相关技术,在一个或多个领域能够独立开展研发工作,熟练使用至少一种编程语言和深度学习框架,熟练使用常用深度学习工具; 4.在ACL、…
工作职责
1.医疗大模型后训练:通过持续预训练、指令微调、RLHF技术手段,提升大模型在指令遵循、医学推理能力、长文本、角色扮演等核心任务上的能力。涉及技术包括但不限于自动数据配比、提升指令数据质量、数据合成、奖励建模、DPO、自进化等技术; 2.大模型智能体核心算法研发:包括意图理解、规划决策、任务分解、工具调用、多智能体协作等关键模块的设计与优化,提升Agent的自主决策和任务完成能力; 3.大模型业务应用:在问诊、诊断等方向达到医生能力等效,并应用于京东健康医疗服务,实现医生效率提升;构建AI原生产品,应用于大规模C端用户健康管理。
大模型具备很强的泛化及理解世界能力,在小红书内的众多生产场景遍地开花,大模型的训练和部署已成为许多算法工程师的日常。在多团队、多业务频繁使用的大规模GPU集群上,如何能够通过高效的GPU调度策略,使大家不仅能丝滑地完成训练及部署任务,同时也能充分激发大规模GPU集群的效能,是行业公认的关键挑战。在这里,你可以聚焦LLM场景,接触到超大规模GPU集群,并使用真实负载数据进行深入分析及技术探索。欢迎加入我们,一起探索领先技术改变世界! 工作职责: 1、负责万卡规模GPU集群效能分析及优化,通过调度策略优化、在离线混部、集群调度、GPU虚拟化、故障快速恢复、存储&网络加速等手段,提升大规模GPU集群的整体使用效率。 2、负责构建面向大模型训练、微调、推理、部署全流程LLMOps,与下游云原生平台深度融合,支撑大模型在公司内各业务生产链路稳定高效地落地。 3、持续关注业界最新的GPU资源调度相关技术动态,探索建设业界领先的资源调度策略及方法,构建下一代大规模AI资源调度系统。
中台稠密引擎组,是小红书负责建设通用深度学习训练推理引擎的团队,面向全公司LLM、多模态LLM、SD、传统CV&NLP等稠密计算型模型训练与推理的业务场景,打造高效、易用、业界领先的训练与推理引擎,为小红书社区、商业化、安全等众多业务方向提供先进的引擎能力,支撑业务持续提升训练推理效率、模型迭代效率与算法研发效率。 1、参与设计和实现深度学习后训练及微调的前沿算法(包括但不限于RFT、RLHF等),以适应多样化的业务场景; 2、结合业务数据和场景,评估选择最适合的微调算法,以支撑业务大语言模型(LLM)微调指标的提升; 3、与数据团队紧密合作,深入理解数据特性,参与设计实现数据提质算法引擎工具,产出高质量数据集提升模型微调效果; 4、与公司内各算法团队深度合作,参与或负责大语言模型、多模态大模型等业务场景的后训练端到端效果提升及落地; 5、密切关注业界 LLM 微调算法和数据提质领域的前沿论文,并整合新技术和算法到训练引擎中,提升框架的领先性;
【职位描述】 1、负责小红书搜广推多场景排序模型优化,提升时长、互动、留存等核心指标; 2、分析海量用户行为数据,挖掘用户兴趣,优化排序模型; 3、通过超大规模机器学习模型和系统,使用先进的排序算法优化推荐效果。
算法工程师 1.基于滴滴交通出行业务,构建完整的打车智能化运营策略解决方案,包括但不限于增长策略、定价策略、供需预测、资源分配策略等各类丰富场景; 2.承担网约车业务核心业务指标,使用运筹优化、机器学习、因果推断等技术持续优化超大规模动态双边市场的交易效率。 计算机/应用数学/计量经济学/统计学相关专业,研究生/本科,2023年毕业 编程基础扎实,至少熟悉python/scala/R等编程语言之一 熟悉常用的机器学习与数据挖掘方法 熟悉常用统计理论与分析方法,数理逻辑好,具有一定的数据分析能力 有较强的学习能力和好奇心,自驱性强,具备良好的团队合作和沟通能力 加分项: 1. 有计量经济学/因果推断方向相关背景优先 2. 有运筹优化/收益管理相关背景优先 3. 有深度学习相关背景优先 4. 有SQL、Hadoop、Spark、Hive、TensorFlow相关经验优先