腾讯混元大模型标注算法研究员(北京)
任职要求
1.计算机或者相关专业硕士或者以上学历,2年以上推荐/广告/CV/NLP/RL相关工作经验,有大模型调优化应用、评测经历者优先; 2.扎实的机器学习基础,能够熟练应用常用的机器学习模型解决实际的业务问题,有主流深度学习模型的项目(CV…
工作职责
1.与数据标注团队紧密合作,深入了解业务需求,为数据标注工作提供专业的技术支持与指导。与算法研发团队、产品团队等协同工作,参与项目的全生命周期,从需求分析到产品上线,保障数据标注相关算法与功能的顺利实现; 2.针对文本、图像、音频、视频等多类型数据,设计并实现高效的自动 / 半自动标注算法,大幅提升数据标注效率与准确性。2)研究并应用前沿机器学习算法,如半监督学习、主动学习算法,降低数据标注工作量,提升标注数据质量; 3.标注模型持续迭代与优化:对模型进行持续调优,以适应不同项目的数据特点与标注需求,提高模型在数据标注任务上的性能表现。分析、评估模型/工具效果,提出针对性的改进策略,推动标注模型/工具的迭代升级。
1.定义下一代评测范式:设计并建立一套能系统性地衡量大模型在开放、真实、复杂场景下的真实能力评测体系(包括不局限于Agent、Tool Use、Code、Search等),以科学地探索并定义模型的认知边界; 2.构建严谨、高效的评测数据体系:能将对模型能力的理解转化为科学、严谨的数据设计与rubrics标注规范,构建自动化评测数据合成算法,为整个评测体系提供高质量的数据基石; 3.评测算法研究:研究实现高效、精准的模型性能归因分析算法,准确定位模型薄弱区间。
大模型具备很强的泛化及理解世界能力,在小红书内的众多生产场景遍地开花,大模型的训练和部署已成为许多算法工程师的日常。在多团队、多业务频繁使用的大规模GPU集群上,如何能够通过高效的GPU调度策略,使大家不仅能丝滑地完成训练及部署任务,同时也能充分激发大规模GPU集群的效能,是行业公认的关键挑战。在这里,你可以聚焦LLM场景,接触到超大规模GPU集群,并使用真实负载数据进行深入分析及技术探索。欢迎加入我们,一起探索领先技术改变世界! 工作职责: 1、负责万卡规模GPU集群效能分析及优化,通过调度策略优化、在离线混部、集群调度、GPU虚拟化、故障快速恢复、存储&网络加速等手段,提升大规模GPU集群的整体使用效率。 2、负责构建面向大模型训练、微调、推理、部署全流程LLMOps,与下游云原生平台深度融合,支撑大模型在公司内各业务生产链路稳定高效地落地。 3、持续关注业界最新的GPU资源调度相关技术动态,探索建设业界领先的资源调度策略及方法,构建下一代大规模AI资源调度系统。
1、负责快手搜推广服务的云原生管控方向,建设云上的平台化服务管控、服务调度能力; 2、结合服务场景设计相关调度策略、智能弹性伸缩能力、潮汐混部能力,提高集群硬件利用率。