腾讯混元数据挖掘工程师（北京）

社招全职3年以上AI技术2025-10-22地点：深圳状态：招聘

扫码手机上打开

任职要求

1.计算机相关专业优先，熟悉 python/c++编程语言；
2.有数据工程或相关领域的工作经验，具备一定的机器学习算法基础，了解NLP 类似bert等模型；
3.…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1.对于互联网抓取数据、提供给大模型训练/搜索等场景预料进行清洗，提升语料纯度。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

Python+

C+++

机器学习+

算法+

NLP+

BERT+

还有更多 •••

登录查看完整学习资料

相关职位

混元数据算法工程师（北京）

社招2年以上AI技术

1.数据特征算法：负责海量文本&多模态数据（图像，视频，音频，3D）的内容理解（如分类标签体系、embedding表征、Caption生成等），质量检测（低质识别检测、优质美学评价等），去重/聚类分析，数据合成等算法； 2.数据pipeline建设：负责数据采集、筛选清洗、标注与质量评估pipeline的建设。与模型业务团队紧密配合，充分分析挖掘数据资源，建立自动化数据处理流程与机制，支持模型持续迭代； 3.数据实验分析：对模型训练数据进行详细分析，建立科学数据实验机制，识别样本不足、质量问题、配比不均衡等潜在问题，驱动数据优化提升数据覆盖、质量、多样性需求，最终带来大模型生成效果的持续提升。

更新于 2025-10-15深圳

混元LLM策略产品经理（北京）

社招3年以上TEG产品

1.通过对广泛业务中用户行为和反馈的研究，确定自研LLM的改进空间、优先级，以及相应的改进手段； 2.与业务团队合作，将混元模型能力整合到产品及服务中； 3.对齐数据采集和生产的方法，确保数据质量保持在高标准，并根据定量和定性反馈不断改进流程，有一到两个行业的专有数据经验优先。

更新于 2025-06-20深圳

混元大模型数据挖掘算法工程师（深圳）

社招TEG技术

1.基于大模型训练对于数据的需求进行互联网数据抓取，对提供给大模型训练/搜索等场景的语料进行清洗，提升语料纯度； 2.建设对标业内前沿的大模型训练数据集和数据清洗能力，提升数据质量和多样性，并验证数据价值和效果。

更新于 2025-06-18北京

大规模GPU集群调度优化工程师/专家

社招引擎

大模型具备很强的泛化及理解世界能力，在小红书内的众多生产场景遍地开花，大模型的训练和部署已成为许多算法工程师的日常。在多团队、多业务频繁使用的大规模GPU集群上，如何能够通过高效的GPU调度策略，使大家不仅能丝滑地完成训练及部署任务，同时也能充分激发大规模GPU集群的效能，是行业公认的关键挑战。在这里，你可以聚焦LLM场景，接触到超大规模GPU集群，并使用真实负载数据进行深入分析及技术探索。欢迎加入我们，一起探索领先技术改变世界！工作职责： 1、负责万卡规模GPU集群效能分析及优化，通过调度策略优化、在离线混部、集群调度、GPU虚拟化、故障快速恢复、存储&网络加速等手段，提升大规模GPU集群的整体使用效率。 2、负责构建面向大模型训练、微调、推理、部署全流程LLMOps，与下游云原生平台深度融合，支撑大模型在公司内各业务生产链路稳定高效地落地。 3、持续关注业界最新的GPU资源调度相关技术动态，探索建设业界领先的资源调度策略及方法，构建下一代大规模AI资源调度系统。

北京|上海