logo of mi

小米大模型数据策略工程师实习生

实习兼职地点:北京状态:招聘

任职要求


1. 计算机或相关专业硕士及以上
2. 了解hadoop/spark等大数据处理框架
3.熟悉Python/scala/java中的一种语言,熟练掌握主流深度学习框架了pytorch/tensorflow大模型训练框架Megatron-LM/Deepspeed等多机多卡方案
4. 具备NLP经验,对大模型后训练主流方案有较深刻的理解
5. 关注行业前沿进展,对技术开发及应用有热情,有自己的想法,乐于挑战自我

工作职责


参与大模型数据清洗及处理技术的研发与优化,包括但不限于:
1.大模型数据质量的持续提升改进与实现;
2.参与数据主题分类模型的构建
3.VLM数据的合成与生产的协同优化;
4.提示工程(Prompt Engineering)的探索
5.构建和评测数据的质量及评估的方法及评测集的构建
6.跟进学术界与工业界最新进展。
包括英文材料
Hadoop+
Spark+
Python+
Scala+
Java+
深度学习+
PyTorch+
TensorFlow+
大模型+
Megatron+
DeepSpeed+
NLP+
相关职位

logo of baidu
实习ACG

-参与大模型数据策略与数据迭代(文本/多模态/代码),负责大规模数据构建与合成,支撑预训练/对齐效果 -协助多模态、代码与工具调用数据的构建,进行包括分布式的清洗、合成、近重复/噪声检测与去重,建立难例库与反馈闭环,持续提升数据质量与密度 -参与数据质量评估与筛选算法的实现:低质过滤,质量评分、LLM判别与复核等;针对代码与工具调用场景,引入编译/单测/沙箱执行/参数一致性校验 -支持对齐与偏好学习数据,配合消融实验及评测指标分析,输出采样/准入/退场/权重等数据策略并推动落地

更新于 2025-09-12
logo of alibaba
实习淘天集团T-St

T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 1.负责原生多模态统一大模型的数据构建、模型结构和训练策略设计等工作,包括统一编码器和网络结构设计,合成数据策略,以及跨模态融合训练策略等。 2.通过方案的优化设计帮助模型有持续scale up能力,助力模型在多模态理解和生成任务上实现sota。 3.通过后训练强化学习提升多模态对齐、多模态推理思考能力,激发模型在下游跨语音、视觉等应用场景中的潜力。 T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper

更新于 2025-08-13
logo of baidu
社招3-5年MEG

-高级自然语言策略工程师,负责设计和优化基于大语言模型的产品策略落地,将前沿研究应用到真实业务场景中,为数百万用户提供卓越的文小言APP智能体验。 -策略设计与研发:基于大语言模型的核心产品策略设计与研发,制定技术路线图,推动创新解决方案落地 -模型训练与调优:基于RLHF等强化学习方法的大语言模型训练和精细化调优方案,提升模型在多场景下的表现 -自动化工具开发:构建和完善语料自动生成和智能标注系统,提升数据生产效率和质量 -用户行为分析:执行用户行为数据分析工作,构建用户意图识别和理解模型,优化产品决策机制和交互体验 -策略评估框架:建立科学的策略评估体系,包括离线评测和在线A/B测试方案,指导产品持续迭代优化 -跨团队协作:与产品、研发、设计等团队紧密协作,将先进NLP技术转化为产品竞争力,推动业务增长 -团队指导:指导初级工程师和实习生,提供技术指导和职业发展建议,提升团队整体技术水平

更新于 2025-03-18
logo of alibaba
实习淘天集团2026

T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 1.负责原生多模态统一大模型的数据构建、模型结构和训练策略设计等工作,包括统一编码器和网络结构设计,合成数据策略,以及跨模态融合训练策略等。 2.通过方案的优化设计帮助模型有持续scale up能力,助力模型在多模态理解和生成任务上实现sota。 3.通过后训练强化学习提升多模态对齐、多模态推理思考能力,激发模型在下游跨语音、视觉等应用场景中的潜力。 T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper

更新于 2025-06-09