logo of aligenie

智能互联千问事业部-高级数据研发专家-大模型方向

社招全职3年以上技术类-开发地点:北京 | 杭州状态:招聘

任职要求


1. 主导过LLM、VLM、ASRTTS大模型预训练及微调语料数据建设工作,有丰富的数据交付经验;
2. 精通大规模分布式数据处理技术(如spark/flink/ray等),拥有从0到1搭建全模态数据处理pipeline的丰富实战经验;
3. 深刻理解大模型训练数据的特性与需求…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责大模型数据研发方向,为LLM、VLM、ASR、TTS及omni model的训练供给优质语料数据,推动各业务场景提升模型训练效果;
2. 与算法团队协同、搭建各模态数据处理pipeline,利用业界先进技术对数据进行清洗、去重、打标、标注、圈选、打包,交付优质数据进行模型训练,提升整体交付效率和数据质量;
3. 与数据采集团队协同,推动前沿数据获取策略的研发与落地,探索合成数据技术,主动解决特定领域或模-态的数据稀缺与多样性挑战;
4. 构建各模态数据分类&质量体系及数据画像,对数据进行多维度、细粒度分析,基于模型训练效果反馈进行数据挖掘,指导数据收录优化方向,构建数据飞轮。
包括英文材料
大模型+
语音识别+
语音合成+
还有更多 •••
相关职位

logo of aligenie
社招5年以上技术类-开发

1、负责语音方向AI智能体应用的工程研发与团队管理,确保系统高效迭代与产品高质量交付; 2、协同产品与算法团队,推动语音智能体应用的技术演进与业务落地; 3、参与客户技术交流,管理客户技术预期,提升客户满意度与项目交付效果; 4、制定语音应用架构的中长期演进规划,持续优化全链路语音体验与系统稳定性。

更新于 2026-04-06北京|杭州
logo of aligenie
社招2年以上技术类-开发

1、负责千问、夸克的Agent应用研发,熟练运用agent相关技术,实现诸多AI应用的快速落地与持续迭代; 2、保障Agent应用系统的稳定、高效运行,帮助业务优化性能和改善系统稳定性,持续提升用户体验; 3、持续跟踪前沿技术趋势,关注并探索引入新技术新方法,持续提升产品技术、工程架构上的先进性。

更新于 2026-04-06北京|杭州|广州
logo of amap
社招2年以上技术类-开发

1、负责高德出行场景(驾车,骑行,步行)的大模型应用框架开发,构建高可用、低延迟的分布式系统; 2、负责优化Agent决策引擎、任务调度、多模态数据处理等模块的性能与稳定性; 3、负责搭建Agent与外部系统(如数据库、API、第三方服务)的高效通信机制; 4、负责保障大模型应用系统架构的稳定、高效运行,帮助业务优化性能和改善系统稳定性; 5、负责协调业务资源,与大模型算法和数据源服务等团队协作,保障项目有效落地和需求高效交付。

更新于 2025-12-02北京
logo of kuaishou
社招D4870

1、负责快手国际化Push相关的算法研发、优化工作,运用策略和算法手段促进用户增长; 2、负责Push推荐系统的搭建以及相关算法落地,面对亿级别的用户群体情况下实现Push的个性化匹配,做到千人千面; 3、负责Push的算法、策略的设计,并直接参与Push场景下推荐系统的全链路开发与优化,包括但不局限于触发、召回、粗排、精排、下发策略等阶段; 4、从海量数据中挖掘用户消费行为、社交关系网以及运营热点实现Push内容池的搭建。

更新于 2025-04-09北京