
智能互联千问事业部-高级数据研发专家-大模型方向
社招全职3年以上技术类-开发地点:北京 | 杭州状态:招聘
任职要求
1. 主导过LLM、VLM、ASR或TTS大模型预训练及微调语料数据建设工作,有丰富的数据交付经验; 2. 精通大规模分布式数据处理技术(如spark/flink/ray等),拥有从0到1搭建全模态数据处理pipeline的丰富实战经验; 3. 深刻理解大模型训练数据的特性与需求…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1. 负责大模型数据研发方向,为LLM、VLM、ASR、TTS及omni model的训练供给优质语料数据,推动各业务场景提升模型训练效果; 2. 与算法团队协同、搭建各模态数据处理pipeline,利用业界先进技术对数据进行清洗、去重、打标、标注、圈选、打包,交付优质数据进行模型训练,提升整体交付效率和数据质量; 3. 与数据采集团队协同,推动前沿数据获取策略的研发与落地,探索合成数据技术,主动解决特定领域或模-态的数据稀缺与多样性挑战; 4. 构建各模态数据分类&质量体系及数据画像,对数据进行多维度、细粒度分析,基于模型训练效果反馈进行数据挖掘,指导数据收录优化方向,构建数据飞轮。
包括英文材料
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
语音识别+
https://developer.nvidia.com/blog/essential-guide-to-automatic-speech-recognition-technology/
Over the past decade, AI-powered speech recognition systems have slowly become part of our everyday lives, from voice search to virtual assistants in contact centers, cars, hospitals, and restaurants.
语音合成+
https://www.ibm.com/think/topics/text-to-speech
Text to speech (TTS) is a type of technology that converts text on a digital interface into natural-sounding audio.
还有更多 •••
相关职位

社招5年以上技术类-开发
1、负责语音方向AI智能体应用的工程研发与团队管理,确保系统高效迭代与产品高质量交付; 2、协同产品与算法团队,推动语音智能体应用的技术演进与业务落地; 3、参与客户技术交流,管理客户技术预期,提升客户满意度与项目交付效果; 4、制定语音应用架构的中长期演进规划,持续优化全链路语音体验与系统稳定性。
更新于 2026-04-06北京|杭州

社招2年以上技术类-开发
1、负责千问、夸克的Agent应用研发,熟练运用agent相关技术,实现诸多AI应用的快速落地与持续迭代; 2、保障Agent应用系统的稳定、高效运行,帮助业务优化性能和改善系统稳定性,持续提升用户体验; 3、持续跟踪前沿技术趋势,关注并探索引入新技术新方法,持续提升产品技术、工程架构上的先进性。
更新于 2026-04-06北京|杭州|广州
社招2年以上技术类-开发
1、负责高德出行场景(驾车,骑行,步行)的大模型应用框架开发,构建高可用、低延迟的分布式系统; 2、负责优化Agent决策引擎、任务调度、多模态数据处理等模块的性能与稳定性; 3、负责搭建Agent与外部系统(如数据库、API、第三方服务)的高效通信机制; 4、负责保障大模型应用系统架构的稳定、高效运行,帮助业务优化性能和改善系统稳定性; 5、负责协调业务资源,与大模型算法和数据源服务等团队协作,保障项目有效落地和需求高效交付。
更新于 2025-12-02北京