logo of soul

Soul APP语音及多模态大模型数据工程师

社招全职地点:上海 | 北京状态:招聘

任职要求


1. 计算机及相关专业全日制硕士及以上,学习能力强,良好的团队协作精神;
2. 具备一定的音频信号处理基础,了解基本的语音或者音频信号处理算法,包括但不限于语音识别、情感分类、去噪、说话人日志、说话人识别、静音检测等。
3. 具有大规模处理数据经验者优先,了解相关工具的使用,包括但不限于hadoopsqlredises、分布式训练平台。

工作职责


1. 根据算法需求,调研相关数据处理算法,并制定相关处理方案。
2. 深入理解大模型研发流程,与算法工程师紧密配合,持续迭代和优化数据处理链路,提高数据产出的质量和效率
包括英文材料
算法+
语音识别+
Hadoop+
SQL+
Redis+
ElasticSearch+
相关职位

logo of didi
社招技术

1. 构建端到端的网页文本内容提取&分析系统,针对网络数据复杂性,从系统效率和模型效果角度持续优化网页内容提取算法,迭代线上生产标准; 2. 设计预训练数据全局质量优化和治理方案,优化数据采样策略、隐私保护和安全合规策略,提升基座模型训练效率和效果; 3. 深度参与和实现多模态(图文混合、语音等)交错数据处理pipline,通过数据分析和配比实验等手段,提升多模态数据质量和多样性,支撑多模态大模型的数据需求; 4. 跟进大模型数据领域前沿技术(如Data Influence、Curriculum Learning、数据合成、基于大模型的数据预处理等),推动数据驱动的模型性能突破; 5. 深度参与千亿级网页的大规模处理和万亿级token数据生产,通过分布式计算、模型量化及显存优化的方式提升数据处理和生产效率;

更新于 2025-06-17
logo of bytedance
社招3年以上A00638

团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、参与设计并实现高性能、可扩展、分布式大数据处理平台,通过数据驱动模型生产,支撑字节跳动智能语音相关业务算法生产与高效迭代; 2、与算法工程师密切配合,理解深度学习模型研发流程,负责/参与前沿模型研究中数据解决方案的设计、开发和维护; 3、持续提升平台数据生产效率、易用性、降低算法使用成本,探索业界前沿的多模态数据处理相关技术,设计并实现到数据平台中。

更新于 2023-08-30
logo of meituan
社招2年以上核心本地商业-基

1. 负责大模型在客服业务场景下关键能力的应用研发,包括但不限于知识和指令遵循、深度推理、反思和评估等能力的优化和落地。 2. 负责多模态大模型的应用实践,特别是语音文本融合的多模态大模型的应用。 3. 研发和优化智能体的function call、多智能体间协调,使其能够高效、准确地调用内部和外部工具,扩展智能体的应用边界。 4. 深入理解本地生活服务业务场景,抽象业务所需的大模型基础能力深度优化,推动相关技术在实际业务中的应用。 5. 与工程团队紧密合作,推动算法模型的工程化落地,包括模型压缩、加速、部署和监控等环节。 6. 紧密跟踪业界前沿技术,结合业务需求进行预研和技术储备,保持团队的技术竞争力。

更新于 2025-07-21
logo of alibaba
实习淘天集团2026

T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 1.负责原生多模态统一大模型的数据构建、模型结构和训练策略设计等工作,包括统一编码器和网络结构设计,合成数据策略,以及跨模态融合训练策略等。 2.通过方案的优化设计帮助模型有持续scale up能力,助力模型在多模态理解和生成任务上实现sota。 3.通过后训练强化学习提升多模态对齐、多模态推理思考能力,激发模型在下游跨语音、视觉等应用场景中的潜力。 T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper

更新于 2025-06-09