logo of ximalaya

喜马拉雅音频大模型数据算法工程师-实习生

实习兼职地点:上海状态:招聘

任职要求


任职要求:
1. 计算机相关专业硕⼠及以上学历,数学功底良好,英⽂⽂献阅读理解能⼒良好;
2. 熟练掌握python语⾔,熟练使⽤pytorch/tensorflow/kaldi等⼯具;
3. 具有较强的执⾏⼒,⾼度的责任⼼;
加分项:
1. 有语⾳识别、语⾳合成、声纹识别、降噪等语⾳算法相关经验;
2. 熟悉语⾳领域最新业界进展;
3. 有语⾳技术及NLP相关论⽂发表者优先;

工作职责


岗位职责:
1. 参与⾳频理解的算法调研、落地应⽤、效果调优;
2. 负责⾳频理解技术在业务场景的适配和落地;
3. 将合适的⼯作成果最终形成论⽂发表;
包括英文材料
学历+
Python+
PyTorch+
TensorFlow+
算法+
NLP+
相关职位

logo of kuaishou
实习J1001

1、数据特征算法方案制定与效果优化:针对不同模态、多种类目的数据,设计自动化筛选方案;对多模态数据涉及的前沿特征算法(如物体跟踪、ID 重识别、音频分离)进行场景化效果优化。与算法工程师协作,制定数据调整与扩展策略,提升模型在真实场景中的生成能力; 2、数据 pipeline 建设:负责多模态大模型训练数据的构建与管理,参与数据筛选、标注及质量评估工作。分析和挖掘现有数据资源,设计有效的数据分布策略,支持模型持续迭代; 3、数据分布分析:对模型训练数据分布进行详细分析,识别数据偏差、不均衡及潜在问题。提供可视化报告及改进建议,确保训练数据覆盖目标场景并满足多样性需求,最终通过数据驱动方法优化视频生成大模型效果。

更新于 2025-05-08
logo of alibaba
实习淘天集团2026

如果你,期望参与音频处理、视频处理、编码、传输、渲染特效等技术的开发; 如果你,期望参与广告、搜索、推荐、用户理解和数据分析等技术的开发; 如果你,期望参与大模型、AIGC、3D建模、AR/VR等技术的开发; 如果你,期望参与iOS、Android、Windows等系统平台架构设计、性能优化,开发领先的平台和引擎,为淘天的产品提供强有力支撑; 那还犹豫什么,赶紧加入我们吧!

更新于 2025-05-07
logo of alibaba
实习淘天集团2026

参与构建新一代电商语音认知引擎,通过大模型技术实现语音交互与商品理解的双向增强,打造全球领先的电商领域语音智能中枢,支撑淘宝亿级DAU场景的语音搜索、智能导购等核心业务。 1. 负责大模型语音模态的设计、开发和优化,包括但不限于语音音频数据清洗、模型设计、训练策略等方面的研究与应用。 2. 参与语音识别、语音合成、语音理解等相关大模型语音模态能力的建设,提升跨模态整体效果。 3. 跟踪、探索大模型方向,将各模态的SOTA能力集成到模型底座上,提升识别以及搜索能力,提升团队技术先进性。

更新于 2025-05-08
logo of alibaba
实习淘天集团T-St

T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 如果你,期望在阿里巴巴生态的广阔场景中,借助海量用户数据和先进的技术能力,打造千人千面的个性化数字人形象生产系统,为亿级用户提供高度定制化的虚拟形象服务; 如果你,期望参与最前沿的高表现力肢体表情驱动技术研发,通过先进的动作捕捉、表情合成和实时渲染技术,实现数字人自然流畅的表情和肢体动作,赋予数字人更真实的情感表达能力; 如果你,期望攻克数字人生成中的核心技术难题,例如基于扩散模型的高质量数字人生成、材质与纹理的高度还原、服饰动态效果的真实模拟,以及在复杂交互场景中保持人物和环境的一致性和自然度; 如果你,期望深入探索多模态统一大模型的应用,将图像、文本、音频等多模态信息融合,构建具备精细理解能力和强大生成能力的数字人系统,解决业界尚未突破的技术瓶颈; 加入我们,你的成果将直用于电商领域的核心场景,直播,客服,导购,影响数以亿计的用户,推动电商领域的数字化创新,并带来巨大的商业和社会价值。让我们一起定义未来数字人的无限可能! T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper

更新于 2025-08-13