logo of ztgame

巨人网络语音算法实习生

实习兼职实习生地点:上海状态:招聘

任职要求


1、计算机或相关专业,硕士及以上学历,26届及之后的同学优先;
2、具备扎实的机器学习深度学习、语音的理论背景和实践经验,熟悉主流生成式模型、跨模态表征模型及微调方法,熟悉多模态大模型及语音大模型训练者优先;
3、优秀的工程落地能力,熟悉PyTorch深度学习框架以及Python/C++编程语言,熟练掌握DeepSpeed、Megatron等大模型训练框架者优先;
4、在顶级会议(如:INTERSPEECH、ICASSP、CVPRNeurIPSICCV等)发表过论文优先;
5、具备良好的团队协作和沟通能力;
6、具备较强的学习与独立思考能力,积极尝试新鲜技术,善于学习和应用新知识与工具。

工作职责


1、参与多模态语音理解+生成(speech、audio、music)领域的科研,效果优秀后推动在视频、游戏业务场景下的算法研发、落地,包括但不限于数据处理、模型训练、效果调优;
2、紧跟前沿技术、参与关键技术创新、突破与积累,撰写论文。
包括英文材料
学历+
机器学习+
深度学习+
大模型+
PyTorch+
Python+
C+++
CVPR+
NeurIPS+
ICCV+
相关职位

logo of insta360
实习

1、负责语音降噪、语音唤醒、语音识别等前沿语音算法的研发; 2、负责算法模型在业务场景数据集上的优化,导出部署在端侧或云端平台; 3、跟进行业最新算法动态,复现和优化前沿算法,保持算法在工业界和学术界的领先

更新于 2025-03-10
logo of baidu
实习TPG

-跟踪识别前沿相关技术 -负责大数据合成等技术研发和业务支持 -负责视频AEC技术的研发和业务支持 -负责说话人技术的研发和业务支持

更新于 2024-09-23
logo of baidu
实习TPG

-实验最新语音合成、理解方案,并对其中的模块进行解耦和分析。 -结合大模型范式,参与研发语音Encodec、Decoder、多模态对齐等模块,构建LLM based TTS和端到端Speech2Speech系统。 -参与到具体的语言合成业务落地工作 -参与语音大模型的评测及优化。

更新于 2025-04-11
logo of baidu
实习TPG

-实验最新语音合成、理解方案,并对其中的模块进行解耦和分析。 -结合大模型范式,参与研发语音Encodec、Decoder、多模态对齐等模块,构建LLM based TTS和端到端Speech2Speech系统。 -参与到具体的语言合成业务落地工作 -参与语音大模型的评测及优化。

更新于 2025-04-11