logo of alibaba

阿里巴巴音视频技术实习生

实习兼职淘天集团研究型实习生地点:北京 | 杭州状态:招聘

任职要求


【必备项】 
1、硕士及以上学历,通信、计算机、数学等相关专业,具备良好的音视频专业基础; 
2、有较好的工程实现能力,精通C/C++Python等至少一门编程语言,较强的逻辑、数据分析能力; 
3、学习能力强,对新事物保有好奇心,并能快速适应新环境; 
4、良好的沟通能力和团队协同能力,能与他人合作,共同完成目标;对所在领域有热情,善于独立思考并反思总结。 
【加分项】 
1、有相关岗位实习及项目开发经历者优先; 
2、有音视频领域竞赛获奖或者相关学术论文者优先;

工作职责


在这里,你将参与淘宝直播及短视频等丰富的内容业务场景,围绕“更好听、更好看、更好玩”,和其他优秀的同学一起,为用户提供极致的体验;
在这里,你将负责为用户提供最优的音质,负责音频增强及编码相关算法研发,包括但不限于音频3A算法(降噪、回声消除、自动增益)、音频编码、人声美化,虚拟音效、空间音频等算法;
在这里,你将负责音乐相关算法研发,包括但不限音乐理解、音乐检索、音乐生成、智能配乐等算法;
在这里,你将负责面向RTC的音视频传输算法优化,包括但不限于带宽预测、拥塞控制、多码率自适应、音视频弱网对抗等算法;
在这里,你将会持续关注AI音视频、AI传输等相关领域的前沿算法,并针对真实场景,把算法落地应用到实际项目中。
加入我们,你将会面对新的内容场景,通过技术深耕,致力于行业领先的音视频技术创新和应用,帮助创造极致的消费者体验。
你的工作将服务于改善全世界数十亿人的购物、娱乐和交互的体验。
探索未知,挑战未来,来吧,我们等你加入!
包括英文材料
学历+
C+
C+++
Python+
数据分析+
相关职位

logo of xiaohongshu
实习客户端开发

工作职责: 1、负责多端(Android&iOS&linux&PC)视频拍摄及视频剪辑底层SDK开发 2、负责音视频创作工具整体链路性能优化&画质提升

logo of alibaba
实习淘天集团2026

T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 如果你,渴望深入探索视频生成技术,开发文本到视频(T2V)基础模型的前沿技术,致力于提升生成视频的画质,真实性,一致性,以及视频生产的效率; 如果你,热衷于AIGC驱动的视频增强与处理技术,专注于将通用大模型架构优化并迁移到垂直领域,推动下游应用性能的突破; 如果你,专注于基于AIGC的可控性编辑,探索如何精准实现内容生成与修改,满足多样化的业务需求; 如果你,对基于AIGC的人脸,人体生成编辑技术充满热情,致力于打造具有高度交互性和真实性的数字形象; 如果你,期望在多模态视频理解领域取得突破,通过技术创新提升视频内容的理解与分析能力; 如果你,期望与一群聪明、皮实、乐观、追求卓越的优秀伙伴并肩作战,共同开创音视频技术的新篇章; 那还在等待什么,赶紧加入我们吧! T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper ꔷ 投递T-Star实习生,提前解锁淘天顶级技术岗位,实习与T-Star正式批/应届秋招投递不冲突。拿到T-Star意向书的同时,将获得直通正式批次终面的机会;参与T-Star实习且表现优秀的同学,提供T-Star转正Offer。

更新于 2025-05-07
logo of bytedance
实习A121982

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:视频与边缘部门承载了字节跳动的媒体内容分发基建及技术中台,支持了字节全系产品,如抖音、今日头条、番茄小说、西瓜视频等APP的点播、直播、实时通信、图片等多媒体业务发展,同时将业务发展过程中沉淀下来的技术能力和工具,通过火山引擎对外输出,面向各行各业用户提供视频云产品和服务,愿景是为内外部业务伙伴提供最低成本、最优画质、最低延时、最安全可靠的富媒体内容分发解决方案,助力业务伙伴降本提效实现持续增长。 1、负责跨平台实时音视频SDK的开发和交付; 2、参与SDK的架构设计、开发、性能优化、CICD等工作; 3、参与SDK用户体验的优化,如端到端延时、卡顿、画质、稳定性、首帧出图等; 4、参与音视频自动化测试系统的搭建。

更新于 2025-09-09
logo of bytedance
实习A59858

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:IT部门面向字节跳动员工提供全球IT技术支持。我们既负责企业内部IT基础架构的设计和优化,也肩负着保护企业信息安全,降低企业运营风险的使命;同时,IT团队还会直接面向字节各业务线,承接企业级的网络、系统、终端、资产、服务台、多媒体、办公管理等多业务场景的研发需求,打造符合业界标准的商业化企业解决方案和产品,运用大数据和AI技术,提供更加自动化和智能化的企业技术服务。 1、负责音视频会议系统运维工具开发,提升会议系统(如Zoom、飞书会议平台等)的稳定性与效率;开发监控工具,实时追踪音视频设备、网络质量及会议系统的运行状态,优化现有运维流程; 2、会议系统测试与质量保障,设计并执行音视频会议系统的功能测试、性能测试及兼容性测试用例;搭建自动化测试框架;分析测试结果,协同开发团队推动修复; 3、技术支持与问题响应,协助处理企业内部会议系统的紧急故障,提供技术解决方案;收集用户反馈,持续改进系统体验及运维工具的功能; 4、编写技术文档(如工具使用指南、测试报告、系统架构说明),与跨部门团队(网络运维、软件开发、硬件支持)协作,推动项目落地。

更新于 2025-05-13