
叠纸游戏技术音频-工具开发(2026届秋招返场)
任职要求
1. 本科及以上学历,计算机科学、软件工程或同等专业背景 2. 专业技能要求: - UI 设计、开发经验 - 了解 CI/CD 技术,如自动构建、自动化测试等 - 了解音频管线优化相关技术,如 Wwise 各模块、UE Commandlet、REAPER ReaScript 等 - 良好的软件工程思维、产品思维 - 良好的代码习惯,能写出易维护、可读性高的代码 3. …
工作职责
1. 主动识别音频生产管线中的低效率步骤,开发自动化解决方案 2. 将零碎需求系统化,提升工具的可复用性 3. 参与工具的用研、开发、测试与维护,建设团队技术基础设施 4. 追求极致的用户体验,对产品设计与界面交互有审美追求
T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 在这里,你将参与贡献大型电商场景下与音视频体验和成本相关的一系列研发工作; 在这里,你将参与视频编码(包括但不限于HEVC/VVC)优化:通过基于信号处理和机器学习的快速编码决策、数据结构、并行框架设计,优化编码速度,同时在有竞争力的视频编码内核基础上,探索基于语义的内容感知编码优化,深度学习编码,AIGC编码等前沿课题,在保障画质体验的前提下,尽可能节省带宽; 在这里,你将参与海量图像和视频的增强修复工作:运用前沿技术,包括但不限于模型结构优化、数据仿真和增强策略优化、知识蒸馏以及模型压缩,在限定带宽环境对任意失真的视频进行高效处理,力求最好的画质。同时,跟踪业界最新进展和技术趋势(包括AIGC)并融入特定的场景,提出创新方案,帮助平台提供逼近广电级别的视频画质; 在这里,你将参与视频编码与处理联合优化:在标准编码框架的基础上,借助AI领域的新技术成果来研究视频信号的表征、编码与处理,将视频前后处理与编码联合优化,提升端到端压缩效果; 在这里,你将参与美颜等视频美化技术的研究工作,包括人脸检测、关键点、肤色美白、面部塑形、化妆效果模拟等。这些技术将应用于直播和短视频等多样化场景,并确保其在真实视频场景的有效整合。你还将专注于基于3D人脸建模和AI算法的智能美颜技术,推动这些技术的大规模落地; 在这里,你将参与UGC视频生产剪辑依赖的多类当下最前沿的图像视频生成与编辑,包括图像风格化,人像分割与实例分割,人脸属性,图像可控生成,图像视频化等,为视频剪辑提供更丰富的素材和更多的玩法; 在这里,你将有机会参与最前沿的音视频质量评价算法工作,包括无参考的视频质量评价,人脸美学评价,音频质量评价,为多媒体算法的迭代和平台音画质的体验提供基础工具; 在这里,你将帮助淘宝直播等大型的视频传输场景设计QoS算法,追求超低延时、极速播放等用户体验,并支持各种弱网环境下的最优的视频流畅度和优雅的画质降级。 T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper ꔷ 投递T-Star实习生,提前解锁淘天顶级技术岗位,实习与T-Star正式批/应届秋招投递不冲突。拿到T-Star意向书的同时,将获得直通正式批次终面的机会;参与T-Star实习且表现优秀的同学,提供T-Star转正Offer。
你将加入一个正在重塑工业音视频体验的先锋团队——不是在做传统的“系统搭建”,而是在用AI重新定义“声音与画面如何说话”。 我们正从传统音视频工程,全面迈向音视频+生成式AI的新时代。 你将深度参与Tesla 门店与超级工厂的视觉与听觉系统建设,但不止于此—— 你还将主导AI驱动的内容生成: 用大模型 构建智能文生图、图生视频的工作流,让展厅内容自动演化; 搭建可交互的AI音视频配置系统,实现“一句话生成沉浸式展示空间”; 探索短视频内容的AI自动生成,从脚本、画面、配音到剪辑,端到端智能化; 将 AI Agent 融入音视频系统,实现设备自动调试、故障预判、会议智能协同。 这不是“升级系统”,这是让音视频拥有意识。 你不是在维护设备,你是在设计一个能理解场景、响应需求、创造内容的智能视听大脑。 我们不只做技术,我们做未来体验的建筑师。 职责描述: 参与Tesla全国门店与超级工厂的音视频系统交付,从规划、部署到调试与验收,确保每一场视觉呈现都精准、震撼、无故障。 支持大型Event与发布会,主导设备搭建、实时音视频调度与异常预案,做到“零失误,极致流畅”。 负责厂区会议室与生产现场音视频系统的日常巡检与故障响应,但你会用AI工具提前预判问题,而不是被动处理。 探索并落地生成式AI在音视频场景中的应用: 使用我们的模型构建智能内容生成引擎; 实现可视化、可配置的AI工作流; 推动 文生图、图生视频、AI短视频生成 的原型开发与项目验证。 学习并掌握音视频核心技术:电声、灯光、编解码、流媒体传输,但你会用AI重构这些流程,让“技术”变成“智能”。 熟悉ZOOM、Teams等会议系统,但你将用AI Agent实现自动会议配置、智能发言人识别、实时字幕生成等进阶功能。
1.与音频设计师和游戏项目组合作,通过自研技术提高游戏音频制作生产力,提供优质的交互体验; 2.了解和分析音频团队的技术需求,完整参与音频自研工具和技术的用研、设计和实现,改进生产管线和流程; 3.作为技术音频团队成员,共同开发、测试、调试和维护公用技术; 4.确保各项工作结果符合团队工程规范和性能要求,记录必要的文档。