百度AIGC/数字人前端工程师(J68561)
-负责数字人业务后台系统的设计、开发与优化,包括但不限于用户管理、内容生成、任务调度、实时数据处理等模块 -参与音视频处理、AI 模型调用、渲染任务管理等核心业务后台的架构设计与性能优化 -根据业务需求,设计高可用、高并发的分布式服务,保障数字人生成与交互的实时性与稳定性 -编写高质量、可维护、可扩展的代码,并进行单元测试与代码评审 -与前端、算法、音视频处理、产品等团队紧密协作,推动需求落地和技术方案优化 -对接私有化客户及客户侧技术人员,制定项目技术实施方案,客户反馈问题修复
1、探索AIGC技术的相关技术,包括图片生成、视频生成、语音合成、数字人、智能对话等领域; 2、结合业务场景,设计并实现AIGC相关的算法和模型; 3、参与AIGC技术的性能优化和工程化工作; 4、持续学习和跟踪AIGC技术的最新进展,为团队提供技术支持和指导。
1、参与Alibaba.com数字营销系统的前端架构设计及研发,保障系统的安全、可扩展以及质量和性能。与UED、后台工程师协作,完成设计交互实现、数据交互、动态信息展现; 2、参与广告创意全链路的开发和优化,通过数据驱动、AIGC、算法推荐等方式,帮助业务拿到结果 3、参与跨境B类全球化创意中心的规划建设,包括可视化制作、审核流程、可视化渲染、自动化生产、智能诊断等,推动协助相关团队并落地未来产品和系统规划 4、研究和探索创新的开发思路和新的前端技术,结合业务特点创新应用AI技术,解决前端团队开发过程中面临的各类问题,提升个人和团队的开发效能
1.负责AI Lab语音技术团队语音技术,包括TTS、语音压缩编码、语音前端处理等,尤其是基于AIGC算法的基础研究和应用落地。 ; 2.侧重于研发语音合成、语音转换、few-shot / zero-shot TTS、音频和音乐生成等先进算法尤其是生成类算法,并且可以融合语音识别、音频分析、语音增强、语音分离等更广泛的语音/音频任务。将有关算法成果应用于语音 / 音乐 / 音效/音频生成、语音翻译(S2TT、S2ST)、虚拟人等众多场景中。 ; 3.通过跟踪和创新,确保算法方面的行业领先,通过打造语音技术PAAS平台服务于腾讯内部各个业务场景包括游戏、社交、内容服务、广告、金融、车载助手、企业服务(如腾讯会议、企业微信、企点客服、商通、数智人)等等,帮助业务产生实际价值和打造业界领先的语音应用产品。; 4.持续关注学术界和行业的最新研究动态,参与国际会议、研讨会,与全球顶级团队进行交流合作。。