传音音视显资深测试工程师(领域TSE角色)(J18191)
任职要求
1、本科及以上学历,电子信息、软件、通信等相关专业; 2、6年以上多媒体领域(音视显)灰白盒测试或开发经验,其中3年以上音视显模块测试设计经验,熟悉音视频框架和各功能实现原理等; 3、熟悉Java、C/C++,Python等主流Android开发语言; 4、熟悉TestNG等主流测试框架,能够进行灰白盒/接口测试设计,具备Log分析能力; 5、逻辑思维清晰、分析能力强,具有强烈的质量管理意识和责任心; 6、具备音视显多领域开发经验者优先。
工作职责
1、主导部门音视显集成测试框架和方案的设计; 2、负责音视频灰白盒/接口/UI测试能力建设; 3、指导团队成员完成音视显自动化测试工具的开发,; 4、与开发深度协作,增加合理Log埋点,准确分析判断问题,跟踪并推动问题及时解决; 5、研究多媒体领域行业动态,主导测试技术洞察和难题攻关,引入和研发高质量的技术框架和测试能力。
研究领域: 人工智能 项目简介: 课题1:音视频细粒度理解与token压缩,负责人:默宸,HC数:1个 随着大模型时代的到来,图文领域的视觉Token压缩技术为复杂场景下的视觉理解提供了全新的解决思路。这种技术不仅能够有效减少冗余信息,还能保留关键语义特征,从而显著提升图像的细粒度理解能力,同时满足高时效性任务的需求。基于此,我们希望能够开展基于query牵引与信息密度的Token压缩算法研究,针对视频内容的特点,设计高效的压缩与理解方案,以推动视频审核算法的性能优化与实际落地。 课题2:基于规则动态化Token交互的高效视频理解与推理模型研究,负责人:夜兰,HC数:1个 本研究方向旨在探索一种基于多规则联合推理的高效视频理解模型,以解决视频理解任务中效率与精度的平衡问题。通过规则先验引导的视觉Token联合抽取,结合视觉Token压缩技术,显著减少冗余信息并优化计算效率。模型引入动态规则-Token对应机制,实现规则与视觉信息的高效联合提取,同时结合多任务学习框架,支持多种规则的统一推断与协同处理。该方案能够在保持高精度的同时显著提升推理速度,适用于视频内容多规则审核、视频账号行为识别和场景分类等高时效性任务,为实际应用场景提供高效、细粒度的视频理解解决方案。 课题3:视频开集信息检测和定位,负责人:默宸,HC数:1个 随着视频内容生态的爆发式增长,传统闭集检测方法在面对业务快速迭代需求时面临显著挑战,难以泛化至开放场景下的新概念检测,且时空定位精度与效率难以平衡。本研究致力于构建视频开集信息检测框架,通过多模态语义对齐与时空注意力机制,实现对任意指定内容的视频检索(包含时空定位)。该技术将推动视频审核从定制化开发向通用化检测转型。 课题4:隐式深度推理与动态步骤压缩的协同优化架构研究,负责人:侯猫/亘郁,HC数:2个 现有大语言模型在复杂推理任务中面临根本性效率瓶颈:基于Transformer的注意力机制导致计算复杂度随上下文长度呈二次增长,KV缓存存储开销线性增加。传统显式推理方法(如Chain-of-Thought)通过生成冗长中间步骤提升精度,却加剧了计算资源消耗;而隐式推理虽能压缩计算步骤,但存在推理路径不可控、状态迭代深度不足等缺陷。因此希望从融合动态步骤压缩与隐式深度推理的角度出发,不仅实现动态剪枝冗余中间思考步骤,同时通过隐状态迭代实现深度计算扩展,从而达到在保持/提升推理精度的同时,将复杂任务的计算负载降低5,突破现有模型在长文本生成与多跳推理中的效率天花板。
1、负责输出会议室IT设备的标准解决方案,包括无线投屏、商显、音视频设备选型和系统运维,持续提升用户入会体验 2、负责对文印系统、设备的运维,包括文印设备的上下架、报修、维保、抄数、巡检、系统预警处理等,保障设备可用性 3、负责对PC机房的建设和运维,包括机房用电设计评估、物资选型、网络需求对接,确保机房建设成本的合理性和稳定性 4、负责对IT弱电机房服务器系统安装、上下架、基本故障处理、盘点,确保操作流程合规,保障服务器、存储、网络设备、UPS、精密空调等设备稳定运行 5、负责对IT电脑硬件选型提供专业意见,确保性能与成本的平衡 6、负责会议室设备资产管理、持续优化设备预警能力、推动资产自动化盘点落地 7、负责专项项目方案评估,落地实施及设备运维,使用利旧设备,为业务部门提供云算力软硬件服务,降低业务运营成本 8、对现有工作流程、制度、系统工具建立统一标准规范,运营最佳实践案例在内部复用
* 负责跨平台音视频模块的基础功能开发,对接各平台客户端实现相应需求。 * 负责音视频模块的兼容问题处理,使其在多样用户环境下运行良好。 * 负责音视频模块的性能优化,整体提升用户体验。