字节跳动Android开发工程师-抖音中视频-北京/上海/杭州
任职要求
1、本科学历及以上,计算机及相关专业,具有一定的 Android 开发经验; 2、具备扎实的Java / kotlin 语言基础,熟悉常用的数据结构和算法,熟悉Android框架及各种特性,熟悉面向对象编程,理解设计模式; 3、精通 Android 的开发框架,熟悉 Android 系…
工作职责
1、负责抖音中视频业务的功能研发和体验优化,深入参与产品需求讨论,功能定义等; 2、负责抖音中视频业务的架构设计、基础组件开发、性能优化等工作,持续提高开发效率; 3、关注客户端新技术发展,探索及实践,推动团队的技术研究和创新; 4、根据团队整体目标与规划,参与重大项目研发,进行技术难题攻关。
1. 通过多模态算法进行用户的可信认知,支持十亿级支付宝用户,业务覆盖支付宝、蚂蚁国际、消金、财富、保险、生态等蚂蚁全域场景。 2. 方向一:多模态理解与推理方向,负责全面、高精、高效的多模态垂域模型研发,深耕视觉图像&视频reasoning,提升理解和推理能力,攻坚reward设计、多模态推理框架设计等核心问题。 3. 方向二:负责声纹识别、声音防伪算法以及意图理解等算法,探索声纹表征、声纹防伪、ASR、语音合成等All-In-One模型方案,研发金融级识别和防伪算法,落地与实际支付场景; 4. 方向三:声学算法部分,负责波束成形、声源定位、阵列增强、音频编解码等软硬件一体语音信号处理算法原型开发、性能优化 5. 关注多模态以及语音大模型算法前沿技术和发展动态,持续探索新一代AI驱动的、高效的、有效的、业务及产品新范式,推动业务发展、引领行业变革;
1、应对新的人机交互范式,在GenAI加持的泛智能终端的背景下,研发新一代多模态人机交互算法及新的核身方式。 2、方向一:Omni多模态交互方向,研发多模态实时视频交互的新一代AI核身方案,像人一样多种模态的信息(文本、图像、音频、视频)并以流式方式生成文本和自然语音响应。构建新一代的身份核验算法,打造易用安全便捷、高兼容性和高扩展性的身份核验方式。 3、方向二:语音交互方向,负责AI核身语音语义全双工交互研发和优化,建设面向未来的语音交互核身算法体系; 4、方向三:泛终端与具身交互方向,面向下一代人机交互范式,针对XR端/AI眼镜/AI手机/智能可穿戴设备/AI原生APP/具身智能等,建设语音交互核身、知识核身、虹膜核身等各类新核身能力。 5、方向四:异构数据对齐与理解,设计有效的解决以人为中心的图像、音频、视频、PPG、IMU、文字等多个模态语义对齐和模态融合方案,进一步完成定向感知、信息一致性及推理任务。 6、持续追踪新一代的人机交互范式下,包括各类大模型技术,各类新设备和新形势,追踪身份核验和数字身份方向新研究和风险动向,保持创新的同时将业界 SOTA模型持续优化并落地至线上获得收益。
核心职责定义 以商业化内容安全把控与审核服务体验提升为使命,做好审核规则端到端的管理与运营。 审核规则管理运营流程 规则管理:制定规则管理的流程,对规则的上传下达的方式进行定义,规范化政策管理 规则运营:制定规则表现监控,数据分析,洞察收集以及最终迭代的流程 审核规则体系构建与输出 风险分类拆分:制定风险分类预拆分原则,并根据原则对风险进行分类,拆分为多级,构建审核规则框架 业务场景解构:基于平台产品/内容类型、媒介形态、用户角色、审核流程等维度进行场景细分 风险矩阵建模:建立违规内容分级体系(如高危/中危/低危) 审核规则输出与迭代 规则输出:对风险管控政策方向进行解读并与其对齐,使用可量化的或可直接引导操作的语言制定相应的详细机器审核以及人工审核规则,确保风险管控政策能够被落地执行,并对应制定面向非商业化审核与客服的规则版本以促进各相关方对内容安全的理解,促进客户体验的提升 规则迭代:根据风险管控政策/方向变化,规则执行表现,外部环境发展,内部业务变化,各相关方反馈等渠道透传的洞察,对规则进行相应迭代以符合业务需求。 规则配置:使用规则管理与运营相关工具对规则进行系统化配置,使规则得以被执行,能够被应用在被审核内容上 审核规则执行监控与分析 规则效果评估:对每一条规则的规则争议率,规则模糊率,规则缺失率以及规则过严率进行监控与分析,定期复盘分析评估规则对风险管控和用户体验的实际效果与影响。基本要求 规则架构设计能力:擅长构建分层分类的审核规则体系(如区分人工/机器审核场景、风险等级划分),熟悉多模态内容(文本、图像、视频、直播)的审核逻辑差异 数据驱动思维:通过“规则争议率、模糊率、缺失率、过严率”等量化指标诊断规则问题,具备统计学分析、A/B测试设计能力,能通过数据反推规则优化方向。 动态适应与创新:跟踪政策法规(如GDPR、DSA、中国《网络信息内容生态治理规定》)和技术发展(如AI生成内容、深度伪造),快速迭代规则以应对新兴风险。 跨团队协作与沟通:需与技术团队(算法、产品)、业务团队(运营、客服)、合规团队(法务、风控)高频协同,具备将复杂规则转化为可执行技术方案的能力,同时能向非专业团队解释规则逻辑 加分项 跨领域复合型能力:兼具法律合规(如网络安全法、数据隐私条例)、内容运营、机器学习算法等多领域知识,理解审核规则的法律边界、业务需求与技术实现逻辑。 语言能力:英语的听说读写译能力兼具,能够作为日常工作语言撰写文档,进行跨部门沟通 核心职责定义
商业算法AIGC视频智能剪辑团队主要负责小红书广告场景下的视频智能剪辑算法建设,围绕视频创意生产全链路,从创意机会挖掘、脚本策划辅助、智能节奏剪辑到多片段智能组装,建设系统化的视频智能剪辑能力体系。持续提升广告主视频素材质量与跑量效果。 职位职责 1. 负责广告 AIGC 视频素材生产中的智能剪辑算法建设与迭代; 2. 基于广告主商品、卖点、行业趋势、历史投放素材等信息,研发视频内容理解、场景识别、关键帧提取、镜头语言分析等关键能力; 3. 建设智能剪辑核心能力,包括节奏卡点、镜头选择、BGM匹配、转场特效、字幕生成、智能拆条等,提升视频生产效率; 4. 推动智能剪辑能力与 AIGC 素材生产链路深度联动,持续优化视频素材的 CTR、转化率、消耗渗透等核心指标。