vivo算法工程师
任职要求
1计算机、电子信息、自动化、应用数学等相关专业本科及以上,3年以上机器学习/深度学习经验,或具备同等能力的开源/竞赛成果 2熟练使用 Python,熟悉深度学习主流框架(PyTorch ,TensorFlow ) 3扎实的工程能力:熟悉Git、Docker、Linux,能够独立构建可复用的数据与训练管线 4熟悉大模型训练流程:数据准备、预训练、指令微调、评测与迭代;具备良好的问题定位与性能调优能力 5具备良好的沟通协作能力与自驱力,能够在不完全信息下推进项目 专业要求(VLM 与数据构建): 1多模态模型与视觉表征 1.1熟悉以下至少两个领域:VQA、Video Captioning、Video Reasoning、Content Retrieval、Saliency Detection、Behaviror Analysis、Intention Prediction、Multi-Modal Sensing & Understanding的相关技术 1.2熟悉视觉Backbone与Tokenizer:ViT/ConvNeXt/Swin、SAM、DINO、Q-Former、VQ-VAE 等 2训练与对齐 2.1具备多模态对齐、跨模态检索、图文匹配、视觉问答任务的建模与评测经验 2.2掌握指令微调、偏好对齐(RLHF/RLAIF)、对比学习、知识蒸馏、混合专家(MoE)等 3数据构建与治理 3.1有音视频以及多传感器数据集构建经验,包括标签预处理、时空对齐、语义语料分析等。具备大规模数据采集、噪声过滤、去重(感知哈希/SimHash/MinHash)、质量评估(Heuristics/模型打分)、数据分层采样与混料(mixing)经验 3.2熟悉标注策略与工具链:人机协同标注、主动学习、弱监督/自监督数据生成、数据一致性与审计 3.3理解数据对齐与红队测试:安全、合规、偏见与毒性检测,视觉版权与隐私合规意识 4评测与产品化 4.1能构建多维评测集(准确性、鲁棒性、幻觉率、安全性、时延/吞吐) 4.2了解在线评测、能将数据-模型-评测迭代形成持续优化闭环
工作职责
1设计与实施多模态数据构建方案:包含数据采集、清洗、标注、弱监督/自监督数据生成、数据质量评估与反馈闭环 2构建和维护训练/评测基准(benchmarks):覆盖视觉推理、视频理解等 3负责多模态大模型(VLM,Vision-Language Model)的优化,包括模型架构对接、训练策略、推理加速与效果评估。 4关注前沿技术并进行可行性验证(PoC),推动新算法或新数据策略到生产级落地 5撰写技术文档,沉淀最佳实践,指导初级工程师与标注团队
团队负责数十个垂类业务场景搜索、推荐体验优化、效率提升工作,支撑下沉、店铺、券搜、企业/工业、商超类、新零售等战略创新业务。 工作内容: 1.基于NLP相关技术(LLM、知识图谱等),理解用户query意图,并构建优化文本/多模态的搜索匹配模型,保障并提升搜索体验; 2.高效算法系统建设:基于AutoML、强化学习、迁移学习等技术,并通过流程化/产品化方式,建设算法PaaS平台、在线多业务高性能算法系统,提升多业态算法优化迭代效率; 3.追踪前沿技术,应用于搜索、推荐场景全链路(召回、排序、策略)进行模型优化和差异化创新,提升多业务场景效率指标。
工作内容: 1.负责统筹海外站的工作,包括业务需求支撑、日常算法体验效果迭代; 2.负责境外业务的搜索推荐核心链路算法的研发工作(召回、排序、策略、相关性、导购商卡),致力于提升用户体验和流量转化效率,支撑海外业务快速发展; 3.针对海外业务特点,做搜推前瞻性的技术规划(包括多语言NLP模型、跨语言搜索等),并推动实施。
1.负责基于运筹优化与机器学习相结合的物流配送优化; 2.负责地图场景的NLP模块和搜索推荐引擎的构建与开发; 3.负责货车导航能力构建、轨迹道路数据挖掘、基于地理位置的挖掘算法研究及优化,包含技术架构、选型、应用、落地等技术工作; 4.跟踪机器学习、数据挖掘等方向的前沿算法,承担技术框架建设和落地实施优化; 5.负责协同工程、产品等团队合作。
工作职责: 1. 负责内容安全算法研发,包括但不限于文本、图像、视频、音频等多模态内容的识别与过滤。 2. 针对违规内容(如涉黄、涉暴、涉政、垃圾广告、诈骗等)构建高效、精准的检测模型,提升平台内容安全水平。 3. 研究前沿AI安全技术,优化现有算法策略。 4. 结合业务场景,设计并优化内容安全体系,包括实时拦截、离线审核、用户行为分析等模块。 5. 与产品、运营、审核团队协作,推动算法落地并持续迭代,提升审核效率和准确率。 任职资格: 1. 学历/专业:计算机、人工智能、数学等相关专业硕士及以上学历,3年以上内容安全相关经验(优秀本科生可放宽)。 2. 熟练掌握机器学习、深度学习算法,熟悉NLP/CV领域常见模型。 3. 熟悉内容安全相关技术。 4. 熟练使用Python/C++,具备大规模数据处理经验。 5. 业务理解:对互联网内容生态和风险场景(如UGC/PGC审核)有深刻认知,能快速定位业务痛点。