
平安科技资深算法工程师
社招全职5年以上计算机网络技术类地点:上海状态:招聘
任职要求
1、教育背景:人工智能、计算机科学、电子工程等相关专业硕士及以上学历。 2、工作经验:1) 5年以上视频理解、智能剪辑等相关算法研发经验。2) 博士或海外顶尖院校背景优先。 3、技术能力:1)精通镜头分割、关键帧提取算法,有基于学习的自动化剪辑系统开发经验,能设计动态剪辑策略。2)掌握光流估计(如RAFT++)、时序建模(如Transformer+LSTM级联),FFmpeg,熟悉Sora 2.0、Phenaki 2.0等模型的原理与优化方法,能解决长时序一致性问题。3)有CLIP、BLIP-2等多模态模型开发经验,能设计跨模态对齐的训练策略。4)精通深度学习理论,熟练掌握PyTorch/TensorFlow框架,具备扎实的数学基础,能独立推导复杂模型架构。5) 掌握情感识别算法,熟悉情感计算理论与心理学模型,能实现视频内容的情感语义标注。 4、沟通与协作能力:1)具备优秀的沟通能力,能清晰表达技术方案并推动跨部门协作。2)善于分解复杂问题,通过数据驱动决策优化算法。 5、加分项:在CVPR/ICCV/ECCV/ICLR/NeurIPS等顶会发表过视频理解相关论文。
工作职责
1、视频理解算法研发与多模态分析:1)主导视频内容理解算法的端到端研发,覆盖动作识别、事件检测、微表情及情感语义分析,构建从数据预处理到模型部署的全流程方案。2)设计例如基于Video Swin Transformer、3D CNN及CLIP等的多模态分析框架,实现“视觉-音频-文本”多维度内容解析。3)探索前沿技术如可控视频理解、物理引擎整合,提升复杂场景下的语义解析精度。 2、智能剪辑系统设计与自动化流程:1)开发基于多模态的智能剪辑框架,实现镜头分割、关键帧提取及内容摘要的自动化处理。2)设计自然语言交互式剪辑工具,支持用户通过文本指令或语音交互完成视频编辑,提升创作效率。 3、多模态交互与场景落地:涉及自然语言交互式编辑工具,支持用户通过对话逐步细化生成内容,提升创作自由度。 4、技术落地与产品化:1)与工程团队协作,将算法集成至业务系统,解决实际场景中的挑战。2) 设计标准化工具链,支持用户通过简单接口调用生成能力。 5、可独立进行跨部门技术方案评审,协调各方需求确保项目按时交付。跟踪国际顶会最新前沿技术成果,定期组织技术分享。指导初级工程师,建立算法知识库和代码库。
包括英文材料
学历+
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
Raft+
https://raft.github.io/
Raft is a consensus algorithm that is designed to be easy to understand.
https://thesecretlivesofdata.com/raft/
Understandable Distributed Consensus
https://www.youtube.com/watch?v=ZyqAbQkpeUo
Sail into the world of distributed systems with our in-depth, Raft consensus algorithm tutorial.
Transformer+
https://huggingface.co/learn/llm-course/en/chapter1/4
Breaking down how Large Language Models work, visualizing how data flows through.
https://poloclub.github.io/transformer-explainer/
An interactive visualization tool showing you how transformer models work in large language models (LLM) like GPT.
https://www.youtube.com/watch?v=wjZofJX0v4M
Breaking down how Large Language Models work, visualizing how data flows through.
LSTM+
https://colah.github.io/posts/2015-08-Understanding-LSTMs/
Humans don’t start their thinking from scratch every second.
https://d2l.ai/chapter_recurrent-modern/lstm.html
The term “long short-term memory” comes from the following intuition.
https://developer.nvidia.com/discover/lstm
A Long short-term memory (LSTM) is a type of Recurrent Neural Network specially designed to prevent the neural network output for a given input from either decaying or exploding as it cycles through the feedback loops.
https://www.youtube.com/watch?v=YCzL96nL7j0
Basic recurrent neural networks are great, because they can handle different amounts of sequential data, but even relatively small sequences of data can make them difficult to train.
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
TensorFlow+
https://www.youtube.com/watch?v=tpCFfeUEGs8
Ready to learn the fundamentals of TensorFlow and deep learning with Python? Well, you’ve come to the right place.
https://www.youtube.com/watch?v=ZUKz4125WNI
This part continues right where part one left off so get that Google Colab window open and get ready to write plenty more TensorFlow code.
CVPR+
https://cvpr.thecvf.com/
ICCV+
https://iccv.thecvf.com/
ICCV is the premier international computer vision event comprising the main conference and several co-located workshops and tutorials.
ECCV+
https://eccv.ecva.net/
ECCV is the official event under the European Computer Vision Association and is biannual on even numbered years.
ICLR+
https://iclr.cc/
NeurIPS+
https://neurips.cc/
相关职位

社招2年以上计算机网络技术类
1. 负责声纹身份、情绪、年龄、性别、健康状况识别等相关算法的研发; 2. 根据具体场景、环境、设备,进行模型的精度优化、性能优化; 3. 实现模型的高度棒性,具有活体检测和防攻击能力; 4. 引入、优化多模态大模型研发技术方案,熟悉多维特征向量处理过程; 5. 跟进前沿技术发展,实现现有功能提升,以及拓展新的模型,同步形成论文与专利等知识成果。
更新于 2025-09-12

社招计算机网络技术类
1.负责金融客服和催收领域的坐席助手、AI机器人等相关产品的研发,能独立负责自然语言处理应用研究和算法落地工作,包括话术质检、风险预警、对话摘要、关键内容提取、策略推荐、文本生成等 2.跟踪业界研究成果,将前沿NLP、大模型技术应用于相关场景中,根据实际应用效果不断优化模型和算法,研究方向包括但不限于大模型推荐、对话生成、离线强化学习等 3.深度理解业务,与业务方紧密配合达成业务目标
更新于 2025-08-22