网易资深多模态算法工程师
社招全职3-5年网易游戏(互娱)地点:广州状态:招聘
任职要求
1. 硕士及以上学历,计算机科学、人工智能、电子工程等相关专业毕业,具备图像识别、计算机视觉、多模态建模领域扎实的理论基础与工程经验; 2. 熟练掌握至少一种主流深度学习框架(如PyTorch、TensorFlow),具备优秀的算法实现、模型优化及工程落地能力; 3. 具备以下至少一项领域的研究或实际项目经验: a. 多模态预训练模型的应用与优化(如Inte…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1. 负责多模态大模型(涵盖图像、视频、音频、文本等模态)在内容安全、活体检测、人脸识别、内容理解等场景的算法研发与性能优化; 2. 探索和实现图像、视频、文本等多模态数据的统一建模与高效表征学习,提升模型在内容审核、短视频内容理解等任务中的泛化性和鲁棒性; 3. 紧密跟进与研究业界领先的大模型技术,如InternVL3、Qwen2.5-VL等,探索并落地其在图文审核、视频内容审核、身份核验等业务场景中的应用策略及精调方法; 4. 负责构建并持续优化模型训练及推理系统,显著提升多模态模型在安全审核领域的准确率、召回率与实时响应性能; 5. 探索并实现文本生成图像技术在内容生成与审核中的应用,提升系统的生成与理解能力; 6. 与产品、工程等相关团队密切合作,推动多模态审核、识别系统的业务落地,实现业务场景的闭环验证与持续迭代优化。
包括英文材料
学历+
OpenCV+
https://learnopencv.com/getting-started-with-opencv/
At LearnOpenCV we are on a mission to educate the global workforce in computer vision and AI.
https://opencv.org/university/free-opencv-course/
This free OpenCV course will teach you how to manipulate images and videos, and detect objects and faces, among other exciting topics in just about 3 hours.
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
还有更多 •••
相关职位

社招3年以上技术
1. 探索和应用深度学习、生成对抗网络 (GAN)、扩散模型 (Diffusion Model) 等前沿技术;用于图像生成、视频生成、视频混剪等 AIGC 任务。 2. 跟进行业动态,深入理解各种开源技术方案的论文和源代码,根据业务需求进行选择、优化和改进。 3. 与产品经理、设计师和其他工程师紧密合作,将 AIGC 技术应用于实际产品中。
更新于 2025-11-26北京
社招5年以上A86146A
1、负责基础模型和生成式人工智能的基础能力建设和业务落地,包括但不限于文本生成/翻译、图生文、深伪技术、大模型高效训练/推理等等,追踪业界最前沿进展,并进行前瞻性的技术研究; 2、带领团队将AIGC相关技术在广告、电商、短视频、直播等商业产品的内容理解上落地,构建新一代基于大模型的商业化生态; 3、负责大模型算法团队的项目规划、团队建设、跨团队合作,打造行业领先的内容理解算法团队。
更新于 2024-03-11上海
社招国际业务AI &
1. 参与 Trip.com 国际业务在多语言用户体验设计以及研发流程的算法创新和应用落地。 2. 负责一个或多个具体业务方向: a. 国际站点的数十种场景和语向的翻译质量评估以及相关基础技术的研究。 b. 基于多模态大模型的GUI Agent 的技术研发,支持巡检等应用场景的应用落地。 c. 负责首页、行程的关键模块AI创新探索。
更新于 2025-10-28上海