logo of baidu

百度AIGC多模态资深算法工程师(J78182)

社招全职5-10年MEG地点:北京状态:招聘

任职要求


-计算机类硕士及以上学历,具备5~10年的工作经验
-在图像/视频生成、理解领域具有深入的研究和实践,如:图像生成、视频生成、图像/视频语义理解等。有主流多模态理解、生成大模型深入实践优先
-至少熟悉一种主流的深度学习框架(PyTorchPaddlePaddleTensorflow等)
-积极主动,责任心强,有良好的团队合作和沟通能力
-计算视觉或多模态理解顶会上有论文者优先、具备一定带人项目经验者优先

工作职责


-负责AIGC团队多模态相关业务的算法研发,工作内容包括但不限于:图像/视频的生成与理解,如图像编辑、文生图、图生图、图生视频、语义匹配等
-负责AIGC多模态中台能力建设,追踪并落地应用多模态前沿技术
-负责模型训练和推理性能优化,探索多模态算法新范式
-探索AIGC在具体业务的产品新形态
包括英文材料
学历+
大模型+
深度学习+
PyTorch+
PaddlePaddle+
TensorFlow+
相关职位

logo of xpeng
社招

1、负责前沿计算机视觉和图形学AI算法研究,跟进业界LLM、AIGC、多模态等前沿技术 2、负责多模态技术实现图像/视频内容理解、图像文本描述等在车载智能座舱的落地应用

更新于 2024-07-01
logo of ctrip
社招3年以上商旅业务AI &

1、负责大语言模型相关技术(知识注入、指令对齐、深度推理、知识围栏等)的算法研究和应用落地,具备自然语言处理、对话系统、语义理解、文本检索,强化学习等方向的研发经验。 2、参与对话意图、对话管理、对话生成、人机协同、知识检索、情感分析等场景的模型的训练和迭代,包括数据清洗、微调、测试; 3、积极探索前沿技术并结合旅游业务场景微调大模型,提高大模型在特定任务上的泛化效果。

更新于 2025-01-23
logo of shein
社招信息技术类

1、负责计算机视觉和深度学习等相关算法的研发和实现; 2、负责图像分类识别、图像理解、图像搜索、多模态识别等算法的研究和开发工作; 3、参与和推动技术落地。

更新于 2025-07-02
logo of bytedance
社招A148700A

1、与业务方紧密合作,理清业务需求并从多模态角度提供解决方案; 2、跟进前沿多模态算法,了解常见多模态任务、数据、评测手段,能够使用内外部多模态工具; 3、处理和分析多模态数据,需要能够有效地清洗、整理和可视化数据等; 4、在多模态LLM上要做到用能改,并在业务数据上Finetune; 5、着重探索基于多模态LLM的视频内容理解,支撑各类业务; 6、与各团队紧密协作,确保算法实施满足业务需求,有优秀的团队管理经验。

更新于 2024-06-05