logo of transsion

传音高级算法工程师-CV(J15971)

社招全职地点:上海状态:招聘

任职要求


数学、计算机、自动化或其他相关专业。
具备扎实的数学功底,掌握计算机视觉图像处理基本算法,理解深度学习算法原理。
具备扎实的编程功底,熟悉Pytorch等主流深度学习框架,熟练使用C++/Python等至少一种编程语言,熟悉Linux开发环境。
掌握扩散模型原理,熟悉DDPM、Stable Diffusion以及可控生成和小样本生成技术,有相关研究者优先。
有良好的学习能力和创新思维,能够与团队良好合作和沟通,工作积极主动,自驱力强具备以下条件优先。
在计算机视觉(CVPRICCVECCV)和机器学习(NIPSICML,AAAI)等相关会议发表论文者优先。
在计算机视觉、机器人、图形学等相关领域竞赛取得名次者优先。

工作职责


负责AIGC+图像(包括视频)的算法研发工作,助力AIGC内容生态。
针对当前AIGC算法中的痛点问题,设计优化和加速算法,赋能公司图像视频生成业务要求。
包括英文材料
OpenCV+
图像处理+
算法+
深度学习+
PyTorch+
C+++
Python+
Linux+
Stable Diffusion+
CVPR+
ICCV+
ECCV+
机器学习+
NeurIPS+
ICML+
相关职位

logo of mi
社招5年以上A35523

1、负责端侧CV算法的研发和落地,包括但不限于目标检测、识别、跟踪等算法; 2、负责算法工程化,包括模型工程化和优化等工作; 3、负责端侧算法框架设计开发; 4、可能也会参与一部分多模态大模型相关的工作;

更新于 2025-04-02
logo of bytedance
社招A173988

1、与业务方紧密合作,理清业务需求并从多模态角度提供解决方案; 2、跟进前沿多模态算法,了解常见多模态任务、数据、评测手段,能够使用内外部多模态工具; 3、处理和分析多模态数据,需要能够有效地清洗、整理和可视化数据等; 4、在多模态LLM上要做到用能改,并在业务数据上Finetune; 5、着重探索基于多模态LLM的视频内容理解,支撑各类业务; 6、与各团队紧密协作,确保算法实施满足业务需求。

更新于 2023-10-31
logo of anker
校招

1、负责图像增强方面的算法设计和开发,包括数据构建、模型训练、端侧部署、性能优化等; 2、负责消费电子产品中深度学习算法研发,包括但不限于目标检测、识别、属性等模型的训练、优化和在产品中的部署落地; 3、针对产品结合图像相关技术,能够提出解决方案并进行算法设计、分析和测试; 4、关注 CV 相关领域内最新研究进展,能将算法落实到项目中。

更新于 2025-08-14
logo of alibaba
社招1年以上技术类-算法

应用计算机视觉、自然语言处理、多模态理解、数据挖掘与机器学习等技术处理阿里国际数字商业集团海量数据,构建多模态预训练大模型底座,落地前沿研究成果,实现技术理论与业务创新,为电商业务场景的商品理解与结构化、图搜与同款、搜索与推荐、数据分析与决策等各类国际化场景应用构建算法基础能力。 1、负责研发电商多模态预训练模型基座,抽象并解决商品理解的基础问题使得模型具备业务通识能力,并构建针对大模型幻觉问题、推理能力、模型加速等关键问题的系统性解决方案,提高下游业务的迭代效率和效果上限。 2、基于多模态预训练大模型,落地商品理解关键场景任务,比如商品类目/属性/标签预测、商品同款、商品图搜等,实现业务指标提升。 3、学习前沿论文与把握技术趋势,深入理解底层算法原理,探索实验面向未来的硬核技术,实现核心技术突破和技术创新,发表相关论文。

更新于 2025-09-02