logo of bytedance

字节跳动计算机视觉算法工程师(多模态内容理解)-国际电商

社招全职A117416地点:杭州状态:招聘

任职要求


1、硕士及以上学位,计算机相关专业,拥有优秀的编程能力,能熟练运用C/C++/Python;
2、熟悉TensorFlow/PyTorch等模型训练框架,了解混合精度训练、分布式训练、TensorRT部署等;
3、在计算机视觉/…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责在TikTok内容电商领域探索计算机视觉、多模态大模型等前沿技术;
2、负责多模态大模型等技术在内容电商领域的应用,赋能搜推、供应等电商环节;
3、负责多模态相关模型优化和迭代,包含视频理解、VLM Posttraining、General Universal Embedding等前沿技术。
包括英文材料
学历+
C+
C+++
Python+
还有更多 •••
相关职位

logo of amap
社招3年以上技术类-算法

我们正在寻找对多模态技术充满热情的算法工程师,加入我们的前沿技术研发团队。您将专注于多模态理解与生成,推动其在地图数据、信息流推荐、打车服务等场景中的落地应用,为用户提供更智能、更沉浸的服务。 主要职责 1、多模态模型研发:开发业界领先的图文多模态理解与生成模型,结合扩散模型(Diffusion Models)、Transformer架构等实现高质量场景理解和动态内容生成。 2、模型优化与性能提升:优化多模态模型的推理速度和计算效率,支持端侧部署。探索适合大模型的压缩与加速技术(包括但不限于量化、剪枝、知识蒸馏等)。 3、业务场景落地:将多模态技术应用于实际业务场景,如地图数据(道路、POI等)、信息流推荐、打车服务等。与产品、工程团队合作,推动技术从研发到上线的全流程落地。 4、前沿技术探索:持续跟踪生成式AI(Generative AI)、跨模态对齐、思维链强化学习、多模态交互、具身智能等最新技术趋势,提出创新性解决方案。

更新于 2025-04-01北京
logo of kuaishou
社招5年以上D7244

1、参与多模态算法的研究和开发; 2、探索基于多模态的内容理解,并应用于风控,视频质量等核心业务中。

更新于 2025-04-10北京
logo of meituan
社招3年以上核心本地商业-点

1.利用计算机视觉和人工智能技术,改进点评笔记、评价等多个点评创作产品的创作体验。 2.参与研发以计算机视觉和人工智能技术为核心的创新型内容玩法。 3.探索MLLM,LLM,VLM等相关算法前沿,应用于业务并解决实际业务问题。 4.负责对业务场景下相关技术问题进行分析、算法设计和上线,全面参与并推动各环节的高效运行,以实现持续的业务价值提升。 5.研究并开发智能Agent系统,优化用户与AI系统的交互体验。

更新于 2025-12-02北京|上海
logo of amap
社招3年以上技术类-算法

负责图像、视频内容理解相关的大模型研发工作,包括但不限于视觉描述生成(Video Caption)、视觉问答(VQA)、多模态大模型(MLLM)等技术,通过内容理解相关算法在业务中的探索与应用,解决实际业务问题;

更新于 2025-09-23北京