logo of alibaba

阿里巴巴企业智能事业部-大模型多模态算法工程师-杭州

社招全职2年以上技术类-算法地点:杭州状态:招聘

任职要求


1、扎实的算法功底: 精通深度学习框架(PyTorch/TensorFlow),在计算机视觉(CV)、自然语言处理NLP)或图形学(CG)领域有深厚积累,熟悉Transformer、Diffusion Models、GNN、MAE等主流架构。
2、行业实战经验: 具有2年及以上智能设计、OCR、版面分析或生成式AI相关领域的工作经验,能够独立主导核心算法模块的研发与迭代。
3、深度逻辑能力: 对版面空间关系、排版美学、语义结构有敏锐的洞察力,具备解决复杂结构化数据的能力。
4、编程与工程化: 具备极强的代码落地能力,熟悉Python/C++,对算法效率、内存优化有深刻理解。

【加分项】—— 优先考…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


作为核心成员参与到阿里巴巴智能设计、智能文档相关的业务,通过应用LLM与业务深度结合,打造自动化的智能文档技术(版面理解、要素抽取),以及打造智能设计(设计稿评分、设计稿组建理解、NL2Layout等)
1、核心算法研发: 负责智能设计与文档理解(Document Intelligence)领域的前沿算法研发,包括但不限于版面分析(Layout Analysis)、表格理解、元素对齐与美学评估、多模态图文融合生成等。
2、智能设计系统搭建: 研发自动化排版、智能海报生成、UI/UX自动化设计、PPT/文档自动美化等核心引擎。
3、版面理解与重构: 攻克复杂版面下的OCR识别、结构化解析、阅读顺序还原等技术难点,实现文档从像素级到语义级的深度转化。
4、前沿技术转化: 跟踪CVPR、ICCV、ECCV、NeurIPS、SIGGRAPH等顶会最新研究,将SOTA模型转化为可落地的产品原型,保持公司在智能办公/智能设计领域的领先地位。
5、工程优化: 负责模型在端云侧的部署优化,提升大规模文档处理的效率与鲁棒性。
包括英文材料
算法+
深度学习+
PyTorch+
TensorFlow+
OpenCV+
NLP+
Transformer+
GNN+
OCR+
Python+
还有更多 •••