logo of alibaba

阿里巴巴1688-3D AIGC 算法工程师 / 算法专家 (Text/2D-to-3D 生成方向)-杭州

社招全职2年以上地点:杭州状态:招聘

任职要求


‒ 计算机科学、人工智能、计算机图形学等相关专业硕士及以上学历。
‒ 精通PyTorch/TensorFlow,具备出色AI模型工程能力;熟悉大规模分布式训练框架者优先。
‒ 深入理解一种或多种3D表征(如NeRF, SDF, Mesh, Voxel, Point Cloud),并熟悉Diffusion Model, GANs等主流生成模型原…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


ꔷ 模型选型与评测:负责跟踪和深度评测业界前沿的Text/Image-to-3D模型(如混元、VAST、Meshy等),建立“文玩”品类的评测基准(Benchmark),从质量、速度、成本、可塑性等多维度输出评估报告,并参与制定技术共建方案。
ꔷ 训练框架搭建:主导或参与自建3D AIGC训练框架,实现SFT(监督微调)、PO(偏好优化)、RLHF以及模型蒸馏等全套“后训练”链路。
ꔷ 模型SFT与强化:深入“文玩”业务场景,构建高质量SFT数据集(如品类黑话、风格化),对底座模型进行微调,使其更懂品类。
ꔷ 可打印性优化:探索使用PO/RLHF技术,构建“高可打印性”偏好数据集,训练AIGC模型使其倾向于生成结构稳定、易于修复、符合制造标准的3D模型,构建核心数据与模型壁垒。
ꔷ 模型优化与部署: 负责3D生成模型的轻量化、蒸馏和加速,优化推理速度和成本,满足平台规模化应用需求。
包括英文材料
学历+
PyTorch+
TensorFlow+
AIGC+
SFT+
还有更多 •••
相关职位

logo of alibaba
社招2年以上

ꔷ Mesh修复与优化:负责“Mesh自动化修复引擎”的研发,解决AIGC模型输出的网格破洞、非流形、漂浮件、法线错误、噪点等问题,实现高质量的水密(Watertight)网格输出和自动化重拓扑(Retopology)。 ꔷ 可制造性分析: 研发3D模型可制造性(3D打印)智能分析算法,自动检测薄壁、悬垂角度、过小细节、打印风险等,并输出分析报告与修复建议。 ꔷ AI参数化基座生成:攻坚“AI参数化基座生成器”V1至V2。研发算法智能分析主体Mesh的姿态、尺寸和接口特征,自动从CAD标准库中匹配、生成并融合参数化基座(如吊坠扣、戒指圈、印章底座),解决Mesh与CAD的“最后一公里”融合难题。 ꔷ 智能支撑生成:针对SLA/DLP等高精度打印工艺,开发智能支撑生成算法,实现支撑结构的最优化(易拆卸、少接触面、省材料)。 ꔷ 几何算法库构建:负责几何处理相关算法库的搭建、性能优化与维护。

更新于 2025-11-17杭州
logo of vivo
社招5年以上研发类

1. 负责手机Camera相关图像影调算法的研发与应用; 2. 负责影调/光影相关算法的设计, 实现及移植, 使得算法在Camera中落地。

上海|杭州
logo of bytedance
社招TVVV

1、负责3D能力与图像/视频生成结合的算法研发与优化,跟进三维视觉领域的前沿技术研究; 2、支持字节跳动各个产品线3D相关的业务需求; 3、跟进生成领域的新技术; 4、负责推动3D能力与视频生成相关技术落地于特效、视频编辑、商业化等领域的应用; 5、根据团队的整体目标和规划,进行相关的研发工作。

更新于 2021-12-07杭州
logo of amap
社招3年以上技术类-算法

团队介绍: 高德地图机器学习研发部是公司AI核心技术引擎,聚焦多模态大模型、视频生成与理解、图像编辑与生成等前沿领域。团队深耕人工智能技术落地,支撑亿级用户产品,同时长期投入前沿探索,在NeurIPS/ICLR/CVPR/ACL等顶会发表多篇论文,多项成果入选“最有影响力论文”榜单。我们拥有海量数据与算力资源,鼓励创新突破,诚邀你与顶尖算法专家并肩,共同定义AI的未来!如果你渴望挑战多模态与生成式AI的技术巅峰,在视频、图像、大模型的交叉领域实现突破,欢迎加入我们!团队的github页面是:https://github.com/AMAP-ML/ 我们提供 • 参与亿级用户产品的AI核心算法研发,见证技术直接赋能业务; • 与学术大牛和工业界专家共事,持续提升技术视野; • 顶配算力资源+开放创新氛围,支持前沿探索与顶会论文发表。 具体职责包括但不限于: 1. 视频生成:负责视频生成技术的前沿技术的研究,对AIGC的diffusion和auto-regressive技术有深入了解,在T2I/AIGCT2V/I2V上面有一定的研究,图文对齐,长视频生成等有一定的研究,做好视频生成在高德业务(广告,POI详情页等)中的进行落地。 2. 视频理解:能够使用和优化多模态大模型对用户上传的视频进行质量理解,标签,densecaption,视频summary等生成,作用到视频的搜索,广告,推荐等业务的落地。 3. 世界模型: 参与世界模型的构建,能够使用最新的视频生成技术,3D技术等构建符合人类物理规律的统一的世界模型,在高德的业务进行落地。 4. 紧跟技术前沿和技术沉淀,形成顶会论文和专利。

更新于 2025-11-28北京