快手AI美学工程师(可灵AI专项)
任职要求
1、熟练掌握生成式AI工具,能独立设计工作流、复杂提示词并调节参数;能使用python编程,能使用AI工具实现简单的图像处理算法或自动化提效工具; 2、有良好的沟通能力,能与产品、运营团队协作,快速验证需求并推动落地; 3、数字媒体艺术、影视相关专业毕业,或对影视作品、商业拍摄较为熟悉; 4、有剪辑经验,对影视作品剪辑较为熟悉,熟练使用PR、达芬奇、AE等软件; 5、有摄影经验,对相机镜头等硬件选择、拍摄镜头语言构成和应用、各类经典和流行摄影风格较为熟悉; 6、有灯光布景经验,对室内室外、自然人工光效的组合搭配、各类经典和流行色彩光照模式较为熟悉;有服化道经验,对各类服饰、装造风格、道具搭配较为熟悉; 7、有艺术、影视相关理论积累,对影视史、艺术史、绘画史较为熟悉,能准确区分作品的流派、风格、特点等。 加分项: 1、能敏锐地感知流行元素变化,如某个圈子,如动漫、影视最新的审美趋势、出圈内容等; 2、 "任职要求"中满足越多条目越好。
工作职责
1、使用各类主、客观方法对视频/图片数据进行处理,制定数据处理标准和规范,处理范围包括不限于基础质量、摄影、艺术、设计等专业层级; 2、使用SD、MJ、DS、GPT等开源、商业生成式AI模型,ComfyUI等AI工具,满足业务需求,包括不限于搭建通用工作流、编写提示词模板、调整模型超参数等。
1、参与智能创作Agent核心系统的研发与迭代,学习如何融合多模态理解、交互与生成能力,探索AI在内容创作中的应用场景; 2、协助搭建创作领域的多模态认知体系,结合行业知识库,理解镜头美学、剪辑节奏、叙事逻辑等要素,支持图片/视频/音乐生成模型的优化与应用; 3、参与大模型后训练相关探索(如SFT、RLHF 等),通过高质量数据合成、指令设计、偏好对齐等方法,提升Agent的长推理和复杂规划能力; 4、参与Agent相关核心模块的开发与实验,包括任务编排、工具调用、多Agent协作、长期记忆和个性化能力探索。
1. 负责集团服务体系业务研发,包括售后、客服、仓储、物流相关系统 2. 构建大前端开发生态,包括但不限于跨端开发、组件化、AI、3D、通用组件库、低代码平台等方案落地 3. 持续优化现有大前端技术体系,积累和分享最佳开发实践
1. 牵引AIGC产品的生成效果调优,基于用户反馈与数据洞察对AI模型进行美术维度的效果升级,攻克"生成质量与视觉表现力"的难点。 2. 深度参与算法模型迭代,运用comfyUI等工具和扩散模型等技术原理,开发提升图像生成可控性的解决方案(如Prompt工程优化、LoRA模型和工作流微调等)。 3. 搭建AIGC美术资产评估体系,建立从构图美学到商业转化的多维评价标准,通过精细化参数调试驱动内容生成质量跃迁。 4. 打造爆款内容供给和趋势分析bot,结合多模态数据分析挖掘爆款内容规律,为AIGC工具链提供数据驱动的效果优化策略。
T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 在这里,你将参与贡献大型电商场景下与音视频体验和成本相关的一系列研发工作; 在这里,你将参与视频编码(包括但不限于HEVC/VVC)优化:通过基于信号处理和机器学习的快速编码决策、数据结构、并行框架设计,优化编码速度,同时在有竞争力的视频编码内核基础上,探索基于语义的内容感知编码优化,深度学习编码,AIGC编码等前沿课题,在保障画质体验的前提下,尽可能节省带宽; 在这里,你将参与海量图像和视频的增强修复工作:运用前沿技术,包括但不限于模型结构优化、数据仿真和增强策略优化、知识蒸馏以及模型压缩,在限定带宽环境对任意失真的视频进行高效处理,力求最好的画质。同时,跟踪业界最新进展和技术趋势(包括AIGC)并融入特定的场景,提出创新方案,帮助平台提供逼近广电级别的视频画质; 在这里,你将参与视频编码与处理联合优化:在标准编码框架的基础上,借助AI领域的新技术成果来研究视频信号的表征、编码与处理,将视频前后处理与编码联合优化,提升端到端压缩效果; 在这里,你将参与美颜等视频美化技术的研究工作,包括人脸检测、关键点、肤色美白、面部塑形、化妆效果模拟等。这些技术将应用于直播和短视频等多样化场景,并确保其在真实视频场景的有效整合。你还将专注于基于3D人脸建模和AI算法的智能美颜技术,推动这些技术的大规模落地; 在这里,你将参与UGC视频生产剪辑依赖的多类当下最前沿的图像视频生成与编辑,包括图像风格化,人像分割与实例分割,人脸属性,图像可控生成,图像视频化等,为视频剪辑提供更丰富的素材和更多的玩法; 在这里,你将有机会参与最前沿的音视频质量评价算法工作,包括无参考的视频质量评价,人脸美学评价,音频质量评价,为多媒体算法的迭代和平台音画质的体验提供基础工具; 在这里,你将帮助淘宝直播等大型的视频传输场景设计QoS算法,追求超低延时、极速播放等用户体验,并支持各种弱网环境下的最优的视频流畅度和优雅的画质降级。 T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper ꔷ 投递T-Star实习生,提前解锁淘天顶级技术岗位,实习与T-Star正式批/应届秋招投递不冲突。拿到T-Star意向书的同时,将获得直通正式批次终面的机会;参与T-Star实习且表现优秀的同学,提供T-Star转正Offer。