阿里巴巴智能算法产品事业部-算法工程师-AIGC多模态方向-AI原生-视觉智能
任职要求
【必备项】 1. 深入理解AIGC核心技术原理,涵盖扩散模型(Stable Diffusion、Flux、Qwen等)、自回归生成及多模态理解等方向,具备图像/视频生成、编辑或多模态相关项目的完整落地经验; 2. 工程实现能力扎实,熟练掌握Python/C++至少一门语言,熟悉PyTorch等主流深度学习框架,具备从算法原型到生产部署的全流程开发能力; 3. 对生成式AI保持…
工作职责
1. 负责多模态与AIGC核心算法的研发与优化,深度推动AIGC技术在视觉智能领域的工程化落地,系统性提升图像、视频等多模态内容的生成质量与语义理解能力; 2. 持续跟踪并深入探索AIGC前沿技术方向,涵盖扩散模型(Stable Diffusion、Flux系列)、自回归生成(AR)及强化学习等核心范式,面向通用场景与垂直领域持续打磨SOTA模型,有效驱动下游业务应用效果提升; 3. 主导推动AIGC技术的产品化创新与规模化落地,重点方向包括智能内容生成工具(图文、视频、广告素材等全链路创作)、基于自然语言指令的通用图像/视频编辑能力,以及多模态内容智能化生产流程的构建与优化。

1. 负责多模态与AIGC核心算法的研发与优化,深度推动AIGC技术在视觉智能领域的工程化落地,系统性提升图像、视频等多模态内容的生成质量与语义理解能力; 2. 持续跟踪并深入探索AIGC前沿技术方向,涵盖扩散模型(Stable Diffusion、Flux系列)、自回归生成(AR)及强化学习等核心范式,面向通用场景与垂直领域持续打磨SOTA模型,有效驱动下游业务应用效果提升; 3. 主导推动AIGC技术的产品化创新与规模化落地,重点方向包括智能内容生成工具(图文、视频、广告素材等全链路创作)、基于自然语言指令的通用图像/视频编辑能力,以及多模态内容智能化生产流程的构建与优化。
-负责多模态大模型中全模态数据(文本、图像、音频、视频等)的采集、处理、采样、配比等全流程数据管线的建设,以及相关的模型结构设计、效果优化,构建适合医疗健康领域的多模态大模型; -研究并实现跨模态信息融合的算法和技术,提升模型在健康内容/服务等场景中的理解和生成能力; -跟踪多模态深度学习的最新研究进展,探索和落地前沿技术(如预训练、自监督学习、小样本学习等); -与产品和工程团队紧密合作,推动多模态技术在搜索、推荐、AIGC等领域的全链路落地应用; -分析和解决在多模态数据处理过程中遇到的技术难题,持续提升模型的智能化水平和商业价值。

加入同花顺证券AI创新事业部,你将参与打造下一代智能证券服务产品。通过AI技术重构投资体验,设计多模态交互的产品,赋能券商数字化升级。在这里,你将从0到1参与AI产品的全生命周期,与顶尖算法工程师、金融专家并肩作战,共同推动证券行业的智能化变革。 岗位职责 1.用户与市场洞察 深度调研C端投资者的需求痛点,分析投资行为数据,定位AI产品创新机会; 面向B端券商机构开展需求调研,设计数字化解决方案,推动券商服务智能化升级; 2.AI产品规划与设计 设计证券场景下的多模态交互产品; 主导AI功能落地,包括券商智能业务办理、券商业务中台等核心模块; 3.跨团队协同与赋能 联动算法团队制定模型优化目标,推动AI能力在证券场景的精准应用; 协同开发团队完成产品敏捷迭代,确保技术方案与用户体验的双重闭环; 4.行业解决方案构建 提炼券商数字化需求,输出标准化AI赋能方案(如智能投顾中台、自动化运营工具); 跟踪金融科技前沿趋势,探索AIGC、大模型在证券服务的创新应用场景。
1、针对具体任务场景(如语音识别、机器翻译、图像理解、文本生成等),开展深度学习模型的算法设计与创新,探索新型神经网络架构(如Transformer、MoE、扩散模型等),提升模型在复杂环境下的准确性、鲁棒性与泛化能力。负责端到端建模优化,结合上下文理解、对话状态追踪或多模态融合技术,增强系统在连续交互场景中的语义理解与响应能力。构建高质量训练数据体系,设计自动化语料清洗、标注与增强方案,覆盖多语言、多方言、噪声或小样本等挑战性场景,支撑模型持续迭代。 2、参与大规模预训练模型(LLM、VL模型等)的研发与微调,包括指令微调、对齐优化、提示工程及推理加速,提升模型在下游任务中的表现。探索大模型在跨模态理解(图文、音视频)、实时生成、知识推理等场景的应用路径,推动AIGC、智能摘要、自动字幕、翻译等业务的技术升级。研发高效微调技术(LoRA、Adapter等)与模型服务架构,实现大模型在资源受限环境下的灵活部署。 3、推动模型轻量化与推理加速,应用模型压缩、量化、蒸馏、剪枝等技术,提升模型在移动端、边缘设备或云端的运行效率。协同工程团队完成算法模块的高性能集成,优化分布式训练与推理框架,保障系统低时延、高并发与稳定性。支持多平台部署(移动端、PC端、Web端、云服务),参与全链路性能调优与监控体系建设。 4、跟踪人工智能领域最新研究进展(CV/NLP/ASR/TTS/MT等),结合业务需求进行技术预研与原型验证。与产品、数据、工程团队紧密协作,深入理解用户场景,推动AI能力在实际产品中的创新应用。