小红书多模态通用基础大模型资深算法工程师
任职要求
1.良好的 pytorch / python 技术栈,具备熟练的阅读代码和编写代码的能力。 2.在多模态的研发有深入和一线的实践经验,具备有深度的理解和认知; 3.科学的研发习惯;具备良好的问题定义能力;对细节敏感;
工作职责
在算力驱动的 AGI 和人文精神的烟火气交汇之处,我们真诚邀请对 AI 技术有信仰的同学加入,共同打造更具影响力的智能系统。你会成为团队的一员,并和其他同事协作,共同研发 SOTA 的智能技术。期待你以务实和客观的科学态度来推进技术的进展,不被过往经验裹挟、不被主观偏好影响。期待你除了算法外仍然是为出色的工程师。期待你对技术有强烈的好奇心和开放心态,以未来几年 AI 技术的质变突破为目标。 岗位说明:你会负责下述至少一件事情 1.海量的多模态数据处理:定性分析、定量评估数据质量,并给出 scalable 的改进方案,协助搭建多模态的数据流程; 2.搭建多模态的模型架构,在多种技术方案中找到 trade off 的关键,搭建更高效且可扩展的模型框架 3.研究并改进多模态模型的 Scale Law,随着模型的变化给出 Large Scale 上的技术选择(例如参数/数据比、不同超参数设置等)
在算力驱动的 AGI 和人文精神的烟火气交汇之处,我们真诚邀请对 AI 技术有信仰的同学加入,共同打造更具影响力的智能系统。你会成为团队的一员,并和其他同事协作,共同研发 SOTA 的智能技术。期待你以务实和客观的科学态度来推进技术的进展,不被过往经验裹挟、不被主观偏好影响。期待你除了算法外仍然是为出色的工程师。期待你对技术有强烈的好奇心和开放心态,以未来几年 AI 技术的质变突破为目标。 岗位说明:你会负责下述至少一件事情 1.海量数据的处理:定性分析、定量评估数据质量,并给出 scalable 的改进方案,对数据采集和处理流程不断提出新的要求和改进方案。 2.模型的改进:在 Large Scale 上迭代并改进模型使其更加的高效(capacity per flops / improvement per flops),或者提升模型的 scale up 后的稳定性 3.研究并改进 Scale Law,随着模型的变化给出 Large Scale 上的技术选择(例如参数/数据比、不同超参数设置等) 4.多模态:研发多种模态作为输入/输出的 Large Scale 模型
1、定性分析、定量评估数据质量,并给出 scalable 的改进方案,协助搭建多模态的数据流程; 2、搭建多模态的模型架构,在多种技术方案中找到 trade off 的关键,搭建更高效且可扩展的模型框架; 3、研究并改进多模态模型的 Scale Law,随着模型的变化给出 Large Scale 上的技术选择(例如参数/数据比、不同超参数设置等)。
1、构建大规模的医学影像、病理图像、人体表观数据、饮食图片、医学报告、生理信号及相关文本数据库; 2、研发超千亿参数医学多模态通用大模型; 3、在多个下游任务收集少量数据微调,实现低成本迁移。
多模态交互团队是蚂蚁基础智能部门专注于最前沿多模态交互大模型研究的团队 1. 研究多模态模型预训练新范式,突破多模态对齐、跨模态推理、多模态数据挖掘和合成、效果评测等关键技术难题; 2. 打造行业领先的算法能力:如视频问答、音视频交互等; 3. 探索视觉理解大模型与音视频交互大模型技术的深度融合路径,构建支持图像、视频、语音多模态理解的通用大模型架构和大规模训练; 4. 支持音视频交互推理加速框架建设,构建完善的音视频交互大模型数据链路,探索和细化不同的音视频交互模型的评估维度、方法和指标,落地评估系统,支撑基础大模型迭代和上线; 5. 关注多模态/NLP/语音等方向的前沿技术,及时将新技术应用到产品中。