logo of mihoyo

米哈游【日常实习】生成式算法研究员(自回归模型方向)

实习兼职程序&技术类地点:上海状态:招聘

任职要求


1. 计算机科学、数学或相关领域的硕/博在读;
2. 熟练掌握 VAE,GPT,Diffusion 等生成模型原理,有模型调优经验;
3. 关注行业前沿进展,了解最新的 auto-regressive 领域进展,有自己的想法并乐于挑战;

加分项
1. 对动画、游戏、和AIGC技术有热爱的优先。
2. 有LLM、视频生成、音频生成、动作生成等领域经验者优先
3. 在NeurIPS/ICML/CVPR等发表过生成模型相关论文者优先;

工作职责


探索 auto-regressive 生成模型,在时序生成任务下的表现,包括但不限于视频生成、音频生成、动作生成;
包括英文材料
GPT+
大模型+
NeurIPS+
ICML+
CVPR+
相关职位

logo of mihoyo
实习程序&技术类

专注于AudioLLM通用音频理解模型的研究与开发,参与构建下一代音频基础模型和Omni多模态框架,探索语音、音乐、环境声音等多模态音频内容的统一理解建模方法,推动 audio AI 在理解、生成和交互场景中的技术突破。 核心职责: 1. 模型架构与训练:负责通用音频理解模型设计与分布式训练优化,实现语音识别、情感分析、音频问答、音乐理解、声音事件检测等多任务统一建模 2. 数据管线:设计并落地大规模多模态音频数据 pipeline,完成数据对齐、质量控制与自动标注 3. 跨模态融合:研究音频编码器与大语言模型融合技术,优化跨模态注意力与统一特征表示

logo of bytedance
实习A222977

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:字节跳动开发者服务团队主要负责公司研发工具体系建设,为开发者提供全技术栈框架、工具和研发体系等基础设施。团队目前在服务端、移动端、Web、桌面端均有深入研究,致力于提供公司全产品线工程效能、可观察性以及各终端技术与框架的基础设施建设。团队还在探索前沿AI技术在工程生产力上的落地与应用,探索研发体系与领域模型的深度融合,实现开发者服务的升级与创新。期待对研发工具体系有兴趣、对技术有追求的同学加入,共同成长! 1、参与开发者服务型产品建设和算法研究工作;实习内容涉及大模型相关的Prompt、微调、智能体、RAG等方向探索、智能运维、数据工程、AI评测等; 2、持续跟进LLM前沿技术,为团队提供前沿的知识和见解,支持模型效果的研发落地和持续优化。

更新于 2024-12-24
logo of bytedance
实习A76246A

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:字节跳动开发者服务团队主要负责公司研发工具体系建设,为开发者提供全技术栈框架、工具和研发体系等基础设施。团队目前在服务端、移动端、Web、桌面端均有深入研究,致力于提供公司全产品线工程效能、可观察性以及各终端技术与框架的基础设施建设。团队还在探索前沿AI技术在工程生产力上的落地与应用,探索研发体系与领域模型的深度融合,实现开发者服务的升级与创新。期待对研发工具体系有兴趣、对技术有追求的同学加入,共同成长! 1、参与开发者服务型产品建设和算法研究工作;实习内容涉及大模型相关的Prompt、微调、智能体、RAG等方向探索、智能运维、数据工程、AI评测等; 2、持续跟进LLM前沿技术,为团队提供前沿的知识和见解,支持模型效果的研发落地和持续优化。

更新于 2024-11-05
logo of bytedance
实习A107006A

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:字节跳动开发者服务团队主要负责公司研发工具体系建设,为开发者提供全技术栈框架、工具和研发体系等基础设施。团队目前在服务端、移动端、Web、桌面端均有深入研究,致力于提供公司全产品线工程效能、可观察性以及各终端技术与框架的基础设施建设。团队还在探索前沿AI技术在工程生产力上的落地与应用,探索研发体系与领域模型的深度融合,实现开发者服务的升级与创新。期待对研发工具体系有兴趣、对技术有追求的同学加入,共同成长! 1、参与开发者服务型产品建设和算法研究工作;实习内容涉及大模型相关的Prompt、微调、智能体、RAG等方向探索、智能运维、数据工程、AI评测等; 2、持续跟进LLM前沿技术,为团队提供前沿的知识和见解,支持模型效果的研发落地和持续优化。

更新于 2024-12-24