logo of mi

小米大模型算法工程师

社招全职3年以上A215198地点:北京状态:招聘

任职要求


1. 计算机相关专业,三年及以上人工智能算法领域相关工作和项目落地经验;
2. 掌握Python开发语言,具有较高水平的算法基础和工程实现能力;
3. 精通机器学习深度学习、大语言模型基础理论和方法等领域专业知识;
4. 掌握PyTorch、TensorFlow、Megatron、DeepSpeed…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责将大模型技术应用于文本内容生成等业务领域,推动大模型技术匹配及赋能目标业务场景;
2. 负责大模型预训练和微调算法的研发平台搭建,以及大模型预训练和微调语料的处理与维护等;
3. 负责基于大模型算法的开发与优化,包括大模型增量预训练、高效微调、推理优化,解决落地过程中的算法和工程技术难题;
4. 负责追踪学术界和工业界在大模型预训练、微调、强化学习等方向的前沿进展,持续进行模型框架和训练方法的优化迭代;
包括英文材料
算法+
Python+
机器学习+
深度学习+
还有更多 •••
相关职位

logo of baidu
社招3年以上ACG

-负责大模型应用开发平台的算法设计与优化,提升开发者在平台上的体验与应用效率 -研究并应用前沿的深度学习和机器学习算法,推动大模型在实际业务场景中的应用落地,重点关注RAG、Agent、工作流等能力方向 -深入掌握Function Call,代码解释器,Post-training等原理及常用方法 -与产品、工程团队紧密合作,理解业务需求,制定相应的算法解决方案 -持续优化算法的效率和效果,确保平台的高性能和高可用性

更新于 2025-03-27北京
logo of amap
社招3年以上技术类-算法

我们正在寻找对多模态技术充满热情的算法工程师,加入我们的前沿技术研发团队。您将专注于多模态理解与生成,推动其在地图数据、信息流推荐、打车服务等场景中的落地应用,为用户提供更智能、更沉浸的服务。 主要职责 1、多模态模型研发:开发业界领先的图文多模态理解与生成模型,结合扩散模型(Diffusion Models)、Transformer架构等实现高质量场景理解和动态内容生成。 2、模型优化与性能提升:优化多模态模型的推理速度和计算效率,支持端侧部署。探索适合大模型的压缩与加速技术(包括但不限于量化、剪枝、知识蒸馏等)。 3、业务场景落地:将多模态技术应用于实际业务场景,如地图数据(道路、POI等)、信息流推荐、打车服务等。与产品、工程团队合作,推动技术从研发到上线的全流程落地。 4、前沿技术探索:持续跟踪生成式AI(Generative AI)、跨模态对齐、思维链强化学习、多模态交互、具身智能等最新技术趋势,提出创新性解决方案。

更新于 2025-04-01北京
logo of youku
社招

1. 负责解决动漫影视剧preview创作相关问题 2. 负责大语言模型预训练,SFT,RL相关工作

更新于 2025-04-01北京
logo of bytedance
社招A191024

1、负责音乐相关业务的大语言模型的研发和应用,相关研发技术和解决方案在抖音、汽水音乐等产品中应用,满足音乐相关业务场景中的用户不断增长的智能交互需求,全面提升用户在音乐相关的创作和消费场景的体验; 2、参与音乐相关大模型的研发,如音乐预训练、音乐多模态模型等; 3、参与大模型技术在音乐场景中的探索和相关应用落地,如音乐搜推、音乐助手、视频配乐等; 4、在音乐人工智能领域开展前沿研究,在未来生活中的更多音乐相关的使用场景的深入研究和探索。

更新于 2025-03-17北京