理想汽车基座模型-大模型算法实习生-基座模型方向-北京-杭州
任职要求
1. 本科及以上学历,NLP、多模态、计算机等相关专业,关注行业及学界进展; 2. 扎实的算法基础,熟悉自然语言处理、多模态和机器学习技术,对技术探索、开发及应用有热情; 3. 熟悉Python编程语言,熟悉PyTorch深度学习…
工作职责
1. 负责VLA大模型的端/云基座大模型架构设计与优化、多模态融合训练策略优化; 2. 参与预训练、COT、逻辑推理、数据合成等数据建设与质量提升; 3. 负责模型轻量化能力建设,蒸馏、kvcache压缩、稀疏注意力机制设计与优化; 4. 负责基座大模型核心能力建设,逻辑推理与决策能力、代码能力等。
职位描述: 1. 研究通用大模型推理规划数据合成; 2. 研究通用智能体强化学习策略; 3. 研究Agent AI算法,实现L3智能; 4. 总结:大模型推理方向,GPU资源丰富! 我们能提供: 1. 技术沉淀:参与大模型技术研究,培养解决技术难题的能力; 2. 实战经验:参与真实业务场景的落地和上线; 3. 论文产出:发表高水平论文,培养顶会写作能力; 4. 成长支持:Mentor指导,重视成长,和优秀的人做有挑战的事。
职位描述: 1. 大语言模型在工具使用、代码生成、数学等领域的算法研究; 2. 大语言模型在业务场景的落地应用。 职位亮点: 1. 利用大模型解决工业界实际问题,尤其是理想汽车特有的业务场景; 2. 扁平的管理方式和自由的氛围,注重个人提升,做有挑战的工作; 3. 能够接触到充足的GPU资源。
我们是网易云音乐算法团队,专注于行业领先的搜索或者推荐算法,我们致力于通过技术赋能云音乐各项业务,通过社区广场推荐,提升用户体验,产生商业化价值。 在这里你可以: 1、参与云音乐各场景相关的AIGC算法应用,使用NLP、多模态、LLM等技术,优化包括多模态内容理解、大模型交互式对话、大模型AI创作生成等业务应用的效果提升; 2、参与云音乐创新业务相关的算法优化,使用业界领先的深度学习、强化学习、图模型等,优化推荐、直播、声音、社交等业务的算法; 3、参与前沿的基础算法模型建设,包括继续预训练、视频生成微调,音乐生成训练等垂类基座模型的构建和应; 4、接触到亿级别海量、真实的用户数据,使用深度学习、强化学习、图模型等算法,发挥推荐的价值; 5、使用行业领先的大规模分布式机器学习平台,例如tensorflow等开源的工具,实现并不断优化推荐、搜索等算法。
本课题希望探索有效的统一大模型基座方案及提升多场景联合预训练的效果。目前公司内部不同业务场景下存在多套Embedding&标签大模型,部署成本较高,且应用在下游端到端建模任务如序列推荐时也多有不便,希望在多场景下对多套不同的Embedding&标签做整合,共用一套统一的基座模型,降低部署成本。同时通过融合的方式,对多场景数据进行综合建模,提升多场景的Embedding&标签效果。 统一基座模型需要解决的核心技术难点包括: 1、基座统一但仍可支持业务的定制微调,且训练成本和推理成本较低; 2、多体裁内容(如笔记、直播、商品、Query等)的理解可以融合在一个统一模型,且效果比独立训练更好。 研究方向会针对要解决的问题设立,包括:基于多Head或MoE的轻量化微调及融合推理、多体裁内容形式的统一建模。