logo of kuaishou

快手语言大模型算法工程师/技术专家(Klear)

社招全职3-5年J0011地点:北京状态:招聘

任职要求


1、在大规模预训练、模型对齐、强化学习、RAG、Agent、对话系统、大模型应用等至少其中一个方向有深厚的项目经验和洞察力;
2、对大模型NLP、多模态、深度学习等AI领域至少其中一个领域有丰富的知识…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、 负责语言大模型(Large Language Model)的技术研究,包括但不限于Pretrain、SFT、RL等技术相关的算法研发、数据策略和合成、Infra策略优化等,以及相关的基础技术探索和创新等;
2、负责基础Pretrain模型、Instruct模型、推理模型等系列大模型的技术研发;
3、持续跟进并深入调研大模型前沿技术、开源方案,跟踪业内语言模型领域的最新进展并推进相关研究,打造业界影响力。
包括英文材料
强化学习+
大模型+
NLP+
还有更多 •••
相关职位

logo of antgroup
社招3年以上技术类-算法

1.我们正在寻找充满激情和经验丰富的大模型 AI 工程师/技术专家,加入我们行业领先的基础模型团队(Ling Team)。您将从基础设施的视角出发,深入参与大语言模型(LLM)的研发过程,与算法研究员紧密合作,共同负责并推动算法与工程的协同设计(Co-design)及优化。 在这个职位上,您将有机会解决大规模分布式训练和推理中的前沿挑战,通过极致的性能优化,将硬件潜力发挥到极限,为我们基础模型的迭代和业务落地提供坚实的算力基座和工程保障。 2.岗位职责: 你将从基础设施的视角,参与到新一代基座模型研发中,包括但不限于以下工作: -算法与工程协同设计: 参与scaling law 和 新模型架构的迭代设计,提供专家级工程实现方案,确保新模型架构的可实现性、高效性及可扩展性。 -训练与推理系统优化:基于特定模型架构,系统性分析并优化训练/推理框架性能,识别并解决大规模集群环境下的关键性能瓶颈。 -高性能并行与算子优化:研发高效精细的分布式并行策略(如张量、流水线、序列并行等),并针对核心算子进行定制化优化,充分释放硬件计算潜能。 -前沿技术探索与落地: 跟踪并引入业界最新的 AI 基础设施技术,包括但不限于编译优化、新型硬件架构等,并将其应用于实际的大模型研发中。

更新于 2026-02-02上海|杭州
logo of amap
社招5年以上技术类-开发

● 参与/负责大数据业务的工程研发工作,包括算法工程化、数据加工、服务开发、SaaS 平台建设、解决方案交付等; ● 深度参与技术方案设计和迭代,包括架构升级、性能优化、代码重构、监控体系建设等;

更新于 2025-08-04北京
logo of baidu
社招ACG

-负责多模态数据解析、知识加工、RAG等算法的实现,针对落地场景中遇到的实际问题进行算法改进与效果提升 -负责大模型(语言模型、多模态模型、CV大模型等)后预训练/微调/对齐等场景的数据工程;根据项目需求,研发训练数据处理的算子和Pipeline,以用于模型的训练和效果验证 -作为大模型技术专家,为ToB企业提供大模型服务,尤其是与数据相关的行业know-how -对前沿技术和需求敏锐洞察,通过技术创新推动产品成长

更新于 2025-02-19北京
logo of antgroup
社招技术类-算法

我们正在寻找一位充满激情的多模态算法专家,加入我们的前沿AI团队。你将专注于构建和训练先进的视觉语言大模型(Multimodal Large Models),推动技术在图像/视频内容理解与生成领域的创新。 【职位描述】 1.核心研发:负责视觉语言大模型的核心算法研发,主攻图像/视频描述生成 (Image/Video Captioning)、视觉问答 (VQA) 等关键任务。 2.模型训练:主导或深度参与多模态大模型的完整训练流程,包括数据构建、模型架构设计(如 Vision Encoder + LLM)、预训练与指令微调 (Instruction-Tuning)。 3.技术落地:负责模型性能的评估、优化与迭代,探索量化、蒸馏等技术,并推动模型在实际业务场景中的部署与应用。

更新于 2025-06-27杭州