快手(大模型专项)AI大模型对话专家/工程师
任职要求
1、硕士以上学历,计算机相关专业,领域相关优秀学校优先; 2、基础数据结构与代码能力扎实,熟悉机器学习和深度学习的基础知识和常用框架; 3、有NLP与…
工作职责
近日,大模型相关技术呈现出爆发式发展,AI技术正在成为新一轮革命的焦点,可以预见会对广泛的社会生产力和用户消费体验带来深远的影响。作为全球领先的短视频和直播平台,快手AI团队在多媒体AI领域有多年的技术和应用积累。大模型、AIGC等AI技术作为公司发展的关键技术方向,将长期重点投入,保障相关技术创新的突破及业务落地。 1、LLM模型应用落地:参与LLM在公司内部的应用,探索LLM的创新落地场景; 2、算法研究与开发: 参与大模型相关算法研究与开发工作,提升模型性能和算法效率,关注并跟进学术界的最新进展; 3、技术优化与创新: 持续优化现有的算法技术,推动算法创新,不断业务效果和用户体验; 4、跨团队合作: 与产品团队、工程团队和业务团队紧密合作,理解业务需求,将算法技术转化为实际的产品和解决方案; 5、算法评估与改进: 负责对算法模型进行评估和改进,提高算法的准确性、效率和可解释性。
岗位职责: 该职位通过大模型训练、Agent、RAG、N2SQL、NLP、语音处理等技术创新和突破,构建Agent通用平台、大模型训练平台等工具产品,同时支持对话机器人等垂直应用及智能产品的建设。欢迎敢于接受挑战的候选人加入我们,一起赋能企业客户。我们的研究方向包括但不限于: 1、通用大模型、推理大模型预训练、微调、强化对齐等技术的持续研究创新; 2、多语言大模型、领域大模型的训练技术研究与落地; 3、AI数据清洗、加工、合成、自动标注技术研究与落地; 4、文本机器人、语音机器人、质检机器人等客服域技术的研发与落地; 5、多Agent、RAG、N2SQL、自主决策等技术的研究与落地; 6、入呼大模型机器人、外呼大模型机器人研发经验;熟悉VAD, ASR, TTS等语音相关技术; 以上方向擅长其中1个即可
关于我们 我们致力于把大模型 Agent 打造成“能解决业务问题的生产力系统”:不仅会对话,更能规划、推理、调用工具、洞察数据,在多个业务场景形成端到端闭环。团队长期坚持“学术先进性 + 工程可落地 + 指标可验证”三位一体,推动多项技术在真实业务中规模化应用,并持续输出可复用的训练与评测体系。 你将获得什么 ● 覆盖多模型、多尺寸的系统化训练能力:团队训练资源充足,能在不同架构/不同规模模型上完成微调、对齐与能力专项提升,并形成可复用的训练范式。 ● 论文级问题 + 业务级验证:我们鼓励你做可发表的创新,同时确保每个方向都能进入线上评测与业务闭环,真正做到 有创新、有落地、有收益。 ● 完整的 Agent RL 研发舞台:从环境构建、Reward 设计、策略优化到自动评估工具链,你将能主导一条完整的 RL-Driven Agent 能力演进路径。 ● 个人影响力与成长:支持对外分享、论文/专利沉淀与跨团队共建 岗位职责 1、主导基于大模型的 AI Agent 全生命周期研发,包括通用型及垂直领域 AI Agent 的应用架构设计、数据构建、模型训练与评测; 2、运用 SFT、RL 等 Post-training 训练方法,提升大模型在自主规划(Planning)、多步推理、RAG 增强生成、工具调用、数据问答等方面的能力; 3、构建 Agent RL 所需的环境与训练方法,设计合理的 Reward Function 和优化函数,激发模型在垂直领域内的泛化性,探索无/少人类专家样本依赖的 Agent 优化方案; 4、跟踪 LLM 与 Agent 领域的国际前沿技术动态,推动技术创新在业务场景中的落地应用,重点突破工具集成复杂推理、数据洞察、AI 搜索等方向的应用创新; 5、持续优化 Agent 算法与系统架构,构建端到端智能体评测体系,开发自动化评估工具与多维评价指标,提升系统性能与效率。
ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:AI数据与安全团队为Seed基座模型及AI原生应用提供跨模态数据服务,覆盖数据生产全流程,包含模型评估标准的制定、数据规模化生产、数据飞轮搭建,不断提升数据质量,支持模型快速迭代。 团队由产品经理、数据工程、数据运营等跨职能人才组成,并通过与Seed研究员、行业专家、全球顶尖数据供应商紧密合作,从真实场景中收集反馈并分析模型表现数据,解决AI前沿突破过程中的复杂数据问题,推动模型性能与用户体验的双重提升。我们既是帮助模型技术迭代的一线贡献者,也是模型和AI产品的一手用户。 1、深入理解AI大模型视频通话场景,负责多模态对话、联网、Function Call等方向的数据采集、标注、质检与策略运营工作; 2、与产品研发团队紧密配合,快速沉淀多模态大模型数据理想态和标准,积极为模型后训提供数据策略和建议; 3、针对模型突出问题进行专项攻坚,通过设计PE策略、Workflow工作流等,探索更高效的数据生产方式。
我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 1、参与设计实现支持RLHF/DPO等对齐技术的高效训练框架,优化强化学习阶段的Rollout、Reward Model集成、多阶段训练 Pipline; 2、研发支持多机多卡 RL 的分布式训练框架,开发TP/PP/ZeRO-3与RL流程的动态协同机制,解决 RL 算法在超长时序下的显存/通信瓶刭 3、构建端到端后训练工具链,主导框架与 MLOps 平台集成,提供训练可视化、自动超参搜索等生产级能力 4、与公司各算法部门深度合作,参与大语言模型LLM、多模态大模型 MLLM等业务在 SFT/RL领域的算法探索和引擎迭代; 5、参与分析各业务 GPU 利用率与饱和度等指标,结合业务场景持续优化训练框架能力,提升框架领先性。