快手大语言模型算法工程师
校招全职J1003地点:杭州 | 北京状态:招聘
任职要求
1、在大规模预训练、模型对齐、强化学习、RAG、Agent、对话系统、大模型应用等至少其中一个方向有深厚的项目经验和洞察力; 2、对大模型、NLP、多模态、深度学习等AI领域至少其中一个领域有丰富的知识积累和洞察力; …
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、从事语言大模型、多模态大模型技术建设的研发工作; 2、从事大模型业务应用相关的技术研发工作。
包括英文材料
强化学习+
https://cloud.google.com/discover/what-is-reinforcement-learning?hl=en
Reinforcement learning (RL) is a type of machine learning where an "agent" learns optimal behavior through interaction with its environment.
https://huggingface.co/learn/deep-rl-course/unit0/introduction
This course will teach you about Deep Reinforcement Learning from beginner to expert. It’s completely free and open-source!
https://www.kaggle.com/learn/intro-to-game-ai-and-reinforcement-learning
Build your own video game bots, using classic and cutting-edge algorithms.
RAG+
https://www.youtube.com/watch?v=sVcwVQRHIc8
Learn how to implement RAG (Retrieval Augmented Generation) from scratch, straight from a LangChain software engineer.
AI agent+
https://www.ibm.com/think/ai-agents
Your one-stop resource for gaining in-depth knowledge and hands-on applications of AI agents.
还有更多 •••
相关职位
社招CAI中台技术
1.提升LLM角色扮演、剧情生成等方向的能力,解决profile遵循、剧情多样性和自动化评估等相关技术问题; 2.探索LLM模型的CoT能力,负责在角色扮演、剧情生成等方向上落地; 3.关注LLM业界前沿动态,能够在实际工作中应用落地,并参与撰写技术文档和学术论文,分享和传播技术成果。
更新于 2025-05-06北京
社招
我们正在寻找对大语言模型(Large Language Model,LLM)充满热情的算法工程师,加入我们的核心AI团队。你将参与从模型预训练、微调、推理优化到多场景应用落地的全流程工作,推动LLII技术在对话系统、内容生成、知识推理、具身智能等领域的创新。 1. 探索超大规模模型,并进行极致系统优化; 2. 数据建设、指令微调、偏好对齐、模型优化; 3. 相关应用落地,包括生成创作、逻辑推理、情境对话等; 4. 在未来生活中的更多使用场景的深入研究和探索。
更新于 2025-03-04深圳|上海