小红书NLP通用基础大模型资深算法工程师
社招全职内容理解地点:北京 | 上海 | 广州状态:招聘
任职要求
1.良好的 pytorch / python 技术栈,具备熟练的阅读代码和编写代码的能力。熟练使用 ChatGPT 等工具提升自己工作效率会有所加分。 2.精通至少 1 个 Deep Learning 任务,并深入一线研发超过 2 年、或达到业界 SOTA 水平、或支撑过 Web Scale 的业务规模 3.对 SOTA 的大模型技术有深入了解(不管是来自实践还是其他),能够问出好的问题,并对至少一个重要问题有非共识理解 4.科学的研发习惯;具备良好的问题定义能力;对细节敏感;独立思考;
工作职责
在算力驱动的 AGI 和人文精神的烟火气交汇之处,我们真诚邀请对 AI 技术有信仰的同学加入,共同打造更具影响力的智能系统。你会成为团队的一员,并和其他同事协作,共同研发 SOTA 的智能技术。期待你以务实和客观的科学态度来推进技术的进展,不被过往经验裹挟、不被主观偏好影响。期待你除了算法外仍然是为出色的工程师。期待你对技术有强烈的好奇心和开放心态,以未来几年 AI 技术的质变突破为目标。 岗位说明:你会负责下述至少一件事情 1.海量数据的处理:定性分析、定量评估数据质量,并给出 scalable 的改进方案,对数据采集和处理流程不断提出新的要求和改进方案。 2.模型的改进:在 Large Scale 上迭代并改进模型使其更加的高效(capacity per flops / improvement per flops),或者提升模型的 scale up 后的稳定性 3.研究并改进 Scale Law,随着模型的变化给出 Large Scale 上的技术选择(例如参数/数据比、不同超参数设置等) 4.多模态:研发多种模态作为输入/输出的 Large Scale 模型
包括英文材料
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
Web+
https://web.dev/learn
Explore our growing collection of courses on key web design and development subjects.
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
相关职位
校招大模型
1、定性分析、定量评估数据质量,并给出 scalable 的改进方案,对数据采集和处理流程不断提出新的要求和改进方案; 2、在 Large Scale 上迭代并改进模型使其更加的高效(capacity per flops / improvement per flops),或者提升模型的 scale up 后的稳定性; 3、研究并改进 Scale Law,随着模型的变化给出 Large Scale 上的技术选择(例如参数/数据比、不同超参数设置等); 4、研发多种模态作为输入/输出的 Large Scale 模型。
社招A50228
1、负责对客服、角色化对话机器人算法方向的通用NLP基础能力建设,包括但不限于数据建设、模型训练推理框架迭代、维护模型评估指标体系、建设通用NLP模型; 2、支持LLM、MLLM方向的新技术研究和落地应用,支持指令微调、强化学习相关算法需求; 3、建设基于LLM/MLLM技术的新一代的智能客服机器人,探索建设数字人技术在抖音落地应用。
更新于 2025-06-13
社招A144849
负责抖音对话机器人场景中NLP技术的研发与应用,研究包括传统NLP技术、LLM技术在聊天机器人领域基础技术支持和落地应用。主要工作方向包括: 1、负责对客服、角色化对话机器人算法方向的通用NLP基础能力建设,包括但不限于数据建设、模型训练推理框架迭代、维护模型评估指标体系、建设通用NLP模型; 2、支持LLM、MLLM方向的新技术研究和落地应用,支持指令微调、强化学习相关算法需求; 3、建设基于LLM/MLLM技术的新一代的智能客服机器人,探索建设数字人技术在抖音落地应用。
更新于 2023-12-25