小红书预训练算法工程师
社招全职大模型地点:北京状态:招聘
任职要求
对大模型方向充满兴趣,且能充分意识到数据对于模型能力的重要价值和数据侧的巨大空间
有很好的数据感觉,对人类文明积累下来的…登录查看完整任职要求
微信扫码,1秒登录
工作职责
建立文本和多模态数据源、数据格式解析(网页,PDF等)、数据策略、模型能力、下游任务的全链路归因能力 建立并持续完善的数据质量、多样性、重复度、覆盖率等评估体系,分析和量化每个维度的影响 针对模型核心能力进行重点强化,包括不限于数学、推理、Code、Agent、ICL、OCR等 探索如何使用更少数据量,达到同样模型能力的策略,持续提升per token的通用能力训练效果 探索基于各类策略的高质量数据生成方式,定向优化特定模型能力和为长期Scaling Law解决数据缺失问题
包括英文材料
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
还有更多 •••
相关职位
社招1-3年大模型
1、建立文本和多模态数据源、数据格式解析(网页,PDF等)、数据策略、模型能力、下游任务的全链路归因能力 2、建立并持续完善的数据质量、多样性、重复度、覆盖率等评估体系,分析和量化每个维度的影响 3、针对模型核心能力进行重点强化,包括不限于数学、推理、Code、Agent、ICL、OCR等 4、探索如何使用更少数据量,达到同样模型能力的策略,持续提升per token的通用能力训练效果 5、探索基于各类策略的高质量数据生成方式,定向优化特定模型能力和为长期Scaling Law解决数据缺失问题
更新于 2025-09-15北京|上海
社招大模型
建立文本和多模态数据源、数据格式解析(网页,PDF等)、数据策略、模型能力、下游任务的全链路归因能力 建立并持续完善的数据质量、多样性、重复度、覆盖率等评估体系,分析和量化每个维度的影响 针对模型核心能力进行重点强化,包括不限于数学、推理、Code、Agent、ICL、OCR等 探索如何使用更少数据量,达到同样模型能力的策略,持续提升per token的通用能力训练效果 探索基于各类策略
更新于 2025-01-04北京|上海
校招
1. 负责AGI前沿方向体系化调研; 2. 负责世界基座模型的预训练工作; 3. 专利/论文撰写,形成行业影响力; 4. 联合量产团队完成研发落地闭环。 【课题名称】 智驾基座模型预训练 【课题内容】 以实现物理世界AGI技术栈,提升车辆智能度和安全性为目标,进行智驾基座模型的预训练,支撑下一代E2E方案研发,包含规控SFT/RFT等。
更新于 2025-06-26北京