字节跳动算法工程师(大模型数据技术方向)-业务中台
社招全职A143520地点:北京状态:招聘
任职要求
1、计算机科学与技术、统计学、数学、数据科学等相关专业,硕士及以上学位,博士学位或有相关领域突出成果者优先; 2、精通数据合成、数据分析、自动标注、质量过滤等相关算法和技术,熟悉至少一种主流深度学习框架(如TensorFlow、PyTorch等),具备扎实的机器学习、深度学习理论基础; 3、有代码数据合成、多模态数据合成相关项目经验,熟悉代码结构分析…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、负责代码、文本、多模态等数据的合成技术的研究与开发,运用大模型和先进算法,生成高质量、多样化的合成数据,扩充数据规模与多样性,满足大模型训练需求; 2、对大模型训练数据进行深入分析,运用统计学、机器学习等方法挖掘数据特征和规律,识别数据中的噪声、偏差和潜在问题,为数据合成、标注和质量过滤提供数据洞察和优化方向; 3、研究并实现高效的数据自动标注算法,结合自然语言处理、计算机视觉等技术,开发自动化标注工具和流程,提升标注效率和准确性,降低人工标注成本; 4、设计并优化数据质量评估指标和过滤算法,建立数据质量监控体系,对原始数据、合成数据和标注后的数据进行全面质量检测和筛选,确保输入大模型的数据真实、准确、合规; 5、持续跟踪行业前沿数据技术动态,对现有数据处理算法和流程进行优化升级;产品、工程等团队紧密协作,推动数据处理技术在大模型研发和应用中的高效落地。
包括英文材料
数据科学+
https://roadmap.sh/ai-data-scientist
Step by step roadmap guide to becoming an AI and Data Scientist
学历+
数据分析+
[英文] Data Analyst Roadmap
https://roadmap.sh/data-analyst
Step by step guide to becoming an Data Analyst in 2025
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
还有更多 •••
相关职位
社招1年以上技术类-算法
1、参与LLM方向的新技术研究和落地应用,支持指令微调、强化学习相关算法需求 2、支持通用ai agent在产品业务应用中的落地研发和效果优化,包括但不限于通用ai agent,深入理解大模型和通用ai agent运行原理,明确提升通用ai agent效果的核心技术方向。 3、负责ai agent的框架构建,agent与工具调用的优化,相关场景下大模型的优化,将ai agent框架、工具、大模型有效结合,为通用ai agent效果提供最佳的使用体验。
更新于 2025-09-16杭州
校招虎鲸文娱2026
1、负责大模型在query深度理解(语义推理/意图识别/实体识别/文本纠错)、多语言翻译等方向的算法突破,持续提升生成质量与任务泛化能力 2、设计LLM的规划-推理-反思技术闭环,研发复杂任务拆解、因果推断、自我纠错等能力,通过思维链(CoT)优化和自洽性增强提升模型高阶认知水平 3、基于优酷搜索场景数据提供技术解决方案,探索业界前沿技术在业务中的落地与指标优化
更新于 2025-08-05北京|杭州
实习虎鲸文娱2026
1、负责大模型在query深度理解(语义推理/意图识别/实体识别/文本纠错)、多语言翻译等方向的算法突破,持续提升生成质量与任务泛化能力; 2、设计LLM的规划-推理-反思技术闭环,研发复杂任务拆解、因果推断、自我纠错等能力,通过思维链(CoT)优化和自洽性增强提升模型高阶认知水平; 3、基于优酷搜索场景数据提供技术解决方案,探索业界前沿技术在业务中的落地与指标优化。
更新于 2025-05-06北京|杭州