logo of bytedance

字节跳动算法工程师(大模型数据技术方向)-业务中台

社招全职A143520地点:北京状态:招聘

任职要求


1、计算机科学与技术、统计学、数学、数据科学等相关专业,硕士及以上学位,博士学位或有相关领域突出成果者优先;
2、精通数据合成、数据分析、自动标注、质量过滤等相关算法和技术,熟悉至少一种主流深度学习框架(如TensorFlow、PyTorch等),具备扎实的机器学习、深度学习理论基础;
3、有代码数据合成、多模态数据合成相关项目经验,熟悉代码结构分析…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责代码、文本、多模态等数据的合成技术的研究与开发,运用大模型和先进算法,生成高质量、多样化的合成数据,扩充数据规模与多样性,满足大模型训练需求;
2、对大模型训练数据进行深入分析,运用统计学、机器学习等方法挖掘数据特征和规律,识别数据中的噪声、偏差和潜在问题,为数据合成、标注和质量过滤提供数据洞察和优化方向;
3、研究并实现高效的数据自动标注算法,结合自然语言处理、计算机视觉等技术,开发自动化标注工具和流程,提升标注效率和准确性,降低人工标注成本;
4、设计并优化数据质量评估指标和过滤算法,建立数据质量监控体系,对原始数据、合成数据和标注后的数据进行全面质量检测和筛选,确保输入大模型的数据真实、准确、合规;
5、持续跟踪行业前沿数据技术动态,对现有数据处理算法和流程进行优化升级;产品、工程等团队紧密协作,推动数据处理技术在大模型研发和应用中的高效落地。
包括英文材料
数据科学+
学历+
数据分析+
算法+
深度学习+
还有更多 •••
相关职位

logo of alibaba
社招1年以上技术类-算法

1、参与LLM方向的新技术研究和落地应用,支持指令微调、强化学习相关算法需求 2、支持通用ai agent在产品业务应用中的落地研发和效果优化,包括但不限于通用ai agent,深入理解大模型和通用ai agent运行原理,明确提升通用ai agent效果的核心技术方向。 3、负责ai agent的框架构建,agent与工具调用的优化,相关场景下大模型的优化,将ai agent框架、工具、大模型有效结合,为通用ai agent效果提供最佳的使用体验。

更新于 2025-09-16杭州
logo of youku
校招虎鲸文娱2026

1、负责大模型在query深度理解(语义推理/意图识别/实体识别/文本纠错)、多语言翻译等方向的算法突破,持续提升生成质量与任务泛化能力 2、设计LLM的规划-推理-反思技术闭环,研发复杂任务拆解、因果推断、自我纠错等能力,通过思维链(CoT)优化和自洽性增强提升模型高阶认知水平 3、基于优酷搜索场景数据提供技术解决方案,探索业界前沿技术在业务中的落地与指标优化

更新于 2025-08-05北京|杭州
logo of youku
实习虎鲸文娱2026

1、负责大模型在query深度理解(语义推理/意图识别/实体识别/文本纠错)、多语言翻译等方向的算法突破,持续提升生成质量与任务泛化能力; 2、设计LLM的规划-推理-反思技术闭环,研发复杂任务拆解、因果推断、自我纠错等能力,通过思维链(CoT)优化和自洽性增强提升模型高阶认知水平; 3、基于优酷搜索场景数据提供技术解决方案,探索业界前沿技术在业务中的落地与指标优化。

更新于 2025-05-06北京|杭州
logo of meituan
社招2年以上软硬件服务-骑行

1. 负责美团骑行用户运营核心业务,包括但不限于智能用户运营、智能换电等。 2. 设计和优化用户智能营销算法,提升多种活动场景的营销效率,提升用户规模和用户体验。 3. 与业务、产品团队紧密合作,从业务中抽象出问题,进行建模优化,并推动解决方案的实施。 4. 结合运筹优化、因果推断等前沿理论和业界实践,解决骑行业务场景中的复杂决策和预测问题。

更新于 2025-06-22北京