字节跳动豆包大模型应用算法工程师-Data AML
任职要求
1、2026届获得硕士及以上学位,计算机、通信、数学等相关专业; 2、扎实的机器学习/NLP/RL基础,有想法且动手能力强,出色的探索能力,在ACL/EMNLP/NAACL/NeurIPS/ICML/ICLR等顶级会议上发表论文者优先; 3、对AI技术的实际落地和突破性应用充满热情,追求技术创新与现实价值的结合; 4、良好的自驱力,思维敏捷,追求本质,敢于挑战未知问题,乐于在技术攻关中探索技术前沿,能主动学习并快速成长。
工作职责
团队介绍:Data AML是字节跳动的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。 1、专注改进大模型在现实世界复杂任务的效果,追求通用可规模化的方法,包括不限于复杂推理、多模态、自主Agent、以及可扩展监督和大规模数据合成等方法; 2、推动大模型技术在高难度场景中的前沿应用,包括不限于Agent系统、专业咨询、科研协作、深度洞察、个性化教育等高价值场景; 3、面向广泛的现实世界高价值任务,设计科学、严谨的量化评测体系,提升模型的智能水平。
团队介绍:Data AML是字节跳动的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。 1、负责豆包模型AIGC相关技术的研究和开发,包括图像、视频或3D生成&编辑等,探索基于扩散和自回归的技术路线,以实现高质量的输出; 2、解决生成视频/图像中的时间一致性、空间连贯性和可控性等核心研究难题; 3、紧跟生成方向(扩散模型、Transformer、生成对抗网络等)的最新研究动态,并对创新想法进行原型验证; 4、依托公司和业界的大模型和基础CV技术,构建面向ToB业务应用的多模态算法能力,帮助业务取得成功。
团队介绍:Data AML是字节跳动的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。 1、负责豆包模型AIGC相关技术的研究和开发,包括图像、视频或3D生成&编辑等,探索基于扩散和自回归的技术路线,以实现高质量的输出; 2、解决生成视频/图像中的时间一致性、空间连贯性和可控性等核心研究难题; 3、紧跟生成方向(扩散模型、Transformer、生成对抗网络等)的最新研究动态,并对创新想法进行原型验证; 4、依托公司和业界的大模型和基础CV技术,构建面向ToB业务应用的多模态算法能力,帮助业务取得成功。
1、与解决方案产品经理合作,深入理解初创企业的需求并设计技术解决方案,确保商业目标与技术实施之间的一致性; 2、了解豆包大模型家族的模型特性,能够设计和开发AI应用程序和原型,验证产品概念和需求,展示企业用例的大模型集成模式; 3、在企业采用豆包大模型的整个过程中,作为主要的技术负责人,协调内部多个团队以推动客户成功; 4、分析和定位模型能力缺陷,协助构建模型评测,帮助算法和数据团队推进模型迭代; 5、帮助企业开发轻量级评估框架和测试套件,以衡量豆包大模型对其特定用例的性能。