字节跳动大语言模型算法开发工程师/专家(教育应用方向)-豆包大模型
任职要求
1、优秀的代码能力、数据结构和基础算法功底,熟练C/C++或Python; 2、熟悉NLP相关的算法和技术,在相关领域有过良好研究记录者优先,熟悉大模型预训练、SFT与RL算法者优先; 3、在大模型领域,主导参与过大影响力的项目或论文者优先; 4、出色的问题分析和解决能力,能深入解决大模型落地场景存在的问题; 5、良好的沟通协作能力,能和团队一起探索新技术,推进技术进步。
工作职责
团队介绍:字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的 AI 大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。 豆包大模型团队在AI领域拥有长期愿景与决心,研究方向涵盖NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。目前,豆包APP已成为中国市场用户量最大的AIGC应用。 1、擅长发现优化大模型的简单、普适的想法,并应用到各个规模的模型中提升效果; 2、探索多轮对话场景下复杂指令遵循与模型在长文本下的推理能力; 3、推进数据建设、指令微调、偏好对齐、模型优化方面的工作,提高模型质量和适应性; 4、推进教育领域大模型效果评估,尤其是复杂场景(多轮对话、多模态)评估集建设和自动化评估能力建设; 5、基于教育领域应用优化模型效果,包括AI导师、解题、讲题、批改等场景; 6、深入研究和探索大模型在教育领域中的更多使用场景,拓展模型的应用范围。
1,算法开发与优化: 负责自动驾驶模型算法的研发设计,包括但不限于行为决策、轨迹生成、运动规划等模块的深度学习/强化学习模型设计 探索基于Transformer、模仿学习(Imitation Learning)、强化学习(RL)等前沿技术的模型算法设计、应用方案 优化自动驾驶算法的实时性、安全性和舒适性,解决复杂场景(如拥堵、交互博弈、长尾问题)下的规划挑战 2,数据驱动迭代: 构建和利用大规模驾驶数据集(仿真+真实数据),设计数据闭环 pipeline 提升规划性能 参与数据标注、场景挖掘、仿真测试等环节,推动算法迭代 3,系统集成与部署: 与感知、控制等模块团队协作,实现模型算法在车载计算平台的部署 支持实车测试,分析问题并提出改进方案。 4,前沿技术跟踪: 跟进学术界(如CVPR、ICRA、CoRL)和工业界最新进展,将创新技术落地到量产或研发项目中
1、负责小鹏汽车海外市场的智能语音多语言能力建设,包括但不限于NLU模型训练、调优和自测,LLM领域/业务增强、多轮对话、智能Agent、数据生成等技术方向。 2、确保语音交互系统的准确性和流畅性,与海外团队紧密合作,交付符合海外用户语音交互习惯的功能。 3、参与多语言大语言模型的研发和应用,跟踪最新的大模型技术和对话系统发展趋势,将前沿技术应用到产品中,并通过用户反馈和数据分析,不断优化语音交互体验和智能化水平。
1. 负责小鹏汽车海外市场的智能语音多语言能力建设,包括但不限于NLU模型训练、调优和自测。 2. 与国内团队紧密合作,确保语音交互系统的准确性和流畅性,交付符合海外用户语音交互习惯的功能。 3. 参与多语言大语言模型的研发和应用,跟踪最新的大模型技术和对话系统发展趋势,将前沿技术应用到产品中,并通过用户反馈和数据分析,不断优化语音交互体验和智能化水平。