字节跳动大模型自动化评测实习生-AI数据与安全
任职要求
1、2027届本科及以上学历在读,计算机科学与技术、软件工程、大数据技术、人工智能、智能科学与技术、数据科学等相关专业优先; 2、精通Python程序设计,有良好的编码风格及创新优化意识,熟悉机器学习/人工智能/模型调优/提示工程,熟悉各种基本算法; 3、具有计算机及人工…
工作职责
ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:AI数据与安全团队为Seed基座模型及AI原生应用提供跨模态数据服务,覆盖数据生产全流程,包含模型评估标准的制定、数据规模化生产、数据飞轮搭建,不断提升数据质量,支持模型快速迭代。 团队由产品经理、数据工程、数据运营等跨职能人才组成,并通过与Seed研究员、行业专家、全球顶尖数据供应商紧密合作,从真实场景中收集反馈并分析模型表现数据,解决AI前沿突破过程中的复杂数据问题,推动模型性能与用户体验的双重提升。我们既是帮助模型技术迭代的一线贡献者,也是模型和AI产品的一手用户。 1、负责大模型自动化评测研发工作,将各类评测集在内部平台集成开发,助力模型在各垂类方向的能力提升; 2、负责训练数据的有效性验证工作,通过模型训练、构建Agent等方式,判别有效训练数据,助力模型能力提升; 3、调研公开文献、公开评测集、训练方法,参与自建评测集等探索类工作,优秀成果可以支持学术论文发表; 4、探索智能、高效的模型评估和训练方案,主导开发相关工具。
ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:AI数据与安全团队为Seed基座模型及AI原生应用提供跨模态数据服务,覆盖数据生产全流程,包含模型评估标准的制定、数据规模化生产、数据飞轮搭建,不断提升数据质量,支持模型快速迭代。 团队由产品经理、数据工程、数据运营等跨职能人才组成,并通过与Seed研究员、行业专家、全球顶尖数据供应商紧密合作,从真实场景中收集反馈并分析模型表现数据,解决AI前沿突破过程中的复杂数据问题,推动模型性能与用户体验的双重提升。我们既是帮助模型技术迭代的一线贡献者,也是模型和AI产品的一手用户。 1、评测体系建设:参与大模型评测的工程基础设施的开发工作,包括评测集的接入、生产、管理,评测对象的链路采样,人评/机评能力建设,评估结果的分析等评测核心能力的开发工作; 2、评测Agent搭建:探索自动评测、高质量评测集构建等前沿评测方法,在评测场景搭建AI Agent,为评测业务提供端到端的高效、自动化的交付能力。
AI Business成立于2023年4月,是阿里国际数字商业集团设立的一层业务组织,专注于AI技术能力建设和AI产品能力输出,旨在用最先进的AI技术重塑平台竞争力,为商家和用户带来极致的电商体验。 作为跨境电商领域的AI先锋,我们坚定地相信人工智能对塑造未来电商的关键作用,并坚持对AI领域人才的培养和发展。我们已经汇聚了业内顶尖的AI算法专家、AI工程师和AI产品团队,并诚挚邀请有共同使命感、追求创新与卓越的AI人才加入我们的团队,共同用AI技术书写数字商业领域的新篇章。 1、应用各类机器学习方法为大模型训练提供高质量训练数据,包含文本、图片、视频、音频等数据类型,探索基于AIGC的数据合成技术,不断提升数据对大模型上表现的贡献,追逐Data-centric AI的数据技术能力 2、建设跨境电商领域的Knowledge Base,从而构建服务阿里跨境电商的RAG、AI Agent 3、在通用BenchMark、业务领域BenchMark基础上,建设大模型自动化评测能力,通过模型评测进行科学数据供给和大模型训练
1.参与AI系统(如机器学习模型、NLP/CV应用、大语言模型等)的质量保障工作,设计并执行测试用例; 2.针对AI模型特性,完成性能测试(如推理速度、资源占用)、效果测试(如准确率、召回率)及稳定性测试(如对抗样本鲁棒性、数据漂移检测); 3.开发自动化测试脚本,搭建测试工具链,提升AI模型迭代效率; 4.分析测试结果,定位AI模型或数据问题,与算法/工程团队协作优化解决方案; 5.探索AI测试前沿技术(如模型可解释性测试、公平性评估等),推动测试流程标准化; 6.探索AI辅助测试落地测试项目。