快手大模型评测实习生
实习兼职D13923地点:北京状态:招聘
任职要求
1、本科及以上学历在读,计算机、人工智能、数学、统计、设计学等相关专业优先; 2、对大模型及前沿 AI 技术有浓厚兴趣,愿意深入理解模型能力和评测方法; 3、具备良好的编程基础,熟悉至少一种主流编程语言(如 Python、C++ 等),具备一定数据分析处理能力; 4、具备一定的审美理解能力,对图像、视频的质量和风格…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、协助参与快手大模型(包括但不限于 LLM、T2I、I2I、MLLM 等)的评测工作,支持评测体系的建设与优化; 2、协助开发和维护评测相关的自动化工具,提升评测效率和稳定性; 3、在导师指导下完成数据收集、分析与可视化,输出阶段性评测结论; 4、参与图像等生成结果质量评估,结合主观感受与客观指标,提出改进建议。
包括英文材料
学历+
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
还有更多 •••
相关职位
实习模型标注
岗位职责: 1、梳理和解读大模型相关的评测业务,辅助进行定制化的评测框架体系构建,完善内部评测机制; 2、针对交付评测数据进行数据验收,反馈指标以及数据问题,引导评测同学进行质量提升; 3、针对市场上大模型相关应用进行摸底调研,结合内部模型方向给到模型优化改进意见;
更新于 2025-02-27北京
实习车辆控制
1. 参与多模态(文本、语音、图像)模型评测; 2. 针对大模型在实际业务中的落地场景(如代码生成、知识问答、长文本摘要),设计测试用例,定位模型幻觉、偏见、安全性等问题; 3. 研究并扩展评测数据集,构建多样化业务场景; 4. 前沿技术研究与创新,跟踪大模型评测领域最新进展。
北京
实习D13917
1、以算法视角,参与快手大模型(包括不限于LLM、T2I、T2V、I2V、MLLM模型)评测工作和评测体系建设; 2、参与评测相关自动化评测工具开发及维护,最大化提高评测效率; 3、以算法手段,对基座大模型和AI Native应用进行分阶段、端到端评测; 4、参与构建评测Agent工具链、对战平台、模型竞技场、模型效果判别模型、应用数据飞轮等工具链建设。
更新于 2025-10-24北京
