快手【留用实习】大模型评测工程师
实习兼职J1017地点:北京状态:招聘
任职要求
1、本科及以上学历,计算机、人工智能、大数据、统计等相关专业优先; 2、熟悉Transformer、DiT、CLIP、VAE、Diffusion Models等生成式AI模型基本原理,对大模型技术有热情和探索精神; 3、具备良好的数据化思维,能够基于数据分析结果给出分析结论; 4、良好的沟通能力和团队协作精神,严谨的工作态度与高质量…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、参与快手大模型(包括不限于大语言模型,文生图模型,文生视频模型和多模态大模型)日常评测工作和评测体系建设; 2、参与评测方案的持续迭代和优化,通过Prompt工程、自训练算法模型、NLP模型等手段,建设提升大模型评测能力; 3、参与快手大模型相关应用的迭代和效果优化,调研行业先进AI技术,并推动落地在实际项目中; 4、与相关上下游团队密切配合,评估模型效果、给出迭代建议、明确优化方向,从评测视角持续帮助模型能力提升。
包括英文材料
学历+
大数据+
https://www.youtube.com/watch?v=bAyrObl7TYE
https://www.youtube.com/watch?v=H4bf_uuMC-g
With all this talk of Big Data, we got Rebecca Tickle to explain just what makes data into Big Data.
Transformer+
https://huggingface.co/learn/llm-course/en/chapter1/4
Breaking down how Large Language Models work, visualizing how data flows through.
https://poloclub.github.io/transformer-explainer/
An interactive visualization tool showing you how transformer models work in large language models (LLM) like GPT.
https://www.youtube.com/watch?v=wjZofJX0v4M
Breaking down how Large Language Models work, visualizing how data flows through.
还有更多 •••
相关职位
实习J1001
1、以算法视角,参与快手大模型(包括不限于LLM,T2I,T2V、I2V、MLLM模型)评测工作和评测体系建设; 2、参与评测相关自动化评测工具开发及维护,最大化提高评测效率; 3、以算法手段,对基座大模型和AI Native应用进行分阶段、端到端评测; 4、参与构建评测Agent工具链、对战平台、模型竞技场、模型效果判别模型、应用数据飞轮等工具链建设。
更新于 2025-06-04北京
实习J1014
1、参与 Agent 核心运行时的各项能力建设,包括任务规划、工具调用、记忆管理、多智能体协同等关键模块; 2、参与 OpenClaw 等开源 Agent 产品在快手内部的工程化落地与能力增强,包括电商、直播、短视频等业务场景; 3、参与 Agent 系统的可观测、评测、稳定性与部署体系建设,提升复杂 AI 系统的线上可用性; 4、跟踪并验证前沿 Agent / AI Infra 技术演进,推动从技术探索到业务落地的闭环。
更新于 2026-03-23杭州

实习技术
1.端到端模型研发: 负责新一代 End-to-End 自动驾驶算法的研发,包括但不限于基于 World Model(世界模型)、Video Generation(视频生成) 或 VLM(视觉语言模型) 的驾驶策略生成。 2.模型架构探索: 探索 Transformer、State-space Model (如 Mamba)、Diffusion Model 、IL/RL在轨迹预测与决策规划中的应用,验证 Scaling Law 在自动驾驶规控领域的有效性。 3.数据闭环与评测: 搭建针对生成式规划算法的自动化评测体系,利用大模型进行数据挖掘、自动标注(Auto-labeling)及场景重建,通过数据闭环持续提升模型性能。
更新于 2026-04-02上海