字节跳动算法评测工程师-AI智能化方向
任职要求
1、本科及以上学历,三年及以上人工智能领域的质量保障或效果评价经验; 2、对技术和基础原理有执着追求,善于用各种手段解决问题;熟悉各类业界主流的人工智能相关的平台特性,具备平台开发经验&能力。熟悉至少一门编程语言,包括但不仅限于:Java、OC、C、C++、Python、Go、PHP; 3、了解质量保障基础知识并有相关经验;对…
工作职责
1、负责字节跳动人工智能产品线,站在用户视角构建端到端的算法效果评测体系; 2、深入业务结合业务需求痛点,设计完备的算法效果质量保障、评测方案;构建合理且置信的标准化评测体系,解决业务评测效率和效果问题; 3、推动通用人工智能评测方案的升级迭代,逐步推广至公司内的商业化平台。
1、负责字节跳动人工智能产品线,站在用户视角构建端到端的算法效果评测体系; 2、深入业务结合业务需求痛点,设计完备的算法效果质量保障、评测方案;构建合理且置信的标准化评测体系,解决业务评测效率和效果问题; 3、推动通用人工智能评测方案的升级迭代,逐步推广至公司内的商业化平台。
业务场景: 在开放世界游戏环境中,进行游戏内容理解与动态解说,驱动智能体完成指定任务、实现自主探索,并支持多智能体复杂交互等前沿AI应用场景。 岗位职责: 研究与开发: 负责开放世界游戏场景下基于大语言模型(LLM)及视觉语言模型(VLM)的智能体(Agent)技术研究与开发,涵盖Prompt工程、上下文学习(ICL)、检索增强生成(RAG)、监督微调(SFT)、强化微调(RFT)等关键技术。 框架与工具链构建: 主导游戏智能体核心框架的设计与实现,推动训练数据合成、自动化评测体系及相关算法的研发。 工业化落地: 推动游戏智能体技术在游戏内容生产与玩家消费场景的工业化部署与产品化落地,实现技术价值转化。
方向一: 1. 参与平台研发的全过程,监督研发过程的关键点,包含:产品需求评审、技术评审、代码review,测试评审、变更发布验收。 2.负责平台的质量建设,包括测试需求分析、测试架构设计、质量管理、风险洞察与应对,持续深入的稳定性建设。 3. 根据测试需要,能够开发测试代码、脚本、工具。 4. 保证被测系统的质量,并能通过改善测试流程、方法、技能,提高测试效率和质量。 方向二: ucdp算法质量 1. 负责支付宝的个性化AI产品体验(包括但不限于搜索推荐与增长)以及 基于Gen AI技术构造下一代的智能化产品的质量保障工作; 2. 工作内容包括不限于持续集成,回归体系,质量工具开发,线上监控应急,算法评估评测等,推动架构、技术、工具和流程的改进和创新,多工种配合,提升整体研发和交付的效率; 3. 在技术架构、工具平台、团队技能和人员等方面进行有前瞻性的布局、规划和建设,构建高品质的稳定性保障能力,有质量技术方向的创新。