字节跳动Agentic AI算法实习生-风控
任职要求
1、2027届本科及以上学历在读,计算机、机器学习和模式识别相关专业优先; 2、扎实的算法与数据结构基础,熟练掌握Python/Go/C++等至少一门编程语言,具备优秀的工程落地能力; 3、熟悉主流大模型的训练与微调原理,了解RAG、长上下文处…
工作职责
ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:风控算法团队深耕于抖音(短视频、直播、电商、本地生活等)、今日头条等多个字节系业务,涵盖内容、交易、流量、账号等多个场景的底线风险治理、黑灰产对抗及复杂反作弊等关键任务。风控场景具有对抗性极强、逻辑推理链路长及海量多模态数据等挑战。目前,团队正积极推进大语言模型(LLM/MLM)与 Agentic AI 技术的深入研究与工业化落地。通过探索前沿的模型训练范式、自主规划的 Agent 架构以及严谨的 Harness Engineering 体系,我们致力于打造下一代智能风控基础设施,为十亿级用户的社区生态保驾护航。 1、参与风控垂域大模型基座优化:打造业内领先的风控垂域基座,深入研究CPT、SFT、RL及训练与推理加速等技术;重点攻克强对抗环境下的多模态理解难题,提升模型在超长上下文、复杂逻辑推理和指令遵循等方面的表现; 2、参与Agentic AI架构研究与演进:参考行业标杆,推进风控Agent的架构升级与工业化落地,打磨领域Skill/Tool框架,优化复杂工具调用、长短期记忆管理、长链路任务编排和多Agent协同等,打造具备自演进能力的下一代智能风控架构; 3、参与构建科学评估与Harness Engineering体系:构建高质量的领域数据集,设计科学严谨的Benchmark评测体系,构建工业级Harness Engineering系统,持续驱动模型能力边界的突破。
业务丰富,技术领先 高德打车算法团队深度赋能打车业务全链路,涵盖 用户增长、风控、服务管控、路线与上下车点推荐、ETA 预估、智能客服 等核心场景。多样化的业务挑战为算法创新提供了广阔的发挥空间,团队已在 AI 顶级会议发表成果。 精英阵容,国际视野 团队成员来自泰晤士世界大学排名 Top 10 的高校,以及美国常青藤、清华、北大等顶尖院校,兼具国际化背景与一流技术视野。 持续成长,共享共进 团队每周固定进行技术分享,氛围开放、互助友好;除了解答算法与工程难题,资深同事还会分享项目经验,并传授业务理解与问题解决的方法论,助你快速成长。 我们正在寻找相关专业的优秀实习生,一同探索前沿大模型技术在共享出行领域的深度应用,共同攻克业界难题,优化产品体验。 在这里,你将运用大模型、强化学习、深度学习等先进技术处理海量数据,推动用户体验优化与平台效率提升,主要包括: 1. 行程问题智能处理:构建并优化模型,识别司乘纠纷、费用异常、服务质量波动、安全风险、客诉等多类行程问题,并实现自动化处理方案。 2. 前沿技术落地:将多模态大模型及相关技术(PE、SFT、DPO、RAG、AI Agent、Agentic RL、AIGC 等)应用于业务场景,显著提升算法效果与业务指标。 3. 问题建模与解决:将业务场景中的复杂问题抽象为数据建模或科学研究课题,提出可行解决方案并高质量落地。 在这里,你的算法将直接服务全国数亿级用户,带来真实而深远的影响;你能接触到前沿大模型、多模态、强化学习等核心技术,并与顶尖同事共创,在开放包容的创新氛围下,发挥AI创造力。
1. 设计Data Agent统一记忆表示框架与生命周期管理机制,支持结构化/非结构化数据记忆混合存储,制定动态管理策略,确保关键分析结果长期稳定可用。 2. 构建自然语言检索与数据验证体系,设计数据溯源与自动校验流程,有效防止幻觉并保障分析结论的可靠性。 3. 结合以上方向的探索和研究,撰写发表论文,和业界、学术界保持良好的交流。
你将深度参与以下模块的设计、验证和优化: [1] 感知:让 Agent 理解复杂多变的用户界面,将海量的、异构的、实时的场景信息高效可靠地转化为结构化的 item。 [2] 记忆:让 Agent 拥有仿生的长短期记忆,通过多路召回等策略,组合聊天历史、用户画像和召回结果,为Agent 的每一次决策提供最关键的上下文。 [3] 决策: 构建自主的 Agentic Workflows,让 Agent 学会在恰当的时机,以恰当的方式与用户交互。 此外,你还需要参与建立一套自动化的、数据驱动的评测框架,用于客观、全面地衡量Agent在真实世界任务中的表现,驱动工程策略的快速迭代。