logo of bytedance

字节跳动Agentic AI算法实习生-风控

实习兼职A195382地点:杭州状态:招聘

任职要求


1、2027届本科及以上学历在读,计算机、机器学习模式识别相关专业优先;
2、扎实的算法数据结构基础,熟练掌握Python/Go/C++等至少一门编程语言,具备优秀的工程落地能力;
3、熟悉主流大模型的训练与微调原理,了解RAG、长上下文处…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。
团队介绍:风控算法团队深耕于抖音(短视频、直播、电商、本地生活等)、今日头条等多个字节系业务,涵盖内容、交易、流量、账号等多个场景的底线风险治理、黑灰产对抗及复杂反作弊等关键任务。风控场景具有对抗性极强、逻辑推理链路长及海量多模态数据等挑战。目前,团队正积极推进大语言模型(LLM/MLM)与 Agentic AI 技术的深入研究与工业化落地。通过探索前沿的模型训练范式、自主规划的 Agent 架构以及严谨的 Harness Engineering 体系,我们致力于打造下一代智能风控基础设施,为十亿级用户的社区生态保驾护航。
 
1、参与风控垂域大模型基座优化:打造业内领先的风控垂域基座,深入研究CPT、SFT、RL及训练与推理加速等技术;重点攻克强对抗环境下的多模态理解难题,提升模型在超长上下文、复杂逻辑推理和指令遵循等方面的表现;
2、参与Agentic AI架构研究与演进:参考行业标杆,推进风控Agent的架构升级与工业化落地,打磨领域Skill/Tool框架,优化复杂工具调用、长短期记忆管理、长链路任务编排和多Agent协同等,打造具备自演进能力的下一代智能风控架构;
3、参与构建科学评估与Harness Engineering体系:构建高质量的领域数据集,设计科学严谨的Benchmark评测体系,构建工业级Harness Engineering系统,持续驱动模型能力边界的突破。
包括英文材料
学历+
机器学习+
模式识别+
算法+
数据结构+
Python+
Go+
C+++
还有更多 •••
相关职位

logo of amap
实习高德研究型实习生

业务丰富,技术领先 高德打车算法团队深度赋能打车业务全链路,涵盖 用户增长、风控、服务管控、路线与上下车点推荐、ETA 预估、智能客服 等核心场景。多样化的业务挑战为算法创新提供了广阔的发挥空间,团队已在 AI 顶级会议发表成果。 精英阵容,国际视野 团队成员来自泰晤士世界大学排名 Top 10 的高校,以及美国常青藤、清华、北大等顶尖院校,兼具国际化背景与一流技术视野。 持续成长,共享共进 团队每周固定进行技术分享,氛围开放、互助友好;除了解答算法与工程难题,资深同事还会分享项目经验,并传授业务理解与问题解决的方法论,助你快速成长。 我们正在寻找相关专业的优秀实习生,一同探索前沿大模型技术在共享出行领域的深度应用,共同攻克业界难题,优化产品体验。 在这里,你将运用大模型、强化学习、深度学习等先进技术处理海量数据,推动用户体验优化与平台效率提升,主要包括: 1. 行程问题智能处理:构建并优化模型,识别司乘纠纷、费用异常、服务质量波动、安全风险、客诉等多类行程问题,并实现自动化处理方案。 2. 前沿技术落地:将多模态大模型及相关技术(PE、SFT、DPO、RAG、AI Agent、Agentic RL、AIGC 等)应用于业务场景,显著提升算法效果与业务指标。 3. 问题建模与解决:将业务场景中的复杂问题抽象为数据建模或科学研究课题,提出可行解决方案并高质量落地。 在这里,你的算法将直接服务全国数亿级用户,带来真实而深远的影响;你能接触到前沿大模型、多模态、强化学习等核心技术,并与顶尖同事共创,在开放包容的创新氛围下,发挥AI创造力。

更新于 2026-03-30北京
logo of alibaba
实习淘天集团研究型实

1. 设计Data Agent统一记忆表示框架与生命周期管理机制,支持结构化/非结构化数据记忆混合存储,制定动态管理策略,确保关键分析结果长期稳定可用。 2. 构建自然语言检索与数据验证体系,设计数据溯源与自动校验流程,有效防止幻觉并保障分析结论的可靠性。 3. 结合以上方向的探索和研究,撰写发表论文,和业界、学术界保持良好的交流。

更新于 2026-01-21北京
logo of meituan
实习核心本地商业-美

你将深度参与以下模块的设计、验证和优化: [1] 感知:让 Agent 理解复杂多变的用户界面,将海量的、异构的、实时的场景信息高效可靠地转化为结构化的 item。 [2] 记忆:让 Agent 拥有仿生的长短期记忆,通过多路召回等策略,组合聊天历史、用户画像和召回结果,为Agent 的每一次决策提供最关键的上下文。 [3] 决策: 构建自主的 Agentic Workflows,让 Agent 学会在恰当的时机,以恰当的方式与用户交互。 此外,你还需要参与建立一套自动化的、数据驱动的评测框架,用于客观、全面地衡量Agent在真实世界任务中的表现,驱动工程策略的快速迭代。

更新于 2025-08-05北京
logo of alibaba
实习淘天集团研究型实

1. 设计并优化职能Agent架构,包括但不限于内部业务知识利用,Agent记忆、上下文工程、工具调用、多智能体协作等,打造AI数字员工,提升职能团队整体工作效率。 2. 参与Agent模型训练过程,包括业务场景相关的SFT数据合成、Agentic RL等,设计高效的策略优化算法,结合私域知识、公域知识、历史经验等信息,通过稳定的Agentic RL,提升Agent多轮交互能力,实现AI数字员工与职能团队的协作效率提升,撰写顶会论文并进行业务落地。

更新于 2025-11-05杭州