
奇虎360AI大模型算法实习生(北京)-4921(J11822)
实习兼职算法类地点:北京状态:招聘
任职要求
1.计算机/数学/人工智能等相关专业在读硕士及以上; 2.掌握但不限于GRPO、PPO、DPO 等强化学习算法、Transformer及其变种、Pytorch框架、LLama-Factory等,有扎实的编程基础和代码实现能力; 3.熟悉…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1.根据业务使用主流框架构建模型,进行模型训练、调参、验证、根据需求准备训练使用的数据集等。 2.参与端到端RL Agent探索和研发落地,提升算法效果。 3.参与大模型方向前沿技术研究,包括但不限于Agent、SFT、RL等。
包括英文材料
强化学习+
https://cloud.google.com/discover/what-is-reinforcement-learning?hl=en
Reinforcement learning (RL) is a type of machine learning where an "agent" learns optimal behavior through interaction with its environment.
https://huggingface.co/learn/deep-rl-course/unit0/introduction
This course will teach you about Deep Reinforcement Learning from beginner to expert. It’s completely free and open-source!
https://www.kaggle.com/learn/intro-to-game-ai-and-reinforcement-learning
Build your own video game bots, using classic and cutting-edge algorithms.
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
Transformer+
https://huggingface.co/learn/llm-course/en/chapter1/4
Breaking down how Large Language Models work, visualizing how data flows through.
https://poloclub.github.io/transformer-explainer/
An interactive visualization tool showing you how transformer models work in large language models (LLM) like GPT.
https://www.youtube.com/watch?v=wjZofJX0v4M
Breaking down how Large Language Models work, visualizing how data flows through.
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
还有更多 •••
相关职位

实习算法类
1、协助数据准备:负责处理和准备大量的训练数据,包括数据收集、清洗、标注和预处理等工作; 2、模型训练与优化:参与模型训练的过程,包括超参数调整、模型结构优化和训练算法改进等,以提高模型的性能和效果; 3、实验设计与分析:参与设计实验,并对实验结果进行分析和评估,提出改进建议,并协助改进模型的性能; 4、模型部署与性能监控:参与模型的部署和集成工作,确保模型能够在实际环境中正常运行,并监控模型的性能和稳定性; 5、文档编写与沟通:撰写实验报告、技术文档和进展更新,与团队成员进行有效的沟通和协作。
更新于 2025-02-13北京

实习算法类
1、协助数据准备:负责处理和准备大量的训练数据,包括数据收集、清洗、标注和预处理等工作; 2、模型训练与优化:参与模型训练的过程,包括超参数调整、模型结构优化和训练算法改进等,以提高模型的性能和效果; 3、实验设计与分析:参与设计实验,并对实验结果进行分析和评估,提出改进建议,并协助改进模型的性能; 4、模型部署与性能监控:参与模型的部署和集成工作,确保模型能够在实际环境中正常运行,并监控模型的性能和稳定性; 5、文档编写与沟通:撰写实验报告、技术文档和进展更新,与团队成员进行有效的沟通和协作。
更新于 2025-12-26北京
社招技术类-算法
1、研发面向云计算底座海量数据的大模型,包括但不限于代码大模型、全模态、大规模图学习等领域相关的大模型的应用算法研发; 2、参与大模型应用研发全流程的工作,包括但不限于模型算法设计、代码开发、训练、部署优化、调试、评测;技术创新如专利、论文的撰写;外部技术影响力交流等; 3、推动大模型在DevOps提效、内外部智能体业务应用、爆款AI原生应用、安全和技术风险防控等场景的业务落地;
更新于 2025-07-14北京|杭州