百度小度云平台部_大模型算法工程师(J11437)
社招全职小度科技地点:北京状态:招聘
任职要求
-计算机科学,电子工程,数学,物理或相关领域的硕士或博士学位 -对深度学习,机器学习,神经网络,transformer有深入的理解,有项目中应用的经验 -具有良好的编程能力,有Python和C++编程经验和深度学习框架使用经验,熟悉pytorch、megatron-lm -能阅读和理解技术研究论文,并能将论文的观点转化为实际的算法 -善于解决问题和适应新的技术变化
工作职责
-预训练和微调大语言模型,基于小度自有数据,训练更适合小度需求场景的大语言模型 -与数据工程师合作,理解和预处理数据,以准备用于深度学习模型的输入 -阅读和理解最新的研究论文,跟踪和使用业界前沿实践进行模型训练,验证并分析效果和 -监控模型训练过程,进行问题排查和调优
包括英文材料
学历+
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
机器学习+
https://www.youtube.com/watch?v=0oyDqO8PjIg
Learn about machine learning and AI with this comprehensive 11-hour course from @LunarTech_ai.
https://www.youtube.com/watch?v=i_LwzRVP7bg
Learn Machine Learning in a way that is accessible to absolute beginners.
https://www.youtube.com/watch?v=NWONeJKn6kc
Learn the theory and practical application of machine learning concepts in this comprehensive course for beginners.
https://www.youtube.com/watch?v=PcbuKRNtCUc
Learn about all the most important concepts and terms related to machine learning and AI.
Transformer+
https://huggingface.co/learn/llm-course/en/chapter1/4
Breaking down how Large Language Models work, visualizing how data flows through.
https://poloclub.github.io/transformer-explainer/
An interactive visualization tool showing you how transformer models work in large language models (LLM) like GPT.
https://www.youtube.com/watch?v=wjZofJX0v4M
Breaking down how Large Language Models work, visualizing how data flows through.
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
C+++
https://www.learncpp.com/
LearnCpp.com is a free website devoted to teaching you how to program in modern C++.
https://www.youtube.com/watch?v=ZzaPdXTrSb8
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
Megatron+
https://www.youtube.com/watch?v=hc0u4avAkuM
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
相关职位
社招5年以上小度科技
-负责小度个性化推荐系统的研发,构建基于用户行为和喜好的内容推荐、协同过滤和场景引擎,应用于小度用户的个性化推荐系统和业务中 -负责推荐系统在不同垂类的系统搭建和算法调优 -追踪生成大模型等最新技术在推荐场景下的落地
更新于 2023-06-19
社招5年以上小度科技
-负责小度个性化推荐系统的研发,构建基于用户行为和喜好的内容推荐、协同过滤和场景引擎,应用于小度用户的个性化推荐系统和业务中 -负责推荐系统在不同垂类的系统搭建和算法调优 -追踪生成大模型等最新技术在推荐场景下的落地
更新于 2023-06-19
实习小度科技
-负责小度多模态大模型的结构设计、预训练任务、模型训练和推理验证等工作,包括但不限于多模态预训练、跨模态生成与检索、多模态对话等业务应用 -跟踪多模态大模型方向前沿问题的研究 -参与建设并持续保持部门多模态技术在业界的技术先进性,保持创新的同时将业界SOTA模型在小度业务场景进行产品化落地 -负责的多模态技术涵盖视觉、语音、NLP等多个领域
更新于 2024-03-18