
平安科技算法工程师
社招全职计算机网络技术类地点:深圳状态:招聘
任职要求
1.计算机科学、应用数学或先关领域的硕士或博士学位优先 2.在文本大模型预训练、微调、强化学习方面有扎实的理论基础和实践经验,曾深度参与大模型项目 3.熟悉主流…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1.负责文本大模型的预训练、post-training相关工作,包括但不限于:数据清洗,领域增强预训练,大模型的蒸馏与对齐,模型评估方法研究 2.负责解决大模型幻觉,优化大模型在复杂推理任务(如数学计算)、智能体Planning、RAG、指令跟随等方面的能力,提升大模型在金融领域应用落地效果 3.面向集团各类业务场景,沉淀共性能力,实现大模型技术的标准化与产品化 特别说明:文本大模型算法方向
包括英文材料
学历+
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
强化学习+
https://cloud.google.com/discover/what-is-reinforcement-learning?hl=en
Reinforcement learning (RL) is a type of machine learning where an "agent" learns optimal behavior through interaction with its environment.
https://huggingface.co/learn/deep-rl-course/unit0/introduction
This course will teach you about Deep Reinforcement Learning from beginner to expert. It’s completely free and open-source!
https://www.kaggle.com/learn/intro-to-game-ai-and-reinforcement-learning
Build your own video game bots, using classic and cutting-edge algorithms.
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
还有更多 •••
相关职位
实习DATA
⭐基于langchain等工业级Agent框架搭建内容创作Agent、数据挖掘Agent、运营Agent、Co-work Agent ⭐使用sft、rl等方式训练工作流中的中间件模型和应答模型 ⭐面向真实用户需求,持续优化内容呈现效果、系统开销
更新于 2026-05-31深圳
社招2-5年SOFTWARE
1. 负责OPPO浏览器、应用商店、游戏中心等产品的Push推送算法工作,搭建终端特色的消息推送系统,为用户提供一流的产品体验; 2. 将前沿算法技术应用到Push业务,提高点击率,降低负反馈率,满足产品的拉新促活需求。
更新于 2025-08-01深圳
社招3-5年SOFTWARE
工作职责: 1.搭建手机端触控自研算法(滤波/坐标计算/防误触/防水等)能力; 2.负责建设触摸体验客观评价指标,平衡灵敏度/线性度,防误触/不响应等表现; 3.对接硬件部门,负责新IC/新方案导入评估; 4.负责行业触控竞品分析、了解行业趋势、输出自研算法推演路线。
更新于 2025-07-07深圳