logo of pingantech

平安科技算法工程师(大模型训推优化)

社招全职3年以上计算机网络技术类地点:深圳状态:招聘

任职要求


1.计算机科学、人工智能、统计学或相关领域的硕士及以上学历,3年以上工作经验。
2.熟练掌握PythonC++等编程语言,有扎实的数据结构算法基础。
3.深入理解机器学习深度学习原理,具备实际算法开发经验。熟悉至少一种大模型(含LLM),如Deepseek、Qwen、GLM、Llama、BaiChuan等.
4.深入理解模型推理加速和优化技术,有模型压缩和轻量化经验优先。
5.深入理解模型训练加速技术,如混合精度训练、分布式、并行计算等优先。
6.良好的团队合作精神和沟通能力,能够在跨部门团队中有效合作。
7. 具有较强的学习能力和问题解决能力,能够快速适应新技术和新环境。
 
加分项:
1.深入理解CUDA并行计算原理,一定的CUDA编程经验。
2.熟悉容器化技术(如Docker)和微服务架构。
3.有参与过开源项目或在AI领域发表过学术论文者优先。
4.具备AI平台(如阿里PAI、百度BML、华为ModelArts、谷歌GCP等)的使用经验。

工作职责


1.算法平台大模型(含LLM)训练和推理优化工作:涵盖PD分离部署、检索增强生成(RAG)、智能代理(Agent)等前沿应用领域,推动技术与业务的深度融合。
2.性能优化:对AI模型训练和推理过程进行性能分析和调优,提升算法执行效率,包括但不限于算法加速、资源调度优化等。
3.工具开发:开发算法研发和部署过程中所需的工具和脚本,提高研发效率,实现算法工程化。
4.技术支持:为AI工程师和研究人员提供技术咨询和支持,帮助他们解决在算法研发过程中遇到的工程问题。
5.跨部门协作:与产品、研发、运维等其他团队协作,确保算法平台的稳定性和可用性。
6.技术研究:跟踪最新的AI工程化技术和趋势,将新技术应用到平台建设中,推动技术创新。
包括英文材料
学历+
Python+
C+++
数据结构+
算法+
机器学习+
深度学习+
大模型+
Llama+
CUDA+
Docker+
微服务+
相关职位

logo of hello
社招软研类

1、主导大模型在线推理系统的性能攻坚,构建多节点多GPU的分布式推理架构,实现智能请求调度算法与异构硬件的极致性能调优; 2、研究低bit量化、稀疏化attention等解码加速技术,在保障精度前提下显著降低计算资源消耗; 3、设计高并发场景下的负载均衡方案,构建支持动态扩展的弹性计算架构,优化推理引擎运行时环境,实现毫秒级延迟与高QPS吞吐能力。

更新于 2025-10-09
logo of baidu
社招ACG

-结合LLM技术发展,优化分布式训练和推理框架的性能,各常见模型训推MFU优化到极致状态 -在自研芯片上适配常见的大模型与自驾模型,结合芯片特点做优化,充分发挥自研芯片算力 -探索前沿的训推优化技术,算法、框架、集群协同创新,构建有竞争力的大模型训推系统 -与业务团队协同,理解客户需求,驱动技术创新,业务持续突破

更新于 2025-04-07
logo of baidu
社招ACG

- 结合LLM技术发展,优化分布式训练和推理框架的性能,各常见模型训推MFU优化到极致状态 - 在自研芯片上适配常见的大模型与自驾模型,结合芯片特点做优化,充分发挥自研芯片算力 - 探索前沿的训推优化技术,算法、框架、集群协同创新,构建有竞争力的大模型训推系统 - 与业务团队协同,理解客户需求,驱动技术创新,业务持续突破

更新于 2025-07-10
logo of baidu
社招ACG

-结合LLM技术发展,优化分布式训练和推理框架的性能,各常见模型训推MFU优化到极致状态 -在自研芯片上适配常见的大模型与自驾模型,结合芯片特点做优化,充分发挥自研芯片算力 -探索前沿的训推优化技术,算法、框架、集群协同创新,构建有竞争力的大模型训推系统 -与业务团队协同,理解客户需求,驱动技术创新,业务持续突破

更新于 2025-07-10