logo of quark

夸克智能信息-大模型算力加速工程师-北京

社招全职3年以上技术类-开发地点:杭州 | 广州状态:招聘

任职要求


1. 精通C/C++Python等至少一门编程语言,以及Linux下的系统开发经验
2. 熟悉常用机器学习算法,对文本/多模态大模型相关领域模型,有极佳的工程实现能力,熟悉TF/Pytorch/Jax深度学习框架,有相关模型训练和模型效果优化者优先
3. 熟悉大模型MegatronLM/Deepspeed/Colossal分布式训练框,深入了解模型量化、蒸馏、剪枝等模型优化原理和策略,有文本、语音、以及多模态模型相关训练、效果调优经验优先
4. 熟练使用包括vllm/sglang/tgi/tensorrtLLM/lmdeploy等一种以上模型推理服务框架,有代码分析及实践经验优先
5. 对于GPU/ASIC芯片等熟悉了解硬件系统架构,能够针对性的编写高性能的算子实现,有分析及调优能力者优先
6. 有Bert、语音TTS/ASR,以及SD等模型训练、推理优化经验者亦可
7. 在训练/推理加速相关领域的研究和成果发表者优先

同时我们还希望你
1、学习能力强,有良好的英文论文阅读能力,对新事物保有好奇心,并能快速适应新环境;
2、良好的沟通能力和团队协同能力;能与他人合作,共同完成目标;
3、对所在领域有热情,相信方法总比困难多,善于独立思考并反思总结。

工作职责


1、参与大模型超大规模任务离线训练的效率和稳定性提升的工作; 
2、参与大模型在线inference吞吐/延迟优化,提升inference性价比的工作; 
3、参与上述算力加速软硬件及平台体系化的设计和建设工作,支撑大模型能力建设和落地应用;
包括英文材料
C+
C+++
Python+
Linux+
机器学习+
算法+
大模型+
PyTorch+
JAX+
深度学习+
DeepSpeed+
vLLM+
SGLang+
TGI+
LMDeploy+
BERT+
语音合成+
语音识别+
相关职位

logo of quark
社招3年以上技术类-开发

1、参与大模型超大规模任务离线训练的效率和稳定性提升的工作; 2、参与大模型在线inference吞吐/延迟优化,提升inference性价比的工作; 3、参与上述算力加速软硬件及平台体系化的设计和建设工作,支撑大模型能力建设和落地应用;

更新于 2025-09-08
logo of quark
社招2年以上技术类-算法

1. 操控万卡规模的 GPU 集群,对超大参数量级的预训练模型进行高效分布式训练与优化。 2.深度参与多模态(图像、语音、文本、视频)大模型的研发,探索多学科交叉领域的新奇玩法。 3.我们的技术将为夸克亿万用户提供高品质的AI智能服务,见证前沿技术实现真正的用户价值 加入我们,你将获得: 1.与顶级专家携手,以世界级算力资源和数据支持为背书,不断挑战技术极限。 2.极具竞争力的薪酬与福利,人性化、追求卓越技术的的工程师团队文化,助你在职业成长道路上全速前进。 3.在通往 AGI 的征途上,亲历关键技术的诞生与应用,留下属于你的时代印记。 如果你渴望驰骋在大模型与 AGI 的蓝海之中,那么这将是你的最佳舞台!快来加入我们,一同开创智能时代的新纪元。

更新于 2025-09-28
logo of quark
校招智能信息秋季20

1. 跨模态长程预训练:设计并实现文本、图像、视频等多模态对齐与融合的长程训练策略,操控万卡级 GPU 集群,协同 Pretrain / CPT / SFT / RLVR / RLHF 全链路,对超大参数基座模型进行高效分布式优化。 2. 前沿技术攻坚:深入探索 MoE 稀疏化、训练算法与对齐范式创新、可解释性与质量监控、多模态推理、mRAG、百万 Token 级长文处理、Agent&工具链机制等底层原理与技术。 3. 高性能训练框架持续升级:与系统团队共建张量并行、流水并行、混合精度等高性能训练框架,持续提升训练吞吐与稳定性。 4. 学术与行业影响力打造:快速跟踪 NeurIPS / CVPR / ACL 等顶会成果及开源项目,输出专利与论文,树立行业技术标杆 5. 高速驱动夸克AI相关业务:赋能夸克 AI 相机、AI 搜索·深度思考、DeepResearch、创意写作、AI 助手等核心产品,实现多模态能力的快速迭代与落地。 加入我们,你将获得 1. 顶尖资源:与行业专家并肩作战,万卡算力与海量数据随手可用,持续挑战技术天花板。 2. 高速成长:极具竞争力的薪酬福利与纯粹的工程师文化,为你的职业加速。 3. 时代机遇:亲历 AGI 关键技术的诞生与规模化应用,在智能时代留下你的名字。 如果你渴望驰骋于大模型与 AGI 的蓝海,这里就是你的最佳舞台。立即加入我们,共创智能新时代!

更新于 2025-08-13
logo of quark
社招2年以上技术类-算法

1. 跨模态长程预训练:设计并实现文本、图像、视频等多模态对齐与融合的长程训练策略,操控万卡级 GPU 集群,协同 Pretrain / CPT / SFT / RLVR / RLHF 全链路,对超大参数基座模型进行高效分布式优化。 2. 前沿技术攻坚:深入探索 MoE 稀疏化、训练算法与对齐范式创新、可解释性与质量监控、多模态推理、mRAG、百万 Token 级长文处理、Agent&工具链机制等底层原理与技术。 3. 高性能训练框架持续升级:与系统团队共建张量并行、流水并行、混合精度等高性能训练框架,持续提升训练吞吐与稳定性。 4. 学术与行业影响力打造:快速跟踪 NeurIPS / CVPR / ACL 等顶会成果及开源项目,输出专利与论文,树立行业技术标杆 5. 高速驱动夸克AI相关业务:赋能夸克 AI 相机、AI 搜索·深度思考、DeepResearch、创意写作、AI 助手等核心产品,实现多模态能力的快速迭代与落地。 加入我们,你将获得    1. 顶尖资源:与行业专家并肩作战,万卡算力与海量数据随手可用,持续挑战技术天花板。    2. 高速成长:极具竞争力的薪酬福利与纯粹的工程师文化,为你的职业加速。    3. 时代机遇:亲历 AGI 关键技术的诞生与规模化应用,在智能时代留下你的名字。 如果你渴望驰骋于大模型与 AGI 的蓝海,这里就是你的最佳舞台。立即加入我们,共创智能新时代!

更新于 2025-09-28