
哈啰【量天尺】大模型工程师-上海
任职要求
2. 算法能力:具备扎实的机器/深度学习、数据挖掘、统计建模等相关算法知识,熟悉常用算法(如分类、回归、聚类、推荐算法等); 3. 编程能力:精通 Python 或 Java 等编程语言,熟悉常见的数据分析和机器学习框架(如 TensorFlow、PyTorch、scikit-learn、lightGBM 等); 4. 数据处理:熟悉 SQL,具有处理海量数据的经验,具备一定的数据清洗、特征工程能力; 5. 业务理解:有较强的业务敏感性,能够将复杂的业务问题转换为实际的算法解决方案; 6. 创新能力:具备良好的逻辑思维和创新能力,能够快速学习新技术并应用到实际工作中; 7. 沟通能力:具有良好的跨部门沟通协作能力,能够推动策略算法的实施与优化; 加分项: ● 熟悉大模型、图算法、自然语言处理等前沿技术; ● 具有大规模分布式计算或高并发处理经验; ● 具备 A/B 测试、模型效果评估和调优的实践经验。
工作职责
我们希望你是 2024年11月-2026年10月 期间毕业的 博士/硕士研究生 同时也是: 学术先锋:在国内外顶刊/顶会上发表过重要学术论文(包括但不限于NeurIPS、ICML、CVPR、ICCV、ECCV 等顶会或 IEEE Transactions 系列核心期刊) 竞赛达人:在国内外顶尖赛事中取得优秀成绩(包括但不限于RoboMaster、Topcoder、Codeforces、ACM-ICPC、RoboCup) 实战高手:有自动驾驶、机器人、大模型基座,复杂Agent相关科研项目或实习经历(包括但不限于感知算法优化、决策模型开发,复杂多Agent的搭建等) 同频共振:理性务实、敢想敢干、渴望成功、乐观激进、聪明自省 工作内容 1. 算法设计与优化:根据业务需求,设计并优化推荐、定价、风险控制等策略算法,提升业务决策效率和效果; 2. 数据分析与建模:通过分析海量数据,提取用户行为特征,构建机器学习模型,解决业务场景中的实际问题; 3. 策略调优与迭代:基于线上策略表现,进行模型调优和迭代优化,持续提升算法的精度和效果; 4. 跨部门协作:与产品、运营、工程等团队紧密合作,推动策略在业务中的落地与实现; 5. 模型监控与维护:搭建策略模型的监控体系,确保模型的稳定性和实时性,及时处理模型的偏差与异常; 6. 前沿技术探索:持续关注和研究行业前沿的算法技术,并应用于业务场景。

我们希望你是 2024年11月-2026年10月 期间毕业的 博士/硕士研究生 同时也是: 学术先锋:在国内外顶刊/顶会上发表过重要学术论文(包括但不限于NeurIPS、ICML、CVPR、ICCV、ECCV 等顶会或 IEEE Transactions 系列核心期刊) 竞赛达人:在国内外顶尖赛事中取得优秀成绩(包括但不限于RoboMaster、Topcoder、Codeforces、ACM-ICPC、RoboCup) 实战高手:有自动驾驶、机器人、大模型基座,复杂Agent相关科研项目或实习经历(包括但不限于感知算法优化、决策模型开发,复杂多Agent的搭建等) 同频共振:理性务实、敢想敢干、渴望成功、乐观激进、聪明自省 工作内容: 1. 负责AI模型训练和推理流程的深度优化,包括多机多卡分布式训练方案,保障高效稳定的训练速度和推理性能,熟悉并应用TP/PP/DP/EP/ZeRO等分布式或并行优化策略,充分挖掘硬件性能。 2. 优化并行训练策略与分布式训练框架,提高模型可扩展性和集群资源利用率,解决分布式训练中的负载均衡、同步机制、通信瓶颈等问题。 3. 研究并实践模型压缩、量化(包括量化KV cache)、剪枝、FlashAttention等加速技术,缩短推理时延,降低部署成本,与算法团队合作,针对应用场景进行模型结构的裁剪和定制化。 4. 对接基础设施团队,优化集群算力、显存和带宽等资源的调度与使用效率,分析并持续降低训练和推理的总体计算成本。 5. 利用NVIDIA Nsight Compute和PyTorch Profiler等工具,深入分析模型性能瓶颈,挖掘硬件和算法的潜力。 6. 关注AI加速领域最新研究进展及产业动态,对新技术进行可行性评估与引入,主动探索并落地新型训练优化策略或加速引擎。

我们希望你是 2024年11月-2026年10月 期间毕业的 博士/硕士研究生 同时也是: 学术先锋:在国内外顶刊/顶会上发表过重要学术论文(包括但不限于NeurIPS、ICML、CVPR、ICCV、ECCV 等顶会或 IEEE Transactions 系列核心期刊) 竞赛达人:在国内外顶尖赛事中取得优秀成绩(包括但不限于RoboMaster、Topcoder、Codeforces、ACM-ICPC、RoboCup) 实战高手:有自动驾驶、机器人、大模型基座,复杂Agent相关科研项目或实习经历(包括但不限于感知算法优化、决策模型开发,复杂多Agent的搭建等) 同频共振:理性务实、敢想敢干、渴望成功、乐观激进、聪明自省 工作内容 从海量自动驾驶数据中重建三维场景,渲染、合成关键场景的训练和测试数据。你将参与到以下工作中: 1. 利用Nerf/GS等算法对路测数据进行重建,根据下游需求实现场景编辑和渲染; 2. 利用Diffusion、激光-视觉多模态等生成式模型算法,实现跨车道效果渲染,场景和谐化等功能; 3. 协助搭建仿真闭环渲染链路,支撑自动驾驶端到端模型的闭环训练和评测; 4. 跟踪和研究前沿学术成果,协同团队进行技术选型和创新。

我们希望你是 2024年11月-2026年10月 期间毕业的 博士/硕士研究生 同时也是: 学术先锋:在国内外顶刊/顶会上发表过重要学术论文(包括但不限于NeurIPS、ICML、CVPR、ICCV、ECCV 等顶会或 IEEE Transactions 系列核心期刊) 竞赛达人:在国内外顶尖赛事中取得优秀成绩(包括但不限于RoboMaster、Topcoder、Codeforces、ACM-ICPC、RoboCup) 实战高手:有自动驾驶、机器人、大模型基座,复杂Agent相关科研项目或实习经历(包括但不限于感知算法优化、决策模型开发,复杂多Agent的搭建等) 同频共振:理性务实、敢想敢干、渴望成功、乐观激进、聪明自省 工作内容 1.通过AI模型开发,完成智能驾驶所需要的感知、端到端VLA、世界模型等的开发及车端部署。 2. 跟踪最新的AI进展,在公司自有数据集上完成适配验证,完成AI模型选型; 3. 针对要开发的任务,完成数据方案制定、训练代码编辑、模型结构及loss优化、模型量化部署等; 4. 针对测试问题,设计模型改进方案,迅速修复问题;