快手(大模型专项）高级Java开发工程师（平台方向）

社招全职3年以上D28632025-02-12地点：北京状态：招聘

扫码手机上打开

任职要求

1、本科及以上学历，3年及以上开发经验，优秀的设计与编码能力；
2、Java基础扎实，熟练掌握IO、集合、多线程等基础技术，对JVM原理有一定的了解；
3、掌握常用的后端开…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、负责大模型相关的评测和标注平台研发，协同产品、QA、算法做好模型评测相关的工作；
2、参与模型评测方案的制定和评测数据集建设，搭建自动化的评测链路；
3、建设高效率、易使用的平台，不断优化系统架构，支撑业务规模增长，保障业务稳定。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

Java+

多线程+

JVM+

后端开发+

Web+

还有更多 •••

登录查看完整学习资料

相关职位

高德-Agent后端开发工程师/专家-出行业务

社招2年以上技术类-地图

团队介绍：我们团队为用户提供满足各种出行场景的好路线，提供极致的出行体验，同时服务C端、B端，涵盖自驾、打车、物流等多种业务场景，我们的每一次技术升级或业务的改进都能影响全国用户，有非常复杂的高并发分布式服务系统架构，有业界最先进的路线规划算法（cbr,cch,rch,raptor等)。如果你想发挥你的想象力创造更多社会价值，如果你享受克服困难和挑战自我的喜悦，如果你热爱技术并喜欢追求极致性能和效果，如果你渴望挖掘出源源不断的新应用场景，那就加入我们团队吧！岗位职责：你将加入高德在线导航服务团队，从0到1参与打造手车一体的「出行域 Agent」。目标体验对标特斯拉车机中的 Grok：让用户可以用自然语言完成从出行规划、实时导航到行程中各类决策的全流程交互，实现“能听懂、会思考、帮决策、可执行”的智能出行助手。工作职责： 1.子Agent架构设计与服务实现 a)参与设计出行域子Agent的整体技术架构，包括调用链路、状态管理、容错与降级方案。 b)实现与高德主Agent的协议对接和能力编排，支持多轮对话、工具调用、跨场景任务协同。 c)在手机端与车机端统一能力出口下，处理不同终端、不同地区/国家的差异化需求（如地图/POI/法规差异）。大模型微调与蒸馏落地 2.针对出行/导航/车机场景，设计与构建高质量训练数据（提示词工程、对话数据、工具调用日志等）。 a)参与或主导对基础大模型的大规模微调（Supervised Fine-tuning / Preference Optimization 等），提升在出行域的理解和决策能力。 b)负责模型压缩、蒸馏与推理优化，使模型在服务端/边缘侧兼顾效果与时延。 3.Agent能力调优与决策优化 a)设计和优化子Agent的工具使用策略（Tool / Function Calling），包括路况查询、路线规划、POI 检索、多目的地规划、国际场景信息调用等。 b)在弱网、高并发、复杂上下文下优化Agent的鲁棒性和决策稳定性。 c)针对复杂出行任务（如跨城自驾、多目的地行程、充电/加油规划、实时绕行、国际出行规则差异）进行专项调优。 4.效果评测与质量体系构建 a)搭建出行Agent的自动化评测框架，包括：指令理解准确率、工具调用正确率、任务成功率、响应时延、用户反馈闭环等。 b)构建离线评测集和真实流量回放机制，持续追踪模型与系统升级带来的收益和风险。 c)联合产品与运营，通过灰度发布、A/B 实验驱动持续优化。 5.性能与稳定性保障 a)在9亿+月活与车机大规模接入背景下，对服务进行高可用、高性能设计（限流、降级、缓存、异步架构、观测性体系）。 b)处理线上复杂问题（流量波动、模型异常、工具依赖故障等），建立监控、告警和自愈机制。 6.前沿技术探索与工程化落地 a)跟踪 LLM、Agent、RAG、多Agent协作、规划与推理（Planning & Reasoning）、多模态等方向的最新进展，并筛选适合出行场景的技术方案。 b)探索将地图/导航结构化数据与大模型结合的最佳实践，让Agent真正“看得懂地图、懂路况”。

更新于 2026-03-31北京

高德-Agent后端开发工程师/专家-出行业务

社招2年以上技术类-地图

更新于 2026-03-31北京

AI平台高级研发工程师（大模型专项）

社招3-5年大模型

我们是小红书中台大模型 Infra 团队，专注打造领先易用的「AI 大模型全链路基础设施」！团队深耕大模型「数-训-压-推-评」技术闭环，在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势，基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品，持续赋能社区、商业、交易、安全、数平、研效等多个核心业务，实现 AI 技术高效落地！ 1、负责大模型平台的架构设计和核心功能研发，构建云原生架构，设计高可用、高性能的微服务体系； 2、负责构建面向大模型全流程的DevOps，与下游云原生平台深度融合，支撑大模型在公司内各业务生产链路稳定高效地落地； 3、负责万卡规模GPU集群效能分析及优化，通过调度策略优化、在离线混部、GPU虚拟化、存储&网络加速等手段，提升GPU集群使用效率； 4、将平台和框架结合，通过任务调度、弹性容灾、性能优化等措施端到端提升AI生产效率，涉及k8s/kubeflow、网络通信、分布式训练等； 5、优化各AI平台性能，提升系统稳定性和可扩展性，保障大规模并发场景下的服务质量与用户体验； 6、持续研究分析业内创新AI平台产品，优化技术方案，改进产品功能，提升创新能力与产品体验。

更新于 2025-10-23北京|上海|杭州

蚂蚁集团-推荐平台高级开发工程师-杭州

社招3年以上技术-开发

1. 负责蚂蚁推荐平台专项领域的深入优化。例如：在线服务性能提升、系统稳定性增强、特征查询效率优化等，持续提升用户体验和平台效率。 2. 负责大模型应用平台相关产品的架构和研发，解决大模型场景下推荐类平台的产品化落地与在线架构优化问题。推动大模型能力在实际业务中高效应用。 3. 负责大模型应用资源管理、稳定性保障、监控运维等基建能力，保障大模型应用可以高效迭代。 4. 参与到新技术和新业务方向的应用与落地，拓展个性化算法业务的边界。

更新于 2025-09-08杭州