logo of kuaishou

快手(大模型专项)高级Java开发工程师(平台方向)

社招全职3年以上D2863地点:北京状态:招聘

任职要求


1、本科及以上学历,3年及以上开发经验,优秀的设计与编码能力;
2、Java基础扎实,熟练掌握IO、集合、多线程等基础技术,对JVM原理有一定的了解;
3、掌握常用的后端开发技术和Web开发知识,熟悉MySQLRedis消息队列等常用中间件的使用;
4、加分项:了解AI基本原理,有AI算法的开发或者使用经验;有一定的Python开发经验。

工作职责


1、负责大模型相关的评测和标注平台研发,协同产品、QA、算法做好模型评测相关的工作;
2、参与模型评测方案的制定和评测数据集建设,搭建自动化的评测链路;
3、建设高效率、易使用的平台,不断优化系统架构,支撑业务规模增长,保障业务稳定。
包括英文材料
学历+
Java+
多线程+
JVM+
后端开发+
Web+
MySQL+
Redis+
消息队列+
中间件+
算法+
Python+
相关职位

logo of xiaohongshu
社招3-5年大模型

我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 1、负责大模型平台的架构设计和核心功能研发,构建云原生架构,设计高可用、高性能的微服务体系; 2、负责构建面向大模型全流程的DevOps,与下游云原生平台深度融合,支撑大模型在公司内各业务生产链路稳定高效地落地; 3、负责万卡规模GPU集群效能分析及优化,通过调度策略优化、在离线混部、GPU虚拟化、存储&网络加速等手段,提升GPU集群使用效率; 4、将平台和框架结合,通过任务调度、弹性容灾、性能优化等措施端到端提升AI生产效率,涉及k8s/kubeflow、网络通信、分布式训练等; 5、优化各AI平台性能,提升系统稳定性和可扩展性,保障大规模并发场景下的服务质量与用户体验; 6、持续研究分析业内创新AI平台产品,优化技术方案,改进产品功能,提升创新能力与产品体验。

更新于 2025-10-18
logo of antgroup
社招3年以上技术-开发

1. 负责蚂蚁推荐平台专项领域的深入优化。例如:在线服务性能提升、系统稳定性增强、特征查询效率优化等,持续提升用户体验和平台效率。 2. 负责大模型应用平台相关产品的架构和研发,解决大模型场景下推荐类平台的产品化落地与在线架构优化问题。推动大模型能力在实际业务中高效应用。 3. 负责大模型应用资源管理、稳定性保障、监控运维等基建能力,保障大模型应用可以高效迭代。 4. 参与到新技术和新业务方向的应用与落地,拓展个性化算法业务的边界。

更新于 2025-09-08
logo of bytedance
社招A155735

1、负责公司LLM大模型方向质量保障工作,具体包括但不限于LLM模型服务、LLM插件、LLM试用评估平台、LLM解决方案平台、LLM安全平台、稳定性、模型部署、训练、微调等方向; 2、构建大模型相关质量体系,参与变更管控、自动化测试、稳定性建设等质效专项; 3、基于工程和算法团队现有质效问题给出合理质效解决方案,推动落地提高交付质效; 4、能及时关注和学习,并探索新的大模型相关质效解决方案。

更新于 2025-03-07
logo of bytedance
社招RTGF1

1、负责公司LLM大模型方向质量保障工作,具体包括但不限于LLM模型服务、LLM插件、LLM试用评估平台、LLM解决方案平台、LLM安全平台、稳定性、模型部署、训练、微调等方向; 2、构建大模型相关质量体系,参与变更管控、自动化测试、稳定性建设等质效专项; 3、基于工程和算法团队现有质效问题给出合理质效解决方案,推动落地提高交付质效; 4、及时关注和学习,并探索新的大模型相关质效解决方案。

更新于 2019-12-30