logo of xiaohongshu

小红书AI平台资深技术专家

社招全职3-5年引擎地点:北京 | 上海状态:招聘

任职要求


任职要求:
1、计算机相关专业本科及以上学历,具备扎实的计算机基础与工程能力。
2、熟练掌握 Java/Golang/Python 至少两门语言,有良好的架构设计与编码能力。
3、熟悉云原生技术栈(K8sDocker、微服务体系),具备平台系统研发经验。
4、了解深度学习训练/推理框架(如 PyTorch/TensorRT/ONNX)及大模型研发流程。
5、有 MLOps/平台工具链/模型服务化等方面实践经验,…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


我们是中台技术部大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势。其中 QuickSilver 大模型生产部署平台负责调度公司内所有稠密类模型训练与推理资源,基于自建训推引擎,为公司所有大模型算法同学提供端到端一站式AI服务,包括数据管理,模型管理,模型训练、压缩、推理、部署,服务管理,资源调度等一系列能力,持续赋能小红书社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地!
岗位职责:
1、负责大模型平台整体架构设计,构建高可用、高性能、可扩展的云原生体系。
2、主导大模型全流程 DevOps/MLOps 工程体系建设,打造端到端一站式平台能力。
3、推动训练框架、推理引擎、压缩工具链与平台深度集成,提升模型研发与发布效率。
4、负责平台核心模块研发(模型管理、任务管理、实验系统、评测与发布等)。
5、持续优化平台性能、稳定性与可观测性,支撑多模型、多业务的规模化生产需求。
6、跟踪并引入行业前沿 AI Infra 技术,推动平台能力和产品体验持续演进。
7、协同上下游团队进行必要的资源调度与自动化优化,共同提升算力效率。
包括英文材料
学历+
Java+
Go+
Python+
系统设计+
Kubernetes+
Docker+
还有更多 •••
相关职位

logo of tongyi
社招8年以上技术类-开发

1. 作为技术负责人,制定并推动多模态交互系统的端云整体工程架构演进路线,覆盖端侧推理、客户端集成、云端服务及协同策略。 2. 主导端侧AI推理框架的设计与优化,包括模型加载、算子加速、内存管理、功耗控制、异构计算(CPU/GPU/NPU)调度等,确保大模型在资源受限设备上的高效运行。 3. 负责Android客户端核心交互模块的架构设计与开发,包括多模态输入采集、实时通信、状态管理、离在线切换、异常恢复等关键能力。 4. 设计高并发、低延迟、可扩展的云端推理服务架构,支持语音识别、大模型生成、多模态融合等服务的弹性部署与动态扩缩容。 5. 构建端云协同机制,实现任务卸载、上下文同步、模型热更新、A/B测试等能力,提升系统整体鲁棒性与迭代效率。 6. 带领应用工程团队,负责关键技术方案评审、核心模块编码、性能压测、线上稳定性保障及团队技术能力建设。 7. 与算法、产品、芯片、测试及客户解决方案团队紧密协作,推动系统从原型验证到规模化商用落地。

更新于 2026-02-13北京|杭州
logo of aliyun
社招5年以上技术类-开发

阿里云专有云是面向政企行业客户的全栈云平台,为企业级客户(政府、金融、部委、央企等行业)提供产品和服务。该岗位主要负责专有云智算平台架构规划、系统设计及核心技术研发。核心职责包括: 1、主导智算平台的全栈架构设计。针对不同平台芯片/不同集群规模做整体方案设计,满足千卡/万卡集群高并发、低延迟、弹性可扩展等需求。 2、性能及稳定性优化,提升集群运行效率,不断提升技术竞争力。 3、跟踪前沿技术趋势,推动新技术落地应用。参与行业标准制定。

更新于 2025-05-22成都|北京|深圳
logo of cxmt
社招5年以上市场营销类

我们正在寻找一名资深系统技术工程师,负责推动与客户的技术合作,主导平台验证(AVL),并确保我司内存产品在服务器及PC生态中的无缝集成。该职位需具备CPU/内存架构的深厚技术能力、跨部门协作领导力,以及与核心客户战略协同的能力,以交付尖端内存解决方案。 系统集成与故障排除 1. 作为与工程团队的主要技术对接人,解决平台验证(AVL)中的兼容性问题,包括信号完整性优化、时序调优及BIOS/固件适配。 2. 主导内存相关故障(如开机失败、训练错误)的根因分析,并提供可落地的解决方案。 客户协作与产品支持 1. 与全球OEM/ODM客户协作定义服务器/PC项目的内存需求,确保符合JEDEC标准及平台特定限制条件。 2. 将客户需求转化为技术规格(如散热设计、功耗预算),并指导内部研发团队实现。 技术领导与路线图对齐 1. 追踪客户技术路线图,预判产品集成挑战并推动前瞻性设计调整。 2. 推广新兴技术(如RDIMM、MRDIMM),确保产品开发与行业趋势同步。 3. 主导应用笔记(Application Note)编写,用于问题/勘误说明。 项目管理与质量保障 1.负责端到端产品认证周期管理,协同验证实验室与质量团队确保符合JEDEC-209标准。 2. 对可制造性设计(DFM)及成本性能权衡进行风险评估。

更新于 2025-09-19合肥|上海|深圳
logo of shein
社招3年以上信息技术类

高级/资深后台开发/技术专家(AI算法工程化)-上海南京  1. 算法工程化支持:负责支持跨境治理和商品治理方向的算法工程化落地,包括算法服务化、模型部署、性能优化、A/B测试与监控体系搭建。 2. 系统开发与维护:基于Java与Python开发高性能、可扩展的算法平台和治理系统,保障算法稳定运行和高可用性。 3. 算法研发协同:与算法研究人员、产品经理紧密协作,推动图像理解、NLP、多模态及大模型等算法从研发到线上应用的全流程闭环。 4. 数据与质量评估:建设和维护治理效果数据采集、评估和监控体系,持续迭代优化模型与策略,驱动业务降本增效。 5. 技术方案创新:关注业界最新算法工程化与MLOps实践,推动内部平台能力升级,提升算法迭代效率。

更新于 2026-01-05上海|深圳|南京