logo of tongyi

通义通义实验室-技术专家-模型服务

社招全职3年以上技术类-开发地点:北京 | 杭州状态:招聘

任职要求


1、计算机/人工智能相关专业硕士及以上学历,熟悉python/java/C++ 编程语言;
2、对深度学习机器学习算法有一定的经验,有使用pytorch/tensorflow机器学习框架的经验, 有算法框架研发经验的优先;
3、具有良好的系统设计能力, 能够设计可扩展、高效的系统架构;
4、具备出色的问题解决能力,能够快速定位并解决技术难题;
5、有强烈的责任心,具备良好的沟通能力、执行力及团队合作精神。

工作职责


1、模型服务API: 开发实现端到端的模型服务,涵盖LLM/VL/embedding/rerank等大语言模型, 也包含diffusion model方向的生图生视频的模型服务,构建高效的服务框架提升模型接入效率, 优化端到端服务性能,确保稳定性;
2、百炼大模型开发平台上各领域模型服务架构设计迭代、性能优化以及核心服务开发;
3、百炼大模型开发平台模型微调、模型评测技术架构设计、算法开发以及对应业务能力建设。
包括英文材料
学历+
Python+
Java+
C+++
深度学习+
机器学习+
算法+
PyTorch+
TensorFlow+
系统设计+
相关职位

logo of tongyi
社招3年以上技术类-开发

1、设计并实现高性能AI原生网关。构建低延迟、高并发的API网关系统,支持多模态、多协议接入,为国内及全球客户提供灵活、安全、可扩展的流量接入方案,提供完整的数据面控制与可观测能力; 2、打造智能推理调度与资源管理系统。设计并实现面向复杂分布式推理场景的请求调度和资源调度系统,结合动态负载特征与异构硬件资源,持续优化请求分发策略;建设Serverless化资源调度架构,实现资源的弹性伸缩与极致利用率提升; 3、构建先进的MLOps平台能力。深度优化模型服务的CI/CD流程,推动算法研发到生产部署的自动化与标准化;实现模型版本管理、灰度发布、监控告警、性能分析等全生命周期管理能力,提升迭代效率与系统稳定性。

更新于 2025-09-15
logo of tongyi
社招3年以上技术类-开发

1、负责大模型应用和系统整体架构设计与演进,打造具备弹性调度能力、服务稳定、低延迟响应的全链路应用和系统; 2、主导平台的 DevInfra 能力建设,覆盖代码提交、CI/CD、灰度发布、可观测性、异常诊断与系统治理等关键模块,提升研发交付效率; 3、优化业务、平台、应用的架构设计,持续提升平台能力与技术领先性。

更新于 2025-08-14
logo of aliyun
社招3年以上云智能集团

1. 行业解决方案设计与交付 - 基于阿里云大模型技术(如通义千问),为银行、保险、证券等金融客户量身定制AI大模型解决方案,覆盖AI财富助手、智能客服、智能风控等核心场景。 - 深入理解客户业务痛点,提供从需求分析、技术选型到方案落地的全流程支持,确保大模型技术与金融业务深度融合。 2. 大模型全生命周期技术赋能 - 主导客户侧大模型后训练(Post-training)、领域微调(Domain-specific Fine-tuning)、模型蒸馏(Distillation)及多模态融合优化,提升模型在金融垂直场景的精度及性能。 - 优化大模型训练与推理性能,包括分布式训练加速(如DeepSpeed、Megatron-LM)、显存优化、量化压缩(INT8/FP16)及低延迟推理部署(如vLLM、SGLang)等。 3. 工程化落地与性能调优 - 解决金融场景高并发、高稳定性需求,设计高性能计算架构,优化模型在GPU/TPU集群的训练效率及端到端推理链路。 - 结合金融行业数据隐私与安全要求,设计符合监管的模型部署方案。 4. 客户技术赋能与生态共建 - 面向客户技术团队提供大模型技术培训、实战工作坊及POC验证,推动AI能力在客户内部的规模化应用。 - 沉淀金融行业大模型最佳实践,输出白皮书、案例研究及标准化解决方案,提升阿里云在金融AI领域的市场影响力。

更新于 2025-09-15
logo of baidu
社招ACG

-负责多模态数据解析、知识加工、RAG等算法的实现,针对落地场景中遇到的实际问题进行算法改进与效果提升 -负责大模型(语言模型、多模态模型、CV大模型等)后预训练/微调/对齐等场景的数据工程;根据项目需求,研发训练数据处理的算子和Pipeline,以用于模型的训练和效果验证 -作为大模型技术专家,为ToB企业提供大模型服务,尤其是与数据相关的行业know-how -对前沿技术和需求敏锐洞察,通过技术创新推动产品成长

更新于 2025-02-19