logo of alibaba

阿里巴巴1688-模型推理架构师-杭州

社招全职3年以上地点:杭州状态:招聘

任职要求


1. 计算机或者相关专业本科及以上学历,3年以上模型部署/推理优化经验;有大模型(如Transformer系列)部署经验者优先;有电商搜索推荐、广告系统工程方向经验优先;
2. 精通Python/C++,熟悉PyTorch/TensorFlow等框架的模型导出与加速工具链(如ONNX、TensorRT、OpenVINO);熟悉CUDA编程、并行…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 大模型部署与性能优化:负责电商搜索推荐场景下的常规深度模型和大模型(如LLM、多模态模型等)高效部署,优化推理性能,提升吞吐量并降低延迟;探索模型压缩(如量化、剪枝、蒸馏)、动态批处理(Dynamic Batching)、显存优化等技术,降低线上服务成本;
2. 工程化落地与调优:结合业务需求,优化模型在GPU/CPU异构计算环境下的推理效率,解决显存溢出、计算瓶颈等问题;实现模型服务与现有电商系统的无缝集成,确保高可用性和稳定性;
3. 跨团队协作与创新:与算法团队紧密合作,推动模型从训练到部署的全流程优化,平衡效果与性能;调研前沿技术(如vLLM、Triton Inference Server、FlashAttention等),探索在1688电商场景的落地可能性;
包括英文材料
学历+
大模型+
Transformer+
Python+
C+++
还有更多 •••
相关职位

logo of antgroup
社招3年以上技术-开发

作为 AI 技术架构师,你的职能是聚焦底层产品化与原型搭建,抽象基础模型,推理模型,多模态模型的能力落地为创意 demo,原型产品,甚至是标准化 API / SDK,吸引外部开发者使用并让开发者认可模型能力。要做到这些,我们需要你: ● 具有强技术创新能力,具有发散思考和跨界思考能力,愿意快速验证新技术路径; ● 快速学习与调优能力,能适应高速演变的 AI 技术生态; ● 具有敏锐的模型能力边界感知,能针对模型的独特优点设计出产品封装路径; ● 具备一定代码能力,能搭建并交付 demo,封装模型与 API,快速打造 demo 类型的产品原型; ● 具备技术输出能力,能通过代码,demo,技术 workshop 等方式,引导用户通过产品原型领悟模型价值; ● 具备一定的对外技术演讲能力或技术写作能力,能将技术品味充分表达并打造共识;

更新于 2025-08-26杭州
logo of alibaba
社招3年以上技术类-开发

团队介绍 天猫淘宝海外搜推导购技术团队承担了平台多端的搜索及推荐两大导购体系的技术平台和相关业务研发。你所加入的团队目前承担了数十亿用户搜索和推荐请求,解决国际跨境及本地市场搜索、推荐以及模型计算方面的挑战。 我们目前正致力于挖掘数据的价值,研发面向全球消费者端的创新搜索产品,提升消费者的搜索体验及效率。国际化是集团的重点方向之一,国际化业务的飞速发展需要有经验有想法有能力的研发工程师和架构师能够加入我们队伍,来一起打造更好的搜索推荐体系。 职位描述 1.负责研发及持续优化面向消费者端的搜索&推荐产品,提升用户搜索体验及效率、推荐的准确率 2.参与搜索架构的设计与研发工作,持续改进搜索系统平台的服务架构、核心算法或者核心技术等,保证系统高性能、高可用性和高可扩展性,支撑业务快速迭代及新模式的探索。 3.领导天猫淘宝海外平台跨团队协作的项目,保证项目如期交付并给用户带来价值; 4.新技术预研,完成项目的选型和设计,难点攻坚。

更新于 2025-10-10杭州
logo of weibo
社招3年以上新浪&微博

1.负责公司核心推荐系统的架构设计、算法优化和性能调优 2.负责GPU/CPU训练框架性能优化,提升模型训练效率 3.设计和开发高性能的GPU/CPU推理服务架构,优化服务耗时,充分利用GPU高算力特性 4.理解业务需求,能够快速响应并实现业务中的推荐功能 5.熟悉大型分布式系统架构设计,有良好的系统设计和实现能力 6.探索业界先进推荐算法,并设计落地实现

更新于 2025-11-05杭州
logo of aliyun
社招8年以上技术类-开发

1.结合业务需求以及相关云产品的设计方案及部署依赖,完成智算交付项目的方案设计及中间技术问题跟进,保障项目按时按量完成 2.智算基础设施的下一代架构设计,保持云基础设施的技术先进性、可靠性 3.智算产品实例相关AI特性的技术演进规划,提升AI领域的产品竞争力 4.参与智算产品业务讨论,提供前瞻技术性的技术趋势判断及业务建议,针对产品需求快速组织研发poc,来对齐产品目标,保证产研目标一致

更新于 2025-06-18杭州