夸克千问C端事业群-千问&夸克-搜索业务研发专家-JAVA-北京
任职要求
1. 对搜索系统有浓厚的兴趣和2年以上工作经验,具有较强的问题抽象和动手能力,能够独立解决复杂系统问题; 2. 计算机相关专业本科及以上学历,扎实的编程基础、数理基础和预研能力,熟悉Linux开发环境,熟练使用Java语言,熟悉常用的各类中间件(数据库、消息、限流降级、缓存、监控等); 3. 具备扎实的计算机理论基础, 对数据结构及算法有较强的功底,熟悉io、多…
工作职责
1.负责夸克亿万用户的 query 推荐效果(sug、猜你想搜、相关推荐)与资源卡片的搜索/排序效果,持续提升核心指标(如 CTR、CVR、覆盖率 等)。 2.持续改进搜索系统平台的服务架构、核心策略或者核心技术等,保证系统高性能、高可用性和高可扩展性,支撑业务快速迭代及新模式的探索; 3. 能深入理解产品和业务,和产品、运营、测试迭代优化产品,支撑AI搜索等相关产品在夸克落地; 4. 负责夸克搜索相关业务 trace/debug/调研环境/机器学习等平台架构设计与开发; 5. 新技术预研,完成项目的选型和设计,难点攻坚。
1、负责高德出行场景(驾车,骑行,步行)的大模型应用框架开发,构建高可用、低延迟的分布式系统; 2、负责优化Agent决策引擎、任务调度、多模态数据处理等模块的性能与稳定性; 3、负责搭建Agent与外部系统(如数据库、API、第三方服务)的高效通信机制; 4、负责保障大模型应用系统架构的稳定、高效运行,帮助业务优化性能和改善系统稳定性; 5、负责协调业务资源,与大模型算法和数据源服务等团队协作,保障项目有效落地和需求高效交付。
团队背景:淘宝文本搜索算法团队是淘天集团内专注于创新和优化搜索技术的核心团队。我们的任务是通过持续研发高效、精准的搜索算法,以提升用户的在线购物体验和满意度,进而推动电商平台的商业成功。 工作职责 1. 和淘宝电商搜索业务紧密结合,设计和改进机器学习模型的架构,实现高效的搜索大型模型训练和推理系统(特别是大规模语言模型,GPT、LLaMA、通义千问等),确保其高效性和准确性,以提高计算性能和加速模型收敛 2. 进行搜索在线模型的性能分析和调优,识别和解决瓶颈问题,提高模型的训练和推理速度,以适应并充分利用硬件资源,确保在高效计算资源利用的前提下,提供快速响应的搜索业务体验 3. 应用不限于剪枝、量化、知识蒸馏、分布式计算(数据并行、模型并行、混合并行)等技术来优化模型的复杂度和运行速度,同时探索模型在样本、训练、存储和推理的极致性能 4. 和工程团队协同,实施并维护自动化工具和流程,以简化和加速模型训练和推理的部署过程 5. 研究最新的机器学习和深度学习技术,跟踪最新的研究进展和技术趋势,提出改进和创新的想法,推动团队的技术发展,并将其应用到淘宝搜索生产环境中 6. 参与设计和优化淘宝整体搜索系统,包括多阶段漏斗设计和整体链路设计,确保系统的稳定性和高效性
1. 行业解决方案设计与交付 - 基于阿里云大模型技术(如通义千问),为银行、保险、证券等金融客户量身定制AI大模型解决方案,覆盖AI财富助手、智能客服、智能风控等核心场景。 - 深入理解客户业务痛点,提供从需求分析、技术选型到方案落地的全流程支持,确保大模型技术与金融业务深度融合。 2. 大模型全生命周期技术赋能 - 主导客户侧大模型后训练(Post-training)、领域微调(Domain-specific Fine-tuning)、模型蒸馏(Distillation)及多模态融合优化,提升模型在金融垂直场景的精度及性能。 - 优化大模型训练与推理性能,包括分布式训练加速(如DeepSpeed、Megatron-LM)、显存优化、量化压缩(INT8/FP16)及低延迟推理部署(如vLLM、SGLang)等。 3. 工程化落地与性能调优 - 解决金融场景高并发、高稳定性需求,设计高性能计算架构,优化模型在GPU/TPU集群的训练效率及端到端推理链路。 - 结合金融行业数据隐私与安全要求,设计符合监管的模型部署方案。 4. 客户技术赋能与生态共建 - 面向客户技术团队提供大模型技术培训、实战工作坊及POC验证,推动AI能力在客户内部的规模化应用。 - 沉淀金融行业大模型最佳实践,输出白皮书、案例研究及标准化解决方案,提升阿里云在金融AI领域的市场影响力。