蔚来实习-AI应用研发后端工程师
任职要求
1. LLM相关经验: 熟悉大语言模型(LLM)原理及工程化实践,对以下技术有认知或实践经验: RAG(检索增强生成):能够结合外部知识库优化模型输出质量; Planning(规划模块):参与过基于LLM的规划逻辑设计(如任务分解、路径规划等); Tooluse(工具调用):熟悉工具链集成(如API调用、数据库交互、外部系统对接); Memory(记忆模块):了解对话上下文管理或长期记忆存储的设计与实现; MCP(模型上下文协议):熟悉MCP协议,有模型协作、MCPService集成和多路调用经验; 2. 编程语言: Java:熟悉Spring Boot/Spring Cloud生态,了解微服务架构及分布式系…
工作职责
1. 参与基于大语言模型(LLM)的AI应用后端开发,包括核心逻辑设计、API接口开发及系统集成; 2. 研究并实践LLM相关技术(如RAG、Planning、Tooluse、Memory、MCP等),优化模型推理效率与业务适配性; 3. 设计并实现AI应用的后端架构,保障系统的高性能、高可用性及可扩展性; 4. 参与AI服务的部署、测试与性能优化,编写技术文档及维护代码; 5. 与算法团队协作,推动LLM模型在实际业务场景中的落地与迭代。
【课题说明】 面向C端用户的医药健康AI助手项目旨在重塑用户未来的看病范式,给用户提供AI问诊、对症找药、药品问答、医疗科普等多元化核心能力,在用户诊前、诊中、诊后的关键环节提供专业的医疗决策支持,从而促进线上看病一体化链路的打通,率先形成线上便捷+专业的看病入口。 【建议研究方向】 1.医药Agent技术架构设计:针对问病、问药、科普等场景分别建设专业的子Agent能力,并优化多Agent之间的协作逻辑,满足用户灵活的多轮对话交互需求。 2.模型自动化评测:从医学专业性和用户体验维度构建多维度benchmark,并探索Agent各能力项的Auto-Eval做法,提升模型评测效率和结果可靠性。 3.模型后训练技术:探索合成数据技术方案来快速积累高质量医疗训练数据,并通过SFT、强化学习等手段持续提升模型在医学问答、病情采集、疾病诊断、药品推荐等关键任务上的表现和泛化能力。
【我们是谁?】 阿里云智能是阿里巴巴集团的技术基石,致力于以在线公共服务的方式,提供安全、可靠的计算和数据处理能力。我们的团队专注于机器学习系统(MLSys)的前沿研究与工程实践,特别是为“通义”系列大规模语言模型(LLM)的训练、推理提供坚实的系统支撑。在这里,你将有机会参与构建和优化支撑万亿参数级别模型的超级工程,直接影响亿万用户的AI体验。 【为什么这个机会不容错过?——来自工业界的真实挑战与机遇】 大规模语言模型的研发是一项复杂的端到端系统工程。从海量数据的高效处理、万卡集群的分布式训练、精细化的后训练调优,到低延迟高吞吐的推理服务和云上弹性部署,每一个环节都充满了挑战,也孕育着巨大的创新机会。我们认为,虽然算法创新是驱动力,但在LLM的整个生命周期中,系统扮演着至关重要的角色。 以下是我们正在“通义”大模型及相关场景下积极探索并期待与你共同攻克的挑战: 1.超大规模预训练系统优化:追求极致效率与稳定性 ·系统行为的深度洞察:在万卡集群并行训练的极致规模下,如何设计高效、低侵扰的追踪系统(Tracing System)以精准理解系统真实运行状态,本身就是一个难题。例如,仅网络层追踪就面临数据量爆炸性增长的挑战,如何在海量数据中高效提取关键信息,指导性能优化。 ·并行策略的自动化与智能化:随着模型结构的快速迭代,如何针对新型架构自动设计并调整最优的并行策略(张量并行、流水线并行、数据并行、序列并行及其混合),在复杂的内存、计算、通信约束下取得最佳平衡,减少人工调优的巨大成本。 ·大规模集群的韧性与容错:尽管我们拥有先进的异步、跨多级存储的Checkpointing机制,但GPU集群的故障(硬件、软件、网络等)仍会导致训练中断和时间浪费。如何进一步提升系统的容错恢复能力,最大限度减少故障影响,保障训练任务的连续性和效率。 2.后训练(RLHF等)中的算法-系统协同设计:提升“智能”的性价比 ·复杂工作流的高效资源调度:后训练阶段(如RLHF)涉及采样、训练、评估等多个计算特点各异的任务。如何设计智能调度系统,自动、高效地为这些任务分配和管理计算、存储、网络资源,以最小化总体资源消耗,或最大化单位资源投入下模型效果的提升“斜率”。 ·算法与系统协同进化:后训练的算法仍在快速演进,如何设计灵活、可扩展的系统架构,以适应算法的不断变化,并反过来通过系统创新启发新的算法可能性。 3.云原生推理服务:敏捷、高效、经济地赋能万千应用 ·多样化业务负载与SLA保障:云上推理业务场景丰富,客户对吞吐量、延迟、成本等有着不同的服务等级协议(SLA)要求。如何设计统一而灵活的推理服务系统,满足从离线批量推理到在线实时服务的各种需求。 ·推理优化技术的敏捷集成与工程化:学术界和开源社区的推理优化技术(如量化、剪枝、FlashAttention、PagedAttention、投机采样、模型编译等)日新月异。如何构建一套敏捷的工程体系,快速评估、吸收、融合这些前沿技术,并将其稳定部署到在线服务中,持续提升推理效率。 ·极致的资源弹性与成本效益:在云环境中,如何通过精细化的资源调度、高效的多租户管理以及智能的流量预测,应对业务负载的剧烈波动,最大限度地减少空闲资源浪费,为用户提供最具成本效益的LLM服务。
在这里,你将成为AI时代前端技术的探索者与实践者,站在技术与业务的交汇点,创造令人惊叹的用户体验: 你将参与设计和构建AI增强的前端开发流程,将大模型能力与前端开发深度融合。 你将使用并优化AI辅助开发工具,大幅提升开发效率,并确保代码质量与性能。 你将与AI系统协作,将设计理念和业务需求转化为高质量的前端实现。 你将参与开发具有前瞻性的交互模式,打造AI时代的新型用户体验。 你将有机会设计和实现前端架构,构建支持AI能力的可扩展系统。 你将与多学科团队合作,共同探索AI与前端技术的创新融合点。 我们正在构建业内领先的AI研发模式,你将有机会参与这一变革过程,并成为其中的关键推动者。在这里,你将获得系统化的AI技术培训,接触最前沿的开发实践,与顶尖人才共同成长,在AI与前端技术的融合领域建立自己的专业优势,开创职业发展的全新可能。
T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 在这里,你将参与贡献大型电商场景下与音视频体验和成本相关的一系列研发工作; 在这里,你将参与视频编码(包括但不限于HEVC/VVC)优化:通过基于信号处理和机器学习的快速编码决策、数据结构、并行框架设计,优化编码速度,同时在有竞争力的视频编码内核基础上,探索基于语义的内容感知编码优化,深度学习编码,AIGC编码等前沿课题,在保障画质体验的前提下,尽可能节省带宽; 在这里,你将参与海量图像和视频的增强修复工作:运用前沿技术,包括但不限于模型结构优化、数据仿真和增强策略优化、知识蒸馏以及模型压缩,在限定带宽环境对任意失真的视频进行高效处理,力求最好的画质。同时,跟踪业界最新进展和技术趋势(包括AIGC)并融入特定的场景,提出创新方案,帮助平台提供逼近广电级别的视频画质; 在这里,你将参与视频编码与处理联合优化:在标准编码框架的基础上,借助AI领域的新技术成果来研究视频信号的表征、编码与处理,将视频前后处理与编码联合优化,提升端到端压缩效果; 在这里,你将参与美颜等视频美化技术的研究工作,包括人脸检测、关键点、肤色美白、面部塑形、化妆效果模拟等。这些技术将应用于直播和短视频等多样化场景,并确保其在真实视频场景的有效整合。你还将专注于基于3D人脸建模和AI算法的智能美颜技术,推动这些技术的大规模落地; 在这里,你将参与UGC视频生产剪辑依赖的多类当下最前沿的图像视频生成与编辑,包括图像风格化,人像分割与实例分割,人脸属性,图像可控生成,图像视频化等,为视频剪辑提供更丰富的素材和更多的玩法; 在这里,你将有机会参与最前沿的音视频质量评价算法工作,包括无参考的视频质量评价,人脸美学评价,音频质量评价,为多媒体算法的迭代和平台音画质的体验提供基础工具; 在这里,你将帮助淘宝直播等大型的视频传输场景设计QoS算法,追求超低延时、极速播放等用户体验,并支持各种弱网环境下的最优的视频流畅度和优雅的画质降级。 T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper ꔷ 投递T-Star实习生,提前解锁淘天顶级技术岗位,实习与T-Star正式批/应届秋招投递不冲突。拿到T-Star意向书的同时,将获得直通正式批次终面的机会;参与T-Star实习且表现优秀的同学,提供T-Star转正Offer。