logo of baidu

百度工业解决方案架构师实习生(大模型&AI)(J85824)

实习兼职ACG地点:上海状态:招聘

任职要求


1、计算机科学、信息技术、人工智能或相关领域研究生;
2、熟悉人工智能领域相关技术概念与知识,例如机器学习、人工智能芯片、计算机视觉自然语言处理等;
3、具备人工智能技术服务B端企业客户的相关实习…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、参与重要客户及重点行业的需求调研及分析;
2、参与人工智能、大模型应用等国内外趋势发展分析;
3、协助团队及时掌握内部产品及技术咨询,更好地支持客户交流;
4、协助团队进行关键材料的输出、团队间沟通协调、会议组织、日常管理工作等支持;
包括英文材料
机器学习+
OpenCV+
还有更多 •••
相关职位

logo of aliyun
实习阿里云研究型实习

【我们是谁?】 阿里云智能是阿里巴巴集团的技术基石,致力于以在线公共服务的方式,提供安全、可靠的计算和数据处理能力。我们的团队专注于机器学习系统(MLSys)的前沿研究与工程实践,特别是为“通义”系列大规模语言模型(LLM)的训练、推理提供坚实的系统支撑。在这里,你将有机会参与构建和优化支撑万亿参数级别模型的超级工程,直接影响亿万用户的AI体验。 【为什么这个机会不容错过?——来自工业界的真实挑战与机遇】 大规模语言模型的研发是一项复杂的端到端系统工程。从海量数据的高效处理、万卡集群的分布式训练、精细化的后训练调优,到低延迟高吞吐的推理服务和云上弹性部署,每一个环节都充满了挑战,也孕育着巨大的创新机会。我们认为,虽然算法创新是驱动力,但在LLM的整个生命周期中,系统扮演着至关重要的角色。 以下是我们正在“通义”大模型及相关场景下积极探索并期待与你共同攻克的挑战: 1.超大规模预训练系统优化:追求极致效率与稳定性 ·系统行为的深度洞察:在万卡集群并行训练的极致规模下,如何设计高效、低侵扰的追踪系统(Tracing System)以精准理解系统真实运行状态,本身就是一个难题。例如,仅网络层追踪就面临数据量爆炸性增长的挑战,如何在海量数据中高效提取关键信息,指导性能优化。 ·并行策略的自动化与智能化:随着模型结构的快速迭代,如何针对新型架构自动设计并调整最优的并行策略(张量并行、流水线并行、数据并行、序列并行及其混合),在复杂的内存、计算、通信约束下取得最佳平衡,减少人工调优的巨大成本。 ·大规模集群的韧性与容错:尽管我们拥有先进的异步、跨多级存储的Checkpointing机制,但GPU集群的故障(硬件、软件、网络等)仍会导致训练中断和时间浪费。如何进一步提升系统的容错恢复能力,最大限度减少故障影响,保障训练任务的连续性和效率。 2.后训练(RLHF等)中的算法-系统协同设计:提升“智能”的性价比 ·复杂工作流的高效资源调度:后训练阶段(如RLHF)涉及采样、训练、评估等多个计算特点各异的任务。如何设计智能调度系统,自动、高效地为这些任务分配和管理计算、存储、网络资源,以最小化总体资源消耗,或最大化单位资源投入下模型效果的提升“斜率”。 ·算法与系统协同进化:后训练的算法仍在快速演进,如何设计灵活、可扩展的系统架构,以适应算法的不断变化,并反过来通过系统创新启发新的算法可能性。 3.云原生推理服务:敏捷、高效、经济地赋能万千应用 ·多样化业务负载与SLA保障:云上推理业务场景丰富,客户对吞吐量、延迟、成本等有着不同的服务等级协议(SLA)要求。如何设计统一而灵活的推理服务系统,满足从离线批量推理到在线实时服务的各种需求。 ·推理优化技术的敏捷集成与工程化:学术界和开源社区的推理优化技术(如量化、剪枝、FlashAttention、PagedAttention、投机采样、模型编译等)日新月异。如何构建一套敏捷的工程体系,快速评估、吸收、融合这些前沿技术,并将其稳定部署到在线服务中,持续提升推理效率。 ·极致的资源弹性与成本效益:在云环境中,如何通过精细化的资源调度、高效的多租户管理以及智能的流量预测,应对业务负载的剧烈波动,最大限度地减少空闲资源浪费,为用户提供最具成本效益的LLM服务。

更新于 2025-06-03杭州|上海
logo of digitalchina
校招

1.大模型微调与优化 基于业务场景需求,主导7B/14B等参数量级大模型的微调全流程,涵盖数据清洗、算法选择(如LoRA/QLoRA)、量化压缩(INT4/INT8)及部署优化 设计参数高效微调方案,优化模型推理效率与成本,推动RAG技术栈(向量数据库/检索增强)在业务中的落地 跟踪前沿技术(如Diffusion模型、多模态微调),探索模型轻量化与领域适配的创新方案 2.AI Agent开发与系统集成 构建基于LLM的智能体架构,实现任务规划、记忆管理、工具调用等核心功能,开发符合业务逻辑的Agent交互系统 集成LangChain、LlamaIndex等开发框架,实现AutoGPT式自主决策能力,优化Agent在复杂场景下的鲁棒性 推动Agent与数字孪生、数字员工等技术的融合,提升工业检测、智能客服等场景的自动化水平 3.客户需求转化与方案落地 深度参与客户需求分析,将业务场景(如制造、金融、医疗)转化为可执行的AI技术方案,提供端到端咨询服务 输出技术文档与API接口,支持跨部门协作与客户侧的技术培训 监控模型生产环境表现,针对客户反馈持续迭代优化,确保SLA达成与成本可控

更新于 2025-09-23北京
logo of digitalchina
校招

1.大模型微调与优化 基于业务场景需求,主导7B/14B等参数量级大模型的微调全流程,涵盖数据清洗、算法选择(如LoRA/QLoRA)、量化压缩(INT4/INT8)及部署优化; 设计参数高效微调方案,优化模型推理效率与成本,推动RAG技术栈(向量数据库/检索增强)在业务中的落地; 跟踪前沿技术(如Diffusion模型、多模态微调),探索模型轻量化与领域适配的创新方案。 2.AI Agent开发与系统集成 构建基于LLM的智能体架构,实现任务规划、记忆管理、工具调用等核心功能,开发符合业务逻辑的Agent交互系统; 集成LangChain、LlamaIndex等开发框架,实现AutoGPT式自主决策能力,优化Agent在复杂场景下的鲁棒性; 推动Agent与数字孪生、数字员工等技术的融合,提升工业检测、智能客服等场景的自动化水平。 3.客户需求转化与方案落地 深度参与客户需求分析,将业务场景(如制造、金融、医疗)转化为可执行的AI技术方案,提供端到端咨询服务; 输出技术文档与API接口,支持跨部门协作与客户侧的技术培训; 监控模型生产环境表现,针对客户反馈持续迭代优化,确保SLA达成与成本可控。

更新于 2025-09-24上海
logo of kuaishou
社招1-3年J0011

1、参与亿级用户规模的本地生活搜索优化,负责迭代到店业务搜索算法,包括到餐、到综、酒旅等,提升点击率、转化率等核心指标,提升用户在快手的本地生活搜索购物体验,促进生态良性发展; 2、参与机器学习与深度学习算法的核心研发工作,对本地生活搜索全链路进行建模优化,包括但不限于召回、相关性、粗排、精排、机制等方面,深度进行序列建模、迁移学习、强化学习、对比学习、多模态大模型等的算法和系统研发; 3、针对海量用户行为数据,提供基于分布式计算的算法解决方案,大幅提升算法计算规模和性能; 4、深入思考产品业务价值,参与制定及落实团队在技术、业务等多维度发展方向。

更新于 2026-03-31北京