logo of quark

夸克算法实习生-基础大模型方向(研究型)

实习兼职日常实习生地点:北京 | 杭州状态:招聘

任职要求


1.自然语言处理机器学习数据挖掘、人工智能等相关专业的硕士生/博士生;
2.熟练掌握 TensorflowPytorch深度学习框架,扎实的编程基础,具备独立的算法实现能力;
3.有 LLM 实操经验,参与过大模型 Pretrain,SFT,RL 等项目者优先;
4.良好的逻辑分析能力和数理基础,对算法原理及应用有较深入的理解,在人工智能相关的各类国际顶级会议/期刊中发表过论文者优先。

工作职责


1.负责包含文本、视频、图片、语音等多模态数据对齐的基础大模型核心技术研发,包括 Pretrain、SFT、RL 等,持续追踪和应用领域最新技术进展;
2.预训练:跟进和研发更先进的 foundation 模型结构、训练模式、scaling law,提高训练效率和优化关键问题(如推理、长序列能力,多模态融合); 
3.后训练:跟进和研发基座模型的后训练技术,充分激发模型潜力,包括但不限于高质量指令样本构建、课程学习、reasoning RL 等方向; 
4.应用:通过模型与场景的深度耦合,推进大模型能力在实际业务中的最优表达,构建具备长期价值的智能 Agent;
5.结合以上方向的探索和研究,撰写发表论文,和业界、学术界保持良好的交流。
包括英文材料
NLP+
机器学习+
数据挖掘+
TensorFlow+
PyTorch+
深度学习+
算法+
大模型+
SFT+
相关职位

logo of quark
实习日常实习生

1.负责指令型大模型(LLMs)核心技术研发,包括预训练、垂域SFT、RLHF等 2.负责推理型大模型(RLMs)核心技术研发,包括RL、ReFT等,持续追踪和应用领域最新技术进展; 3.严肃医疗诊疗方向的上限探索,用大模型辅助医学问题解决提效 4. 基于研究成果撰写高质量学术论文,积极参与业界交流活动,建立和维护学术界与产业界的合作关系。

更新于 2025-04-23
logo of quark
实习日常实习生

作为研究型实习生,你将加入公司大模型训练加速方向的研究团队,参与超大规模场景下,文本和多模态领域 pre/post/alignment 方向上的高效训练相关的 前沿策略和工程实现工作。该岗位以科研驱动为主,进行理论研究、策略设计、工程原型与实验评估,并鼓励发表顶会/期刊论文与开源贡献。 1、 研究RL场景加速技术,探索前沿的训推分离、梯度压缩、通信压缩、计算压缩 相关技术,改进RL场景不同模型的训练效率,提升e2e吞吐达到业界SOTA水平; 2、 研究前沿的pretrain加速技术,探索不同模态下的 IO/流水调度/算子融合/低精度量化 等加速策略,改进超大规模训练下训练效率,提升MFU; 3、研究大模型训练策略自动寻优技术,通过模型显存、计算、通信 自动化分析和模拟,实现不同模型在不同硬件、不同规模下的训练性能最大化; 4、将研究成果落地为可复现的工程原型,集成/对接业界主流的开源训练框架(megatron/veRL); 5、撰写技术报告与论文,与团队成员及外部学术界保持沟通交流;

更新于 2025-08-20
logo of amap
实习高德研究型实习生

业务丰富,技术领先 高德打车算法团队深度赋能打车业务全链路,涵盖 用户增长、风控、服务管控、路线与上下车点推荐、ETA 预估、智能客服 等核心场景。多样化的业务挑战为算法创新提供了广阔的发挥空间,团队已在 AI 顶级会议发表成果。 精英阵容,国际视野 团队成员来自泰晤士世界大学排名 Top 10 的高校,以及美国常青藤、清华、北大等顶尖院校,兼具国际化背景与一流技术视野。 持续成长,共享共进 团队每周固定进行技术分享,氛围开放、互助友好;除了解答算法与工程难题,资深同事还会分享项目经验,并传授业务理解与问题解决的方法论,助你快速成长。 我们正在寻找相关专业的优秀实习生,一同探索前沿大模型技术及推荐营销算法在共享出行领域的深度应用,共同攻克业界难题,优化产品体验。 在这里,你将参与高德共享出行核心业务的大模型技术落地、推荐营销算法建设等,包括但不限于: 大模型方向:将大模型技术深度应用在高德打车核心链路上,包括多模态大模型、AIGC、SFT、RLHF、高效推理等,提升平台效率和用户体验; 推荐营销方向:利用深度学习、基于大模型的下一代推荐营销算法等,基于海量用户数据,进行高德打车全链路的推荐营销算法构建和迭代,包括多任务学习、多场景建模、序列决策、因果推断建模、应答时长预测等; 在这里,你的算法将直接服务全国数亿级用户,带来真实而深远的影响;你能接触到前沿大模型、多模态、强化学习等核心技术,并与顶尖同事共创,在开放包容的创新氛围下,发挥AI创造力。

更新于 2025-09-25
logo of amap
实习高德研究型实习生

团队介绍 POI智能化使命是通过高质量高效率低成本的智能化手段及先进生产力,数字化还原真实世界POI,保障POI数据的时效性、正确性和完备性,作为高德用户信息获取、交易履约和出行体验的基础。每个POI背后都有精彩的故事,我们作为链接POI和用户的第一步,每一分努力都是与现实世界的一次互动。 职位描述 我们需要NLP和多模态大模型方向的算法工程师,负责对地图生产资料、互联网情报、搜索日志、用户反馈等非结构化文本进行分析和信息抽取,负责理解高德用户的到达行为,融合人地大数据,构建知识图谱和智能推理能力,打通数据生产和前台业务,使得用户获得更加智能的出行和服务体验。 1、参与和负责POI产线的NLP算法部分,包括POI的NLP基础功能服务、多模态名称融合生成、名称质检模块、名称纠错模块等; 2、搭建POI的NLP基础服务平台,实现以POI为核心实体的地图数据图谱,为高德的POI搜索、推荐业务提供完备信息; 3、配合其他POI采集、挖掘、调度、聚合业务,建模NLP任务,提供准确且有效的NLP信息; 4、积极地探索和研究NLP的应用和认知领域,结合地图场景,提供更加全面且完备的服务;

更新于 2025-08-01