logo of bytedance

字节跳动医疗大模型多模态算法研究员-搜索-筋斗云人才计划

校招全职A135939地点:北京状态:招聘

任职要求


1、获得博士学位,人工智能、计算机、数学相关专业优先;
2、优秀的代码能力、数据结构和基础算法功底,熟练掌握C/C++Python编程语言;
3、熟悉计算机视觉(CV)相关的算法和技术,对MLLM中模型结构、ViT训练、Detail Caption等方向有深入理论研究和实践;
4、有自然语言处理NLP)、大模型训练和强化学习(RL)算法经验者优先。

加分项:
1、有ICMLICLRNeurIPS、ACL、CVPR等顶级学术会议发表过有影响力研究成果的优先;
2、在ACM/ICPC、NOI/IOI、Kaggle等编程/AI比赛获奖者优先;
3、主导、参与过AI相关的开源/闭源项目的优先。

工作职责


团队介绍:字节跳动搜索团队主要负责抖音、今日头条、西瓜视频等产品的搜索工程、算法创新和架构研发工作。我们的职责是用前沿的技术去打造一个用户体验佳、信息效率高的搜索引擎产品。我们的愿景是做一款用户首选的搜索引擎,我们的使命是可以充分整合内容,高效连接人与信息。 团队主要负责抖音、今日头条、西瓜视频、问答和百科等产品的业务研发和架构研发工作。 我们使用前沿的前端、客户端和服务端技术赋能于搜索业务的快速迭代,并在技术上不断创新和突破。同时专注于大流量、高并发、低延时的搜索系统的构建,在性能优化上,追求从内存、Disk等优化到业务架构和网络协议的创新探索,在迭代效能上不断探索容器化、动态化、搭建化等方案的创新,技术氛围强,充分给同学们提供自我成长的机会。

课题介绍:
课题主题:医疗大模型多模态理解能力、业务效果提升。
课题挑战:通过合成数据、Detail Caption、Grounding等方面提高模型在医疗患处图片、报告等不同数据的理解能力;在模型训练范式、模型结构、数据配比探索最佳实践方案,取得业务效果大幅提升的同时实现前沿技术突破;通过强化学习方法提升医疗科普/问诊等业务场景效果,探索理想态的CoT、LongCoT样本,激发医疗模型的深度思考能力;围绕Rule Base Reward、PRM、ORM等方法并结合GRPO/PPO等算法进行强化激发,提升模型的泛化能力。

1、负责医疗领域大模型的预训练、SFT、强化训练,模型性能达到业界领先水平;
2、对模型在业务场景中的效果负责,将模型成功落地应用并在业务中取得实际收益;
3、调研大模型方向尤其是医疗领域的前沿技术方案,持续提升部门关键技术竞争力。
包括英文材料
学历+
数据结构+
算法+
C+
C+++
Python+
OpenCV+
NLP+
大模型+
强化学习+
ICML+
NeurIPS+
CVPR+
Kaggle+
相关职位

logo of bytedance
社招A62121A

团队介绍:字节跳动搜索团队主要负责抖音、今日头条、西瓜视频等产品的搜索工程、算法创新和架构研发工作。我们的职责是用前沿的技术去打造一个用户体验佳、信息效率高的搜索引擎产品。我们的愿景是做一款用户首选的搜索引擎,我们的使命是可以充分整合内容,高效连接人与信息。 团队主要负责抖音、今日头条、西瓜视频、问答和百科等产品的业务研发和架构研发工作。 我们使用前沿的前端、客户端和服务端技术赋能于搜索业务的快速迭代,并在技术上不断创新和突破。同时专注于大流量、高并发、低延时的搜索系统的构建,在性能优化上,追求从内存、Disk等优化到业务架构和网络协议的创新探索,在迭代效能上不断探索容器化、动态化、搭建化等方案的创新,技术氛围强,充分给同学们提供自我成长的机会。 课题介绍: 课题主题:医疗大模型多模态理解能力、业务效果提升。 课题挑战:通过合成数据、Detail Caption、Grounding等方面提高模型在医疗患处图片、报告等不同数据的理解能力;在模型训练范式、模型结构、数据配比探索最佳实践方案,取得业务效果大幅提升的同时实现前沿技术突破;通过强化学习方法提升医疗科普/问诊等业务场景效果,探索理想态的CoT、LongCoT样本,激发医疗模型的深度思考能力;围绕Rule Base Reward、PRM、ORM等方法并结合GRPO/PPO等算法进行强化激发,提升模型的泛化能力。 1、负责医疗领域大模型的预训练、SFT、强化训练,模型性能达到业界领先水平; 2、对模型在业务场景中的效果负责,将模型成功落地应用并在业务中取得实际收益; 3、调研大模型方向尤其是医疗领域的前沿技术方案,持续提升部门关键技术竞争力。

更新于 2025-05-28
logo of sensetime
社招算法研究

1. 负责大语言模型、多模态大模型(文本、图像、语音等)的核心算法研发,包括模型 SFT微调、强化学习后训练、推理优化等关键环节,持续提升模型的效果、效率与稳定性。 2. 跟踪国内外大模型领域的前沿技术(如 Transformer 架构改进、多模态融合技术等),并结合业务场景进行技术调研与创新落地。 3. 针对具体业务需求(如智能客服、内容生成、代码辅助等),设计训练数据处理与清洗、大模型微调、强化学习后训练方案,解决实际业务问题。 4. 通用智能体框架设计与开发,智能体虚拟环境搭建,智能体基座模型的SFT后训练和强化学习后训练。 5. 与工程开发、产品设计等团队紧密协作,推动大模型技术从研发到产品化的全流程落地,输出技术文档与方案说明。

更新于 2025-09-24
logo of bytedance
实习A232878A

团队介绍:字节跳动搜索团队主要负责抖音、今日头条、西瓜视频等产品的搜索工程、算法创新和架构研发工作。我们的职责是用前沿的技术去打造一个用户体验佳、信息效率高的搜索引擎产品。我们的愿景是做一款用户首选的搜索引擎,我们的使命是可以充分整合内容,高效连接人与信息。 团队主要负责抖音、今日头条、西瓜视频、问答和百科等产品的业务研发和架构研发工作。 我们使用前沿的前端、客户端和服务端技术赋能于搜索业务的快速迭代,并在技术上不断创新和突破。同时专注于大流量、高并发、低延时的搜索系统的构建,在性能优化上,追求从内存、Disk等优化到业务架构和网络协议的创新探索,在迭代效能上不断探索容器化、动态化、搭建化等方案的创新,技术氛围强,充分给同学们提供自我成长的机会。 课题介绍: 课题主题:医疗大模型多模态理解能力、业务效果提升。 课题挑战:通过合成数据、Detail Caption、Grounding等方面提高模型在医疗患处图片、报告等不同数据的理解能力;在模型训练范式、模型结构、数据配比探索最佳实践方案,取得业务效果大幅提升的同时实现前沿技术突破;通过强化学习方法提升医疗科普/问诊等业务场景效果,探索理想态的CoT、LongCoT样本,激发医疗模型的深度思考能力;围绕Rule Base Reward、PRM、ORM等方法并结合GRPO/PPO等算法进行强化激发,提升模型的泛化能力。 1、负责医疗领域大模型的预训练、SFT、强化训练,模型性能达到业界领先水平; 2、对模型在业务场景中的效果负责,将模型成功落地应用并在业务中取得实际收益; 3、调研大模型方向尤其是医疗领域的前沿技术方案,持续提升部门关键技术竞争力。

更新于 2025-02-28
logo of bytedance
社招A136438

1、参与医疗领域大模型的预训练、SFT、强化等工作,使模型效果位于业界领先水平; 2、调研大模型前沿技术方案,在模型训练范式、模型结构、数据配比探索最佳实践方案,取得业务效果大幅提升的同时实现前沿技术突破; 3、探索理想态的CoT、LongCoT样本,结合GRPO/PPO等算法进行强化激发,提升模型的泛化能力。

更新于 2025-03-03