夸克算法实习生 - 医疗方向(研究型)
任职要求
1. 自然语言处理、机器学习、数据挖掘、人工智能、计算机等相关专业的硕士生/博士生; 2. 熟练掌握Tensorflow、Pytorch等深度学习框架,扎实的编程基础,具备独立的算法实现能力; 3. 有成果发表在SIGGRAPH/CVPR/ICCV/ECCV/NeurIPS/AAAI /ICASSP/ACL等国际会议/期刊者优先; 4. 有LLM/MLLM/AIGC相关经验优先。
工作职责
1.负责指令型大模型(LLMs)核心技术研发,包括预训练、垂域SFT、RLHF等 2.负责推理型大模型(RLMs)核心技术研发,包括RL、ReFT等,持续追踪和应用领域最新技术进展; 3.严肃医疗诊疗方向的上限探索,用大模型辅助医学问题解决提效 4. 基于研究成果撰写高质量学术论文,积极参与业界交流活动,建立和维护学术界与产业界的合作关系。
1.负责指令型大模型(LLMs)核心技术研发,包括预训练、垂域SFT、RLHF等 2.负责推理型大模型(RLMs)核心技术研发,包括RL、ReFT等,持续追踪和应用领域最新技术进展; 3.多模态泛健康AIGC的创意玩法探索,以及细粒度可控、不同输入条件下的内容生成技术研究等 4.严肃医疗诊疗方向的上限探索,用大模型辅助医学问题解决提效
研究领域: 推荐系统 项目简介: 当前医疗信息搜索推荐服务面临三大核心挑战:1)搜索结果与用户真实需求匹配度低(准确性不足);2)推荐内容缺乏个性化适配(未考虑用户病史、症状特征等个体差异);3)医疗信息可信度验证机制缺失(存在误导风险)。本项目将融合大规模预训练语言模型、动态知识图谱和医学循证规则,重点突破以下方向: 研究医疗领域大模型精准语义理解与意图识别技术 构建多维度用户画像与个性化推荐算法体系 开发基于医学循证的可信度验证与风险预警机制
研究领域: 人工智能 项目简介: 目前,大模型应用已经非常普遍,比如对话系统、AI搜索、智慧医疗、金融理财等场景。伴随着业务场景越来越丰富,大模型的迭代周期也越来越短。如何能在较短的周期内,进行快速迭代,成了各大厂的迫切诉求。在迭代过程中,如何快速评估大模型的效果,是一个非常关键的环节。 为了更好的对大模型开展评测,指导大模型进行快速、正确的迭代,我们需要聚焦以下关键的问题:1)评测对象;2)评测数据集;3)评测方法;4)评测结论反馈。 因此,本项目旨在用大模型算法,通过数据挖掘和自动化评测的技术手段,解决大模型迭代过程中的评测问题。研究方向涵盖语言大模型评测、多模态大模型评测、结构化问答评测等。
自然文本生成是大语言模型在应用落地时最具前景的方向之一,文本摘要、文本扩写和文本润色等能力可以将用户从繁重枯燥的文宇工作中解放出来,显著提高用户的工作效率和行业的生产效率。本项目旨在探索自然文本生成还存在以下若干难题: 1)知识注入的问题:大语言模型需要高质量的数据进行训练,然而现有的通用和行业数据体系的构建相对落后,我们希望通过创新的算法从大量原始的、质量参差不齐的数据中自动挑选高质量数据进行训练,同时通过数据浓度和学习进度的调控平衡大语言模型在各个方向的文本生成能力; 2)知识应用的问题:部分行业如政务、医疗对生成文本的相关度和真实性有很高的要求,然而大语言模型在理解长文本和生成长文本时,存在抓不住重点和生成幻觉的问题; 3)知识评估的问题:文本生成的内容目前仅能依靠人工的方式进行评测,限制了评测的范围和算法迭代的速度。我们希望模型辅助评测的方式,实现半自动乃至全自动的评测。