优酷算法工程师(大模型)
任职要求
1、自然语言处理、机器学习、数据挖掘、人工智能等相关专业优先考虑; 2、熟练掌握Tensorflow、Pytorch等深度学习框架,扎实的编程基础,熟练掌握C++语言优先,并具备独立的算法实现能力; 3、有模型结构相关调优、强化学习方向优化经验的优先; 4、有LLM实操经验,参与过大模型预训练,SFT, RLHF等项目者优先; 5、良好的逻辑分析能力和数理基础,对算法原理及应用有较深入的理解,在人工智能相关的各类国际顶级会议/期刊中发表过论文者优先。
工作职责
1、负责大模型在query深度理解(语义推理/意图识别/实体识别/文本纠错)、多语言翻译等方向的算法突破,持续提升生成质量与任务泛化能力; 2、设计LLM的规划-推理-反思技术闭环,研发复杂任务拆解、因果推断、自我纠错等能力,通过思维链(CoT)优化和自洽性增强提升模型高阶认知水平; 3、基于优酷搜索场景数据提供技术解决方案,探索业界前沿技术在业务中的落地与指标优化。
1-与各业务、产品、工程团队配合,在京东亿量级的数据与丰富的业务应用场景中不断进行深入的大模型算法研究和模型构建; 2-参与到京东大模型的相关业务场景中,包括但不限于大模型对话、大模型生成式推荐、大模型生成式检索、大模型语义理解、大模型商品理解、大模型图像生成、大模型视频生成等内容; 3-与京东的技术团队及科学家们一同参与大模型算法及应用的前沿研究,助力业务提升效率,实现京东技术愿景和战略。
1. 负责大模型相关的后训练技术研发,支持 SFT、DPO 和 RL 相关的技术研发,参与 RAG、Agent、用户意图理解等技术的研发; 2. 负责大模型在 OS、小布助手、AI 搜索等场景的应用,支持问答、内容创作、推荐搜索等领域的落地; 3. 跟进业界前沿技术,持续提升团队在自然语言处理领域的技术积累。
1、负责大模型在query深度理解(语义推理/意图识别/实体识别/文本纠错)、多语言翻译等方向的算法突破,持续提升生成质量与任务泛化能力 2、设计LLM的规划-推理-反思技术闭环,研发复杂任务拆解、因果推断、自我纠错等能力,通过思维链(CoT)优化和自洽性增强提升模型高阶认知水平 3、基于优酷搜索场景数据提供技术解决方案,探索业界前沿技术在业务中的落地与指标优化
我们是饿了么AI算法团队,工作涉及:外卖垂域大模型训练、Agent和AI产品创新、图片理解与生成、视频语音多模态等方面,围绕餐饮/零售/医药等业务,紧密支撑搜索、推荐、营销、用增、toB等多场景的AI需求。 具体职责包括但不限于: 1、参与大语言模型、AIGC(图片/视频)生成大模型、多模态模型工作,包括数据收集与处理、预训练和领域持续预训练、提示与指令设计、SFT与RL对齐、通用&应用能力的训练。 2、参与AI应用项目的研发工作,让AI能力落地取得收益,比如在智能搜索、导购体验、下单效率、AI点餐、图片素材、视频素材、创意生成等,支撑搜索/推荐/营销/用增/供给等多个场景。 3、具备一定的AI Infra能力,基于大模型底层训练平台和业界主流框架,来训练和调优模型。能够参与到底层模型工程团队的训练推理加速、资源优化等工作中,有CUDA算子优化经验者优先。 4、AI技术日新月异,对前沿技术敏感;能及时跟进并消化吸收前沿技术,将其转化为实际生产力,包括且不限于NLP、CV、搜推广营销等领域;有一定的学术能力,能跟业界、学界保持良好的交流。