logo of jd

京东针对电商垂直领域长推理能力的后训练

校招全职多模态大模型与应用方向地点:北京状态:招聘

任职要求


1、 获得本科及以上学历,具有扎实的机器学习NLP、RL基础和出色的探索能力,在ACL/EMNLP/NAACL/NeurIPS/ICML/ICLR等顶级会议上发表论文者优先;
2、在Post-Training方向有一定基础,熟悉SFT/DPO/PPO/Reward Model等Pipeline…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、针对电商垂直领域构建基座模型强化学习后训练框架(RL-based Post-training),专注提升复杂商业场景下的长链推理能力(Long Reasoning);
2、设计电商专用的推理链(CoT)分解机制,将复杂商业逻辑拆解为可训练的中间步骤;
3、构建电商场景下长推理能力Benchmark评估集。
包括英文材料
学历+
机器学习+
NLP+
ACL+
EMNLP+
NeurIPS+
ICML+
还有更多 •••
相关职位

logo of bytedance
社招3年以上A05640

1、负责抖音电商垂直行业产品,专注垂直领域端到端的搜索解决方案; 2、负责抖音电商搜索垂直行业体验优化,保证该方向能有良好循环迭代机制; 3、理解电商搜索垂直领域用户需求和痛点,建立垂直行业领先的产品形态,并针对垂直搜索需求制定合理的样式和策略; 4、了解电商搜索垂直场景用户和供给的差异化,联动行业和商家,建立垂直电商搜索解决方案,满足垂直场景用户需求。

更新于 2023-10-12上海
logo of bytedance
社招3年以上A242987

1、负责抖音电商垂直行业产品运营,专注垂直领域端到端的搜索解决方案; 2、负责抖音电商搜索垂直行业体验优化,保证该方向能有良好循环迭代机制; 3、理解电商搜索垂直领域用户需求和痛点,建立垂直行业领先的产品形态,并针对垂直搜索需求制定合理的样式和策略; 4、了解电商搜索垂直场景用户和供给的差异化,联动行业和商家,建立垂直电商搜索解决方案,满足垂直场景用户需求。

更新于 2024-10-31北京
logo of bytedance
社招A235407

1、数据挖掘:负责领域知识和训练数据的构建与维护,利用数据飞轮机制不断优化数据质量和丰富度,提升模型性能和应用效果; 2、大模型训练:针对业务需求进行大模型的继续训练(CT)、有监督微调(SFT)和强化学习,以及多模态模型训练,实现模型在垂直领域的深度适配,与业务专家合作,构建和优化结构化的提示词系统,利用COT等先进技术增强大模型的推理能力,高效、精准解决实际问题; 3、信息检索:开发和优化Query理解、语义索引、相关性排序等技术,提升RAG的效果,实现大模型与知识库的深度融合,基于领先的智能体框架,运用并增强大模型的推理、对话和反思能力,解决复杂业务问题; 4、大模型评测:制定和实施全方位的大模型评估方案,结合人工评估和自动化评估手段,建立完整的评测体系,确保模型性能的可靠性和稳定性; 5、用户增长:通过强化学习、用户增长等技术,优化对话策略,提高用户的平台使用体验和长期复购率,实现业务的可持续增长; 6、应用落地:深入理解业务痛点,定义问题解决方案,设定任务标准和目标,通过持续的技术创新和优化,实现最佳的业务效果和用户体验。

更新于 2024-08-06上海
logo of bytedance
社招A118293

1、数据挖掘:负责领域知识和训练数据的构建与维护,利用数据飞轮机制不断优化数据质量和丰富度,提升模型性能和应用效果; 2、大模型训练:针对业务需求进行大模型的继续训练(CT)、有监督微调(SFT)和强化学习,以及多模态模型训练,实现模型在垂直领域的深度适配,与业务专家合作,构建和优化结构化的提示词系统,利用COT等先进技术增强大模型的推理能力,高效、精准解决实际问题; 3、信息检索:开发和优化Query理解、语义索引、相关性排序等技术,提升RAG的效果,实现大模型与知识库的深度融合,基于领先的智能体框架,运用并增强大模型的推理、对话和反思能力,解决复杂业务问题; 4、大模型评测:制定和实施全方位的大模型评估方案,结合人工评估和自动化评估手段,建立完整的评测体系,确保模型性能的可靠性和稳定性; 5、用户增长:通过强化学习、用户增长等技术,优化对话策略,提高用户的平台使用体验和长期复购率,实现业务的可持续增长; 6、应用落地:深入理解业务痛点,定义问题解决方案,设定任务标准和目标,通过持续的技术创新和优化,实现最佳的业务效果和用户体验。

更新于 2024-08-06北京