腾讯技术研究-数据科学方向
任职要求
1、本科以上学历,数学、统计、运筹学、计算机、经济学、通信等相关专业; 2、严谨的逻辑思维能力和扎实的数理专业知识基础;掌握常见的统计分析、实验设计、机器学习等领域的基础理论; 3、具备优秀的编码能⼒,扎实的数据结构和算法功底,熟练掌握至少一种编程语言,Java、Scala、C++、R、Python等大数据基础工具的使用,能处理较大规模的数据; 4、优秀的分析问题和解决问题的能⼒,对解决具有挑战性问题充满激情; 5、熟悉机器学习、⾃然语⾔处理、数据挖掘中⼀项或多项,有相关实践项目经验者优先; 6、沟通表达清晰;高效的协作能力;积极主动、自驱力强;思维严谨、系统;批判性思维。 加分项 1、在相关领域的顶会或核心刊物上发表过高水平论文; 2、有相关实习经历; 3、在业界公认的主流竞赛中取得过排名靠前的比赛成绩。
工作职责
1、基于海量数据场景,参与业务数据分析及数据模型构建,驱动业务增长; 2、负责规划和搭建业务数据指标体系和分析体系,建设智能决策方法论,寻找业务收入增长点; 3、通过实验科学、因果推断等方法验证评估策略的效果和价值; 4、建设用户画像、构建特征工程实施方案,不断优化和改进数据模型,提升线上数据服务效果; 5、跟进业界最新的广告、推荐、NLP、复杂网络等领域进展,快速实现并应用于实际任务中。
1、基于海量数据场景,参与业务数据分析及数据模型构建,驱动业务增长; 2、负责规划和搭建业务数据指标体系和分析体系,建设智能决策方法论,寻找业务收入增长点; 3、通过实验科学、因果推断等方法验证评估策略的效果和价值; 4、建设用户画像、构建特征工程实施方案,不断优化和改进数据模型,提升线上数据服务效果; 5、跟进业界最新的广告、推荐、NLP、复杂网络等领域进展,快速实现并应用于实际任务中。
1、基于海量数据场景,参与业务数据分析及数据模型构建,驱动业务增长; 2、负责规划和搭建业务数据指标体系和分析体系,建设智能决策方法论,寻找业务收入增长点; 3、通过实验科学、因果推断等方法验证评估策略的效果和价值; 4、建设用户画像、构建特征工程实施方案,不断优化和改进数据模型,提升线上数据服务效果; 5、跟进业界最新的广告、推荐、NLP、复杂网络等领域进展,快速实现并应用于实际任务中。
1、基于海量数据场景,参与业务数据分析及数据模型构建,驱动业务增长; 2、负责规划和搭建业务数据指标体系和分析体系,建设智能决策方法论,寻找业务收入增长点; 3、通过实验科学、因果推断等方法验证评估策略的效果和价值; 4、建设用户画像、构建特征工程实施方案,不断优化和改进数据模型,提升线上数据服务效果; 5、跟进业界最新的广告、推荐、NLP、复杂网络等领域进展,快速实现并应用于实际任务中。
研究方向一:垂域LLM研究与构建 1.基座模型架构设计与优化:参与大语言模型基座架构的设计,研究前沿技术,如稀疏激活、混合精度训练等,同时优化模型的训练和推理流程。 2.技术创新与突破:参与前沿技术研究,如多任务学习、跨模态理解等,推动模型在复杂任务上的性能提升;探索Transformer替代架构,突破现有模型scaling law限制;同时挑战学术benchmark,为模型的性能树立新的行业标杆。 3.强化学习算法研究:参与大语言模型后训练阶段的强化学习算法研究,包括基于AI和环境反馈的强化学习(RLXF)算法。同时探索奖励模型与反馈机制,研究可泛化的细粒度过程监督和奖励建模,探索基于细粒度反馈的强化学习算法。 4.垂域模型定制化构建:领域认知智能突破,探索小样本场景自演进架构设计、可信推理机制构建等方向,同时建立面向AGI的模型评价体系新范式。 5.跨部门协作与落地:与公司数据科学家、算法工程师、产品团队紧密合作,将研究成果快速转化为实际应用,推动大语言模型在更多场景的落地。 研究方向二:垂域MLLM研究与构建 1.研究多模态表征与大语言模型融合的前沿技术,设计和实现创新算法,研究异质数据的统一编解码模型,适配多种模态下的特征统一,实现高效微调与优化。 2.探索强化学习(RL)在多模态大模型中的应用,包括强化学习增强的多模态生成、跨模态对齐、偏好建模及自适应优化,提升多模态理解与推理能力。 3.持续追踪多模态与强化学习结合的最新研究进展,优化现有多模态系统架构,提升性能、效率与可扩展性,推动多模态强化学习在智能体交互、决策推理等任务中的应用。 4.构建技术评估体系,通过多场景验证推动多模态理解、生成及强化学习优化策略的落地应用,提升多模态大模型的泛化能力和实际应用价值。 研究方向三:基于角色扮演的虚拟数字助理 1. 角色扮演技术(Role-Playing):通过模型优化、Agent构建,在人设、拟人性、情感等取得显著提升。 2. 记忆管理与增强(Memory):通过模型长上下文,记忆抽取与管理,提升系统的记忆能力。 3. 个性化技术:通过用户行为数据挖掘与建模,结合多轮对话上下文理解,分析用户情感状态,提升模型的个性化回复能力。 4. 基于Agent的数字助理:通过Agent构建和基于RL的优化,实现数字助理的能力复刻和增强