腾讯混元大模型预训练算法研究员/专家研究员
任职要求
1.熟练掌握Python,熟悉Linux环境开发,精通应用深度学习框架TensorFlow或者PyTorch; 2.持续跟进前沿的深度学习技术,了解前沿的深度学习相关算法,熟悉Transformer等模型结构; 3.具备分析问题定义问题和解决问题能力,具备持续的自驱力来面对挑战; 4.有大规模模型预训练实践经验者或有较强的研究能力在机器学习领域顶级会议发表过高质量论文者优先。
工作职责
1.负责生成式大模型预训练相关的工作,包括但不限于:大规模模型预训练,长文本预训练,线性模型结构探索; 2.探索与跟进前沿技术,寻求技术突破,推动机器在AIGC能力的提升和突破; 3.探索高效的模型知识嵌入方法以及模型知识在线学习更新; 4.探索promptengineering,充分挖掘大模型知识。
1.跟踪业界最新的语音生成算法研究,探索下一代语音、音频生成新范式,拓展语音生成边界能力; 2.探索多模态语音大模型的前沿技术,结合文本、语音、视觉等技术提升语音交互体验; 3.负责语音大模型的技术研发工作,推动模型性能提升与创新应用。
1.负责大语言模型在知识问答能力上的算法设计优化及实现工; 2.建设RAG体系,对RAG链路中的重要模块进行优化,提升模型的性能效果; 3.调研业界前沿算法,追踪最前沿的技术动态,并应用在相关的项目中; 4.参与产品讨论,基于技术对产品提出改进建议。
1.负责大语言模型在知识问答能力上的算法设计优化及实现工; 2.建设可信RAG体系,包括全网站、号一体化可信内容理解,建设质量&权威体系,优化内容索引、排序、RAG效果; 3.调研业界前沿算法,追踪最前沿的技术动态,并应用在相关的项目中; 4.参与产品讨论,基于技术对产品提出改进建议。
1.业务需求洞察与转化:; 2.深入对接业务线(如算法团队、司内业务部门),理解大模型在应用场景中的业务痛点,输出产品需求文档并推动优先级共识; 3.深入分析行业痛点(如客服、内容生成、3D建模等),输出定制化解决方案,推动产品适配性优化; 4.平台能力构建与体验提升:; 5.主导设计大模型全生命周期管理功能,涵盖数据标注、模型训练、效果评测、部优化等环节的核心模块,构建大模型全生命周期管理闭环,重点突破高并发训练、分布式推理、多模态模型兼容等能力; 6.设计面向开发者的低门槛工具链(如可视化Prompt编排、一键式模型微调),提升平台DAU/留存率; 7.端到端功能交付与落地; 8.独立负责功能从PRD设计到上线的全流程管理,协调研发、测试、算法团队资源,确保技术方案与业务目标的强对齐; 9.建立关键指标(如模型迭代周期、资源利用率、用户满意度),通过数据验证功能价值; 10.主导交付后的用户培训、反馈收集及问题闭环; 11.跨团队协同与项目管理; 12.推动业务方、工程团队、算法团队三方协作; 13.推动太极在腾讯生态产品(如微信、腾讯文档、腾讯会议)中的深度合作与能力共建。