百度高级自然语言/大模型策略工程师(J83523)
任职要求
-教育背景:计算机科学、人工智能、自然语言处理或相关专业硕士及以上学历 -工作经验:3-5年NLP或大语言模型相关工作经验,有主导过大型项目的经验 -技术能力: -精通Python编程和常用深度学习框架(PyTorch/TensorFlow) -深入理解大语言模型(如GPT、LLaMA等)的原理及应用 -丰富的大语言模型训练、微调和部署经验 -熟悉RLHF、DPO等先进模型调优技术 -有智能对话系统或内容生成产品的实战经验 -领域知识: -扎实的机器学习和自然语言处理理论基础 -熟悉Pro…
工作职责
-高级自然语言策略工程师,负责设计和优化基于大语言模型的产品策略落地,将前沿研究应用到真实业务场景中,为数百万用户提供卓越的文小言APP智能体验。 -策略设计与研发:基于大语言模型的核心产品策略设计与研发,制定技术路线图,推动创新解决方案落地 -模型训练与调优:基于RLHF等强化学习方法的大语言模型训练和精细化调优方案,提升模型在多场景下的表现 -自动化工具开发:构建和完善语料自动生成和智能标注系统,提升数据生产效率和质量 -用户行为分析:执行用户行为数据分析工作,构建用户意图识别和理解模型,优化产品决策机制和交互体验 -策略评估框架:建立科学的策略评估体系,包括离线评测和在线A/B测试方案,指导产品持续迭代优化 -跨团队协作:与产品、研发、设计等团队紧密协作,将先进NLP技术转化为产品竞争力,推动业务增长 -团队指导:指导初级工程师和实习生,提供技术指导和职业发展建议,提升团队整体技术水平
【】 - 主导设计与研发:负责基于大语言模型(LLM)的核心信息解析引擎,聚焦于深层语义理解、意图识别与多模态知识抽取。 - 构建前沿模型:架构并实现业界领先的NLP算法模型,持续优化模型性能,挑战信息提取任务在准确性、效率与泛化能力上的极限(SOTA)。 - 探索技术边界:追踪并引入NLP及AIGC领域的前沿技术(如RAG、Fine-tuning策略、AI Agent等),探索其在业务场景中的创新应用,构建公司技术护城河。 - 垂域探索:探索大语言模型(LLM)在酒店垂域下的推荐应用。 - 驱动技术落地:与产品、工程团队紧密协作,推动算法方案从原型验证到生产环境的完整生命周期,确保技术方案的稳定、高效与可扩展性。 【
1. 多模态大模型研发与落地: - 负责工业视觉质检领域多模态大模型的构建、训练与优化,解决传统CV模型在复杂背景、小样本、零样本缺陷的识别率低的问题。 - 研究并应用多模态融合技术(如图像+文本描述、图像+参数),提升模型对工业缺陷的语义理解与泛化性能,同时实现工业缺陷的自然语言描述生成和智能问答。 - 搭建面向大模型的质检数据生产与清洗的pipeline,包括高质量图文对齐数据的构建、合成数据生成等,并设计模型效果评估体系,驱动算法的持续迭代与优化。 - 针对工业场景的实时性与高精度要求,负责大模型的轻量化部署与推理加速(如量化、剪枝、蒸馏)。 2. 质检Agent智能体构建: - 负责设计并主导研发面向工业视觉质检场景的智能Agent,具备多模态理解能力,能够融合图像、文本(如工艺标准SOP)、传感数据等信息,实现对缺陷的自动化判定、描述、归因及溯源。 - 构建面向质检场景的Agent工作流(Workflow),包括任务规划(模型自动择优等)、节点调用(训练任务的全流程、工具搭建业务流等等)、结果反馈。 - 负责构建并维护质检领域的专业知识库(RAG),结合向量数据库技术,提升Agent在特定缺陷场景下的准确性和可解释性。 3. 大模型微调与优化: - 针对工业质检的小样本、长尾分布问题,设计并实施高效的大模型微调策略(如LoRA、P-Tuning等),提升模型在特定质检任务上的识别检出能力。 - 持续跟进多模态大模型、AIGC、Agent等领域的最新前沿技术进展,并引领团队进行技术预研和创新,探索其在工业缺陷检测中的应用潜力。
智能客服算法工程师 负责智能客服相关的自然语言处理研发,打造领先的智能人机交互系统,服务于全球用户。 1、FAQ和智能问答算法的研发,包括文本匹配、向量化召回等; 2、对话管理算法和技术的研发,包括对话状态跟踪、对话策略优化等; 3、意图理解和槽位识别的研发,包括文本分类、序列标注等; 4、文本生成算法研发, 包括大语言模型预训练、微调等; 5、大语言模型应用研发, 包括提示工程、检索增强、Agent等;