百度模型训练平台组_机器学习架构工程师(J82075)
任职要求
-计算机相关专业(人工智能,模式识别,计算机科学,数学等),具备搜索系统、广告系统、点击率预估系统等方向相关工作经验者优先,熟悉GPU编程者优先 -较强的工程或算法实现能力,熟悉Pytorch、Megatron-LM、D…
工作职责
-参与计算广告深度学习和大模型LLM的训练框架、特征工程、模型优化等方面工作, -搭建全流程模型工程链路,并技术落地商业搜索、推荐等业务场景 -负责模型训练与特征工程领域相关技术方向的架构设计、技术方案的设计和难点攻关 -提升系统高吞吐、高并发、高稳定能力,保存团队和方向的技术先进性
-模型能力优化:面向百度搜索业务进行基础模型优化,包括但不限于 MoE 稀疏化策略、预训练任务设计、Post-Training 任务优化,基于强化学习的推理能力增强等工作 -模型成本优化:通过优化 MoE 路由策略、Latent Attention 结构优化等手段,提升推理效率,降低部署成本 -算法研究与创新:组内工作发表于 ACL/NeurIPS/ICLR 等会议,积极跟踪学术界和工业界技术进展,设计并实现相关算法创新,推动搜索基础模型的持续进步 -跨团队协作:与数据科学家、架构工程师等跨职能团队紧密合作,确保算法方案能够有效落地
- 模型能力优化:面向百度搜索业务进行基础模型优化,包括但不限于 MoE 稀疏化策略、预训练任务设计、Post-Training 任务优化,基于强化学习的推理能力增强等工作 - 模型成本优化:通过优化 MoE 路由策略、Latent Attention 结构优化等手段,提升推理效率,降低部署成本 - 算法研究与创新:组内工作发表于 ACL/NeurIPS/ICLR 等会议,积极跟踪学术界和工业界技术进展,设计并实现相关算法创新,推动搜索基础模型的持续进步 - 跨团队协作:与数据科学家、架构工程师等跨职能团队紧密合作,确保算法方案能够有效落地
1、负责各类AIGC技术在游戏项目中工程落地,需要你对于各类AIGC技术保持热爱和好奇,同时拥有资深的软件工程经验。包括但不限于:负责组内算法的工程落地,确保服务快速搭建、线上稳定、易维护; 2、参与低代码ai工作流平台建设(类Langflow),实现ai算法的便捷调试和快速落地; 3、大模型应用:数据集构造(对话、RLHF等)、高效微调(Lora/P-Tuning/RLHF)、推理部署、应用(Prompt工程、检索增强、LangChain、Langflow等)、新模型探索(LLama/Falcon/miniGPT4); 4、深入transformer、stable diffsion等算法+pytorch、tf原理,研究并行训练、算法工程加速。
1、基于企业核心业务需求,设计、开发、优化Al Agent,赋能公司内部AI应用场景。 2、深入分析企业业务流程,具备独立的需求分析与方案设计能力,能够独立完成Al Agent需求对接、方案开发与优化等工作; 3、负责Agent任务流编排,持续优化Prompt Engineering、知识增强(RAG) 、强化学习等策略,提升Agent在复杂业务场景下的表现; 4、评估并优化Al Agent交互体验,通过持续调优提高自然语言理解能力及生成内容的精准度,并沉淀相关经验; 5、设计完整的测试方案,包括人工测试和机器测试等,组织相关方参与测试并验证测试结果,不断调优测试方法; 6、参与搭建企业级Al Agent平台,基于Dify (或Langchain等其他开发平台)快速集成与管理多种主流AI模型(商业与开源大模型),实现Agent灵活编排、调用与优化; 7、参与Al Agent运行架构设计,优化数据流转、权限管理、任务调度等关键模块,确保系统的高效性与可扩展性; 8、与公司数据安全部门和合规部门密切合作,在满足业务效果的同时,确保Al Agent的数据安全和隐私保护符合合规要求;