TCLAI高级工程师
任职要求
1、全日制本科及以上学历,计算机、人工智能、软件工程、数据科学等相关专业优先; 2、具有3-5年及以上相关工作经验; 3、熟练使用 Python/Go/Java等编程语言之一进行开发,具备良好的编程习惯和代码管理能力,能独立负责模块级服务的设计与实现; 4、精通大语言模型相关技术栈,对 Context Engineering / Prompt Engineering / LangChain / LangGraph / LlamaIndex / TensorFlow / PyTorch 等框架有深入理解和实际项目经验; 5、熟悉PyTorch/TensorFlow等深度学…
工作职责
1.负责公司大模型智能体(Agent)应用的开发、优化与探索,包括但不限于多轮对话系统、RAG 检索增强生成、工作流自动化等; 2.主导生成式AI项目(如文本摘要、报告生成、内容创作)的落地,包括场景挖掘、方案设计、模型微调(SFT、LoRA)、工程部署与线上监控; 3.基于用户行为数据持续优化意图识别、感知、推荐等模型的效果,并主导模型的 A/B 测试与迭代; 4.关注大模型前沿技术,跟进业内最新研究进展,将创新思路转化为可落地的技术方案; 5.运营支持与数据跟踪:持续关注已推广AI应用的运行状态,跟踪使用率、节省工时等基础数据,并整理成报告; 6.知识文档沉淀:根据已知AI应用实际情况,撰写清晰的AI应用操作手册、推广流程等文档,参与建设和维护AI应用案例库。
1、负责海量高性能GPU/XPU卡的资源交付与一致性保障,涵盖万卡大模型训练、在线推理、在线搜索、推荐训练等不同业务场景的集群管理; 2、学习并深入了解GPU业务方的使用姿势和训练框架,掌握前沿AI大模型技术,解决超大规模场景下的稳定性挑战,涉及NvidiaH100、A100、昇腾、以及自研XPU等高性能卡型的使用; 3、构建自动化工程,确保生产环境的稳定性和资源在线率,及时发现并隔离故障GPU资源,提高资源流转效率; 4、通过优秀的工程架构设计,参与生产集群和服务的整个生命周期,满足可持续发展的需求并提高系统稳定性,包括架构规划、评审、设计、部署和上线等环节。
1、负责海量高性能GPU/XPU卡的资源交付与一致性保障,涵盖万卡大模型训练、在线推理、在线搜索、推荐训练等不同业务场景的集群管理; 2、学习并深入了解GPU业务方的使用姿势和训练框架,掌握前沿AI大模型技术,解决超大规模场景下的稳定性挑战,涉及NvidiaH100、A100、昇腾、以及自研XPU等高性能卡型的使用; 3、构建自动化工程,确保生产环境的稳定性和资源在线率,及时发现并隔离故障GPU资源,提高资源流转效率; 4、通过优秀的工程架构设计,参与生产集群和服务的整个生命周期,满足可持续发展的需求并提高系统稳定性,包括架构规划、评审、设计、部署和上线等环节。
1、负责海量高性能GPU/XPU卡的资源交付与一致性保障,涵盖万卡大模型训练、在线推理、在线搜索、推荐训练等不同业务场景的集群管理; 2、学习并深入了解GPU业务方的使用姿势和训练框架,掌握前沿AI大模型技术,解决超大规模场景下的稳定性挑战,涉及NvidiaH100、A100、昇腾、以及自研XPU等高性能卡型的使用; 3、构建自动化工程,确保生产环境的稳定性和资源在线率,及时发现并隔离故障GPU资源,提高资源流转效率; 4、通过优秀的工程架构设计,参与生产集群和服务的整个生命周期,满足可持续发展的需求并提高系统稳定性,包括架构规划、评审、设计、部署和上线等环节。