logo of jd

京东 SQL数据分析计算代码的生成实现与应用

校招全职大数据方向地点:北京状态:招聘

任职要求


1、获得本科及以上学历,计算机、人工智能、自动化、数学、物理等相关专业;
2、深入理解人工智能、机器学习等专业知识,有丰富的生成建模研究和工程经验;
3、熟练掌握业界开源大模型和开源深度学习框架,如:Llama,GPT,PyT…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


该岗位将致力于推动公司在大模型应用(Copilot)方面的进展,引领公司在开发生成模型和算法方面的努力,重点推进公司大数据计算和分析的SQL代码生成,做到自动研发;公司寻找具备生成建模研究经验的研究人员,兼具优秀的工程能力,他们不仅能够依托公司优质的大数据资源,站在业界已有的大模型肩膀上,提出算法改进方案,还能推动精调模型在公司规模化落地,提升公司大数据研发效率的同时,打造公司在大模型时代的业界技术影响力。具体职责有,
1、依托公司海量数据资源,基于业界开源的大模型技术,开发符合公司业务诉求的SQL生成大模型,包括设计,实现与评估,以及规模化落地业务;
2、实时跟踪大模型研究进展,探索研究下一代大模型技术,包括模型结构算法的创新,合成数据研究,超大规模分布式AI工程系统设计与实现等;
3、与团队成员和其他部门紧密协作,创新,共同推动大模型技术前沿发展,打造公司AI在业界的影响力。
包括英文材料
学历+
机器学习+
大模型+
深度学习+
Llama+
还有更多 •••
相关职位

logo of kuaishou
实习D3855

参与主站消费基础体验的智能优化探索落地,包括但不限于以下工作: 1. 客户端代码实现:与团队成员一起参与快手主站客户端代码开发,包括但不限于体验策略、性能优化、稳定性优化等;编写高质量的代码,确保线上App的稳定性、高性能; 2. 数据pipeline建设:参与相关模块的数据产出开发,满足数据分析与策略迭代诉求; 3. 实验数据分析和策略制定:参与分析线上数据,根据对实验数据的拆分与下探判断实验运行现状。基于数据现状,参与优化策略的制定与模型训练迭代; 4. 智能提效工具开发:利用大模型,参与完成客户端相关模块排障与数据分析提效工具开发。

更新于 2025-11-13北京
logo of ymtc
社招系统解决方案类

1. AI技术融合与优化:将人工智能技术,特别是大语言模型(e.g. DeepSeek , OpenAI, Qwen),融入公司业务团队的开发测试流程,提升产品研发效率和质量。 - 自动化工具开发:开发AI辅助工具,如代码审查工具、自动测试用例生成工具、性能瓶颈分析工具等,提高研发测试的自动化程度。 - 数据处理与分析:利用大模型和AI工具处理大量研发测试数据,包括代码、测试用例、测试执行日志等,优化数据处理流程。 2. AI知识库系统构建 - 知识库设计:设计和构建高效、准确的AI知识库系统,支持业务部门的专业知识生成和服务。 - RAG系统开发:构建和优化RAG(Retrieval-Augmented Generation)系统,实现从知识库中快速准确地检索相关信息,并生成高质量的业务文档和回答。 3. AI辅助工具平台开发 - 工具平台设计:设计和开发AI辅助工具平台,提供统一的接口和工具集,支持多种AI应用。 - 用户支持:为业务部门提供技术支持,确保AI工具平台的稳定运行和高效使用。 4. 技术解决方案制定 - 技术选型:根据项目需求,选择合适的大模型和技术框架,确保技术选型的合理性。 - 架构设计:设计系统的整体架构,确保系统的可扩展性、可维护性和高性能。 - 数据处理策略:制定数据处理策略,确保数据的准确性和一致性,优化数据流和存储方案。 5. 项目管理和团队协作 - 需求分析:与业务部门紧密合作,理解业务需求,提供技术解决方案。 - 项目管理:跟踪项目进度,确保按时交付高质量的AI系统。 - 团队协作:与团队成员协作,分享知识和经验,推动团队整体技术水平的提升。

更新于 2025-02-28上海
logo of ly
社招3年以上

1.产品研发: 负责公司AI产品的设计与开发,确保产品的高性能和高可用性。 2.技术调研与应用: 持续关注和调研最新的AI技术,评估其应用潜力,并将其引入公司AI产品中。 3.业务需求分析: 与产品经理和业务团队紧密合作,理解业务需求并转化为技术实现方案。 4.代码优化和性能调优: 对现有系统进行性能分析和优化,提升系统的响应速度和稳定性。 5.技术指导: 为团队成员提供技术指导和支持,推动团队技术能力提升。 6.文档编写: 撰写相关技术文档和开发规范,确保项目文档的完整性和准确性。 7.项目管理: 协调项目进度,确保按时按质完成开发任务。

更新于 2024-06-04成都
logo of bytedance
社招A143520

1、负责代码、文本、多模态等数据的合成技术的研究与开发,运用大模型和先进算法,生成高质量、多样化的合成数据,扩充数据规模与多样性,满足大模型训练需求; 2、对大模型训练数据进行深入分析,运用统计学、机器学习等方法挖掘数据特征和规律,识别数据中的噪声、偏差和潜在问题,为数据合成、标注和质量过滤提供数据洞察和优化方向; 3、研究并实现高效的数据自动标注算法,结合自然语言处理、计算机视觉等技术,开发自动化标注工具和流程,提升标注效率和准确性,降低人工标注成本; 4、设计并优化数据质量评估指标和过滤算法,建立数据质量监控体系,对原始数据、合成数据和标注后的数据进行全面质量检测和筛选,确保输入大模型的数据真实、准确、合规; 5、持续跟踪行业前沿数据技术动态,对现有数据处理算法和流程进行优化升级;产品、工程等团队紧密协作,推动数据处理技术在大模型研发和应用中的高效落地。

更新于 2025-06-05北京