大疆实习生(AI模型算法)
任职要求
1. 计算机科学、数据科学、人工智能或相关专业的研究生在读; 2. 具备基本的数据处理和分析能力,对机器学习和深度学习有基本的了解; 3. 熟悉常用的机器学习库(如TensorFlow、PyTorch等); 4. 具备较强的学习能力和主动性,能够快速掌握新技术和工具; 5. 良好的沟通能力和团队合作精神,能够有效地与团队成员协作; 6. 具备良好的中英文读写能力,能够阅读和理解相关技术文献。
工作职责
参与部门NN相关业务预研,探索构建新一代智能无人机系统。工作内容包含但不限如下: 1. 探索NN技术在无人机多视角多模态传感器融合可行性; 2. 探索NN在无人机智能决策上和规划上的应用可行性; 3. 探索大模型能力生成无人机业务数据和无人机数据自动标注能力可行性; 4. 探索大模型的能力在无人机智能提升的可行性。
1、承接端到端自动驾驶/大语言类AI模型负载,为大算力芯片研发设计AI模型调度、编译软件栈,实现高性能推理或训练。 2、参与数据流模式时空调度建模与算法开发,支撑AI模型自动化调度到大算力芯片之上,达到较高端到端性能。 3、参与AI基本算子的开发和优化,支撑算法模型推理所需算子的功能和基本性能要求,分析性能瓶颈,构建方案极致优化。
团队介绍:Stone-AI PaaS团队专注研究AI/大模型应用相关领域的技术和产品,致力于创造和实现创新的人工智能平台服务。团队目前已服务于字节跳动多款产品,比如豆包、Cici、Coze、Trae等。同时团队内部也在孵化多款AI应用创新产品,积极探索大模型应用的技术发展。团队氛围好,发展空间大,欢迎加入! 课题介绍: 背景:随着人工智能技术的飞速发展,大语言模型(LLM)在自然语言处理领域取得了显著进展,为智能对话系统的发展提供了有力支撑。然而,现有的智能对话系统在面对复杂多变的实际应用场景时,仍存在诸多不足。一方面,用户对于交互的多样性和便捷性提出了更高要求,期望能够实现语音、图像、文本等多模态信息的自然交互;另一方面,面对复杂问题,当前对话系统缺乏深度思考和推理能力,难以提供全面且精准的解答。同时,在知识获取方面,如何高效地调度各类工具,挖掘优质内容,以满足用户的多样化需求,也成为亟待解决的问题。因此,开展对多模态交互、深度思考、工具调度以及优质内容挖掘方向的研究,对于提升通用对话助手的性能和用户体验具有重要的现实意义。 研究方向: 1、多模态交互方向:深入研究语音、图像、文本等多模态信息的融合与交互技术,开发能够实现多模态信息无缝对接的算法模型。通过构建多模态语义理解框架,使对话助手能够准确理解不同模态输入的含义,并根据用户需求以语音、图像、文本等多种形式进行输出,实现自然流畅的多模态交互体验。例如,当用户输入一张图片并提出相关问题时,对话助手能够识别图片内容,并结合文本信息进行分析解答,同时可以以语音形式反馈结果; 2、深度思考方向:探索基于深度学习的推理机制,提升对话助手的逻辑推理和问题解决能力。引入知识图谱、语义网络等技术,增强对话助手对知识的理解和运用能力,使其能够在面对复杂问题时,进行深度思考和分析,挖掘问题的本质,提供更具逻辑性和准确性的回答。比如,在解答科学类复杂问题时,对话助手能够基于知识图谱进行推理,给出全面且深入的解释; 3、工具调度方向:构建智能工具调度系统,使对话助手能够根据用户问题的类型和需求,自动识别并调用合适的外部工具,如信息检索工具、数据分析工具、翻译工具等。建立工具之间的协同工作机制,确保在处理复杂任务时,多个工具能够相互配合,实现信息共享和流程优化,提高问题解决的效率和质量。例如,在处理跨国业务相关问题时,对话助手可以同时调用翻译工具和信息检索工具,快速获取并翻译相关资料,为用户提供准确信息; 4、优质内容挖掘方向:研发高效的内容挖掘算法,从海量的文本、图像、视频等数据中筛选出优质、有价值的信息。利用自然语言处理和计算机视觉技术,对内容进行分类、标注和评估,建立优质内容数据库。通过与对话助手的交互,根据用户的兴趣和需求,精准推送相关的优质内容,满足用户对高质量信息的获取需求。比如,为对历史文化感兴趣的用户推荐相关的优质纪录片、学术论文等。
团队介绍:Stone-AI PaaS团队专注研究AI/大模型应用相关领域的技术和产品,致力于创造和实现创新的人工智能平台服务。团队目前已服务于字节跳动多款产品,比如豆包、Cici、Coze、Trae等。同时团队内部也在孵化多款AI应用创新产品,积极探索大模型应用的技术发展。团队氛围好,发展空间大,欢迎加入! 课题介绍: 背景:随着人工智能技术的飞速发展,大语言模型(LLM)在自然语言处理领域取得了显著进展,为智能对话系统的发展提供了有力支撑。然而,现有的智能对话系统在面对复杂多变的实际应用场景时,仍存在诸多不足。一方面,用户对于交互的多样性和便捷性提出了更高要求,期望能够实现语音、图像、文本等多模态信息的自然交互;另一方面,面对复杂问题,当前对话系统缺乏深度思考和推理能力,难以提供全面且精准的解答。同时,在知识获取方面,如何高效地调度各类工具,挖掘优质内容,以满足用户的多样化需求,也成为亟待解决的问题。因此,开展对多模态交互、深度思考、工具调度以及优质内容挖掘方向的研究,对于提升通用对话助手的性能和用户体验具有重要的现实意义。 研究方向: 1、多模态交互方向:深入研究语音、图像、文本等多模态信息的融合与交互技术,开发能够实现多模态信息无缝对接的算法模型。通过构建多模态语义理解框架,使对话助手能够准确理解不同模态输入的含义,并根据用户需求以语音、图像、文本等多种形式进行输出,实现自然流畅的多模态交互体验。例如,当用户输入一张图片并提出相关问题时,对话助手能够识别图片内容,并结合文本信息进行分析解答,同时可以以语音形式反馈结果; 2、深度思考方向:探索基于深度学习的推理机制,提升对话助手的逻辑推理和问题解决能力。引入知识图谱、语义网络等技术,增强对话助手对知识的理解和运用能力,使其能够在面对复杂问题时,进行深度思考和分析,挖掘问题的本质,提供更具逻辑性和准确性的回答。比如,在解答科学类复杂问题时,对话助手能够基于知识图谱进行推理,给出全面且深入的解释; 3、工具调度方向:构建智能工具调度系统,使对话助手能够根据用户问题的类型和需求,自动识别并调用合适的外部工具,如信息检索工具、数据分析工具、翻译工具等。建立工具之间的协同工作机制,确保在处理复杂任务时,多个工具能够相互配合,实现信息共享和流程优化,提高问题解决的效率和质量。例如,在处理跨国业务相关问题时,对话助手可以同时调用翻译工具和信息检索工具,快速获取并翻译相关资料,为用户提供准确信息; 4、优质内容挖掘方向:研发高效的内容挖掘算法,从海量的文本、图像、视频等数据中筛选出优质、有价值的信息。利用自然语言处理和计算机视觉技术,对内容进行分类、标注和评估,建立优质内容数据库。通过与对话助手的交互,根据用户的兴趣和需求,精准推送相关的优质内容,满足用户对高质量信息的获取需求。比如,为对历史文化感兴趣的用户推荐相关的优质纪录片、学术论文等。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Stone-AI PaaS团队专注研究AI/大模型应用相关领域的技术和产品,致力于创造和实现创新的人工智能平台服务。团队目前已服务于字节跳动多款产品,比如豆包、Cici、Coze、Trae等。同时团队内部也在孵化多款AI应用创新产品,积极探索大模型应用的技术发展。团队氛围好,发展空间大,欢迎加入! 1、负责以下算法研究和应用方向之一: 1)AINative形态对话式服务算法的研发,在大规模机器学习和深度学习领域开展研发工作,设计和开发创新性算法模型,研究相关技术在创作、对话和客服等领域的全新应用和解决方案,满足用户不断增长的智能交互需求,全面提升用户在未来世界的生活和交流方式; 2)深入研究语音、图像、文本等多模态信息的融合与交互技术,开发能够实现多模态信息无缝对接的算法模型; 3)提升自然语言理解的能力,比如意图识别,NL2SQL,向量召回,结构化/非结构化,短文本/长文本的表征学习等; 2、负责数据建设、指令微调、偏好对齐、模型优化; 3、深入调研和关注NLP/多模态/LLM等方向的前沿技术,支持模型效果的研发落地和持续优化,探索实际解决业界AI应用问题的方案。