logo of baidu

百度大模型数据工程研发工程师(J83977)

社招全职ACG地点:北京 | 上海状态:招聘

任职要求


-具备扎实的后端开发及工程设计经验,精通 Python/Go 等至少一种后端开发语言
-深入理解 MySQLMongoDB 等关系/非关系数据库,具备复杂数据建模、设计能力
-熟练掌握 DockerKubernetes,具备容器化部署、微服务架构和 CI/CD 流程经验
-熟悉大数据处理框架如sparkray等原理并有实际使用调优经验优先
-有大模型数据处理或大模型相关项目经验,具有大规模数据处理经验者优先
-具备良好的沟通和团队协作能力,能够高效理解并响应业务需求,推动数据驱动的应用落地

工作职责


-负责大模型相关数据处理工作,包括大规模数据的清洗、合成、去重,确保高质量数据输入
-参与文本、图像等多模态数据的预处理,优化数据质量及增强流程,确保数据的高质量和高可用性
-负责内部数据管理平台的后端设计和开发,提升数据存储、查询及可视化管理能力
-支持大模型在业务场景中的应用,深入理解业务需求,主导数据准备和处理流程的优化
-参与数据处理流程的自动化和工程化改进,优化数据流转效率,提升平台稳定性与可扩展性
包括英文材料
后端开发+
Python+
Go+
MySQL+
MongoDB+
Docker+
Kubernetes+
微服务+
CI+
CD+
Spark+
Ray+
大模型+
相关职位

logo of baidu
社招3年以上MEG

-承担百度面向未来的AI Native应用iOS客户端的设计和开发工作,提升智能体应用体验,确保产品的高质量和稳定性 -协助团队成员进行技术研究和开发,与团队成员合作实现项目目标,不断提升自身技术能力和技术视野 -可参与大模型AI原生应用的调研、研发流程,有机会独立负责其中的一部分模块,为公司的业务发展提供技术支持 -持续跟进移动端和AI领域的最新技术发展和趋势,为团队提供有价值的技术输出,推动公司在移动端和AI领域的技术创新

更新于 2025-03-26
logo of baidu
社招3年以上MEG

-承担百度面向未来的AI Native应用iOS客户端的设计和开发工作,提升智能体应用体验,确保产品的高质量和稳定性 -协助团队成员进行技术研究和开发,与团队成员合作实现项目目标,不断提升自身技术能力和技术视野 -可参与大模型AI原生应用的调研、研发流程,有机会独立负责其中的一部分模块,为公司的业务发展提供技术支持 -持续跟进移动端和AI领域的最新技术发展和趋势,为团队提供有价值的技术输出,推动公司在移动端和AI领域的技术创新

更新于 2025-10-16
logo of baidu
社招3年以上TPG

-和团队一起研发驱动AI进化的平台应用 -参与AI训练相关前端开发,研讨制定技术方案,确保高质量交付、提升产品用户体验 -通过开发工具/框架、封装组件、改进流程,保证前端开发的高效性,提高团队开发效率和质量 -关注AIGC技术前沿,及时把新技术转化为业务开发中的生产力

更新于 2024-09-18
logo of bytedance
社招3年以上A00638

团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、参与设计并实现高性能、可扩展、分布式大数据处理平台,通过数据驱动模型生产,支撑字节跳动智能语音相关业务算法生产与高效迭代; 2、与算法工程师密切配合,理解深度学习模型研发流程,负责/参与前沿模型研究中数据解决方案的设计、开发和维护; 3、持续提升平台数据生产效率、易用性、降低算法使用成本,探索业界前沿的多模态数据处理相关技术,设计并实现到数据平台中。

更新于 2023-08-30