字节跳动后端研发工程师(大模型数据智能平台)-信息服务中台
任职要求
1、本科及以上学历,计算机/人工智能相关专业,具备大模型研发或数据工程经验; 2、扎实的工程能力(Python/Go),熟悉分布式系统、高并发任务调度及多模态数据处理; 3、有数据标注平台、AI训练数据管道开发经验者优先,熟悉大模型数据生…
工作职责
1、负责大模型数据智能平台的核心研发,构建多模态标注、合成数据生成和高质量数据蒸馏系统,同时深入研究大模型工作原理并探索创新应用场景; 2、主导大模型应用的构建全过程,从需求分析、模型设计到开发实现与优化,确保数据平台的高效性与准确性,持续调优模型性能; 3、通过数据分析与算法改进,优化大模型数据供应链(标注、合成、蒸馏),提升模型效果和用户体验,并与跨部门团队协作推动项目落地; 4、关注行业前沿技术,引入创新算法理念,为数据平台的技术发展提供前瞻性建议,特别是在代码生成、模型对齐与持续学习等领域的应用突破。
负责蚂蚁数据分析平台的数据分析智能助理Copilot、数据分析Manus等智能化产品的调研、开发、运维、用户答疑。通过智能化技术升级产品体系,降低数据分析门槛,从而提升数据分析的效率和效果。
1. 行业解决方案设计与交付 - 基于阿里云大模型技术(如通义千问),为银行、保险、证券等金融客户量身定制AI大模型解决方案,覆盖AI财富助手、智能客服、智能风控等核心场景。 - 深入理解客户业务痛点,提供从需求分析、技术选型到方案落地的全流程支持,确保大模型技术与金融业务深度融合。 2. 大模型全生命周期技术赋能 - 主导客户侧大模型后训练(Post-training)、领域微调(Domain-specific Fine-tuning)、模型蒸馏(Distillation)及多模态融合优化,提升模型在金融垂直场景的精度及性能。 - 优化大模型训练与推理性能,包括分布式训练加速(如DeepSpeed、Megatron-LM)、显存优化、量化压缩(INT8/FP16)及低延迟推理部署(如vLLM、SGLang)等。 3. 工程化落地与性能调优 - 解决金融场景高并发、高稳定性需求,设计高性能计算架构,优化模型在GPU/TPU集群的训练效率及端到端推理链路。 - 结合金融行业数据隐私与安全要求,设计符合监管的模型部署方案。 4. 客户技术赋能与生态共建 - 面向客户技术团队提供大模型技术培训、实战工作坊及POC验证,推动AI能力在客户内部的规模化应用。 - 沉淀金融行业大模型最佳实践,输出白皮书、案例研究及标准化解决方案,提升阿里云在金融AI领域的市场影响力。
1、BI平台技术架构设计与攻坚 -主导构建高性能、高可用的游戏行业BI平台,设计分布式数据存储、计算引擎、可视化服务等核心模块技术架构; -主导技术选型与迭代,包括OLAP引擎(ClickHouse/Doris)、计算框架(Flink/Spark)、前端可视化框架等关键技术组件。 2、数据服务化与性能优化 -构建统一数据服务层,封装复杂查询逻辑为标准化API,支持自助分析、报表订阅等场景; -建立全链路监控体系,优化数据从采集、加工到服务的端到端性能; -设计智能预计算模型,针对高频查询场景自动生成物化视图,提升查询效率; 3、 技术团队管理与工程效能提升 -领导数据平台研发团队(含数据开发、后端、前端工程师),制定技术路线图并推动落地; -建立工程师能力培养体系,主导Code Review、技术分享及复杂问题攻关(如分布式事务一致性保障); -推动研发流程标准化,不断s实现需求交付周期缩短; 4、业务协同与技术产品化 -深入理解游戏运营需求(如活动效果实时监控、用户流失归因),将业务场景抽象为通用技术解决方案; -探索AI与BI融合场景,主导智能SQL生成、自然语言查询等技术预研与落地。
Part 1,后端开发: 1、负责数据产品后端的设计与实现,确保系统具备良好的架构设计、扩展性及高可用性; 2、根据系统设计,完成平台的开发、测试和线上维护工作,保障系统的稳定运行; 3、负责系统的服务端调优,持续提升系统性能和服务质量,并编写设计、开发、测试等相关文档,为团队提供清晰的技术指导。 Part 2,AI应用探索与开发: 1、参与AI技术在数据产品中的应用探索,包括但不限于自然语言处理、机器学习、深度学习等方向; 2、负责AI应用的后端开发工作,实现AI模型与现有数据产品的无缝对接; 3、与数科、算法紧密合作,将AI技术转化为实际的产品功能,提升数据产品的智能化水平; 4、跟踪AI领域的最新技术动态,结合业务需求,推动AI技术在数据产品中的创新应用。