字节跳动后端开发工程师/专家-AI应用
任职要求
1、本科及以上学历,具备5年以上软件开发经验; 2、熟练掌握以下一项或多项技能:Web开发、移动端开发、后端开发(如Python、推荐与搜索相关经验); 3、对新事物保持强烈好奇心,乐于探索,不被传统边界所限制,能够快速学习、适应,并能够在不断变化的环境中茁壮成长; 4、拥有优秀的问题解决能…
工作职责
1、负责AI英语学习创新应用的产品研发,与设计、产品及跨职能团队紧密合作,共同构建并发布新功能; 2、参与系统架构设计,推动代码质量持续提升; 3、通过调试与优化,提升产品的性能、稳定性和可靠性。
1. 行业解决方案设计与交付 - 基于阿里云大模型技术(如通义千问),为银行、保险、证券等金融客户量身定制AI大模型解决方案,覆盖AI财富助手、智能客服、智能风控等核心场景。 - 深入理解客户业务痛点,提供从需求分析、技术选型到方案落地的全流程支持,确保大模型技术与金融业务深度融合。 2. 大模型全生命周期技术赋能 - 主导客户侧大模型后训练(Post-training)、领域微调(Domain-specific Fine-tuning)、模型蒸馏(Distillation)及多模态融合优化,提升模型在金融垂直场景的精度及性能。 - 优化大模型训练与推理性能,包括分布式训练加速(如DeepSpeed、Megatron-LM)、显存优化、量化压缩(INT8/FP16)及低延迟推理部署(如vLLM、SGLang)等。 3. 工程化落地与性能调优 - 解决金融场景高并发、高稳定性需求,设计高性能计算架构,优化模型在GPU/TPU集群的训练效率及端到端推理链路。 - 结合金融行业数据隐私与安全要求,设计符合监管的模型部署方案。 4. 客户技术赋能与生态共建 - 面向客户技术团队提供大模型技术培训、实战工作坊及POC验证,推动AI能力在客户内部的规模化应用。 - 沉淀金融行业大模型最佳实践,输出白皮书、案例研究及标准化解决方案,提升阿里云在金融AI领域的市场影响力。
1、高并发实验平台建设; 设计亿级QPS用户分流系统,开发低侵入式Agent/SDK,支撑短视频、直播、商业化等核心业务AB实验;攻克复杂场景性能瓶颈(如亿级QPS实验入组数据实时上报),支撑万级并行实验在业务系统的稳定运行; 2、基于大数据引擎的架构优化;主导实验数据生产链路架构升级,实现秒级数据计算,替代传统Spark天级时延;设计高性能高可靠实验数据分析方案,解决百亿量级指标毫秒级查询和数据异动归因; 3、智能化实验引擎开发;集成AI能力实现智能异动归因(自动定位指标波动根因)、实验效果预测(迁移学习模型预判策略收益);构建自动化实验报告系统,输出统计显著性分析及业务决策建议。
1. 参与设计并实现混合多云的成本管理与优化平台,提升资源利用率,降低云支出。 2. 开发自动化工具,实现成本数据的实时采集、分析与可视化,支持FinOps全流程(成本洞察、计费、监控、优化等)。 3. 建立并完善云成本数据治理体系,确保成本数据的准确性与一致性。 4. 识别云资源浪费场景,设计自动化策略(如弹性伸缩、闲置资源回收、预留实例规划等),提升成本效率。 5. 跟踪业界FinOps最佳实践,探索AI驱动的成本优化方案。 6. 和财务、BU研发团队紧密协作,推动跨组织的成本运营。