字节跳动大模型算法应用研发资深工程师/专家-杭州
任职要求
1、优秀的代码能力、数据结构和基础算法功底,熟悉Pytorch等深度学习框架; 2、有自然语言处理、计算机视觉、视频理解、强化学习等领域的实际项目经验优先; 3、在大…
工作职责
1、负责大模型算法在边缘计算场景的落地; 2、参与项目建设中的数据建设、指令微调、偏好对齐、模型优化; 3、跟踪调研大模型以及相关方向(包括但不限于NLP/CV/多模态/具身智能)的前沿技术; 4、深入研究模型在未来生活中的更多使用场景,探索边缘计算与大模型的结合点,拓展模型在边缘计算的应用范围。
钉钉正在全面拥抱多模态AI,正在致力于将视觉大模型、边缘智能与实时视频分析深度融合,赋能智能零售、智慧工厂、智能交通等多个行业。我们拥有强大的工程化能力和创新研发氛围,期待志同道合的技术精英加入,共同推动视觉AI落地千行百业。 我们正在寻找在视觉AI领域具备真正工程化落地经验的技术人才,你将参与公司核心视觉AI系统的研发与优化,负责从算法设计、模型训练到高性能部署、大规模流式处理的全链路技术实现。具体职责包括: 1. 视觉大模型与算法开发 ○ 负责视觉大模型的后训练(Post-training)优化,包括微调、蒸馏、量化、剪枝等,提升模型在实际场景中的泛化能力与效率。 ○ 开发端侧视觉大模型,针对边缘设备进行轻量化设计与部署。 ○ 设计并实现传统CV算法(如目标检测、跟踪、姿态估计、图像增强等)与深度学习模型的融合方案。 ○ 构建视觉嵌入生成与特征提取模型,支持跨模态检索、相似性匹配等应用。 ○ 能根据实时性、性能、成本等多维约束,设计合理的算法组合与技术路线,实现最优落地效果。 ○ 在行业专家的指导下完成高质量的数据清洗和标注,建立多行业多场景的视觉AI评估框架 2. 高性能推理部署与优化 ○ 基于不同算法特性,选择并实施高并发、大吞吐的推理部署方案,熟练使用以下技术栈: ■ 推理框架:Triton Inference Server、ONNX Runtime、TensorRT ■ 部署平台:KServe + Triton / KServe + vLLM ○ 实现模型的动态批处理、自适应推理、低延迟响应,优化端到端服务性能。 ○ 负责模型格式转换、算子优化、硬件适配(GPU/TPU/NPU)及性能调优。 3. 分布式视频流处理系统构建是加分项 ○ 构建高可用、可扩展的分布式视频流处理 pipeline,支持多路视频流的实时接入与处理。 ○ 基于 Kafka + Flink 实现视频帧的流式消费、分发与状态管理。 ○ 完成视频数据的实时AI推理、结果聚合、元数据落盘,并与下游系统无缝集成。 ○ 保障系统在高负载下的稳定性、容错性与可监控性。 4. 跨团队协作与技术沉淀 ○ 与产品、业务、后端及硬件团队紧密协作,推动AI能力在真实业务场景中的落地。 ○ 输出技术文档、最佳实践,参与构建公司级AI工程化平台与工具链。
网商银行人工智能-大模型应用团队,集结了一群在人工智能领域有着深厚积淀和卓越成就的专业人才。团队成员不仅包括从国内外顶尖互联网公司引进的资深算法专家,还有国内各个名校优秀实验室的应届生。作为蚂蚁集团网商银行的核心算法团队,我们扎根于一个庞大且充满活力的金融业务场景:网商银行每日承载着数以亿计用户的各类金融服务需求,服务覆盖全国乃至全球的亿万小微商户和个体经营者,交易额总量达到万亿级别。我们是一支专注于金融科技前沿探索与创新的算法团队,致力于通过前沿的CV、NLP、LLM等技术,推动信贷风控系统的智能化升级及下一代风控技术的探索。团队以技术驱动业务价值为目标,持续探索大模型在金融场景中的深度应用,为普惠金融服务提供智能化、高效化的解决方案。作为网商银行技术创新的核心力量之一,团队近年通过业务场景与算法创新相结合,已经在AAAI/CVPR/ICCV/ICML/ICLR等会议上发表数十篇论文。 1.研发和探索金融信贷场景下的AI技术,深度理解信贷业务逻辑,设计可规模化落地的技术方案,应用于网商AI风控、AI升级自动化审批与量化等核心业务中; 2.主导从0到1的创新项目研发,完成技术可行性验证到规模化落地的全流程闭环,并从实际项目出发,提炼出问、创新性解决问题,并发表顶会论文或开源高影响力项目。
1、负责大模型算法在边缘计算场景的落地; 2、参与项目建设中的数据建设、指令微调、偏好对齐、模型优化; 3、跟踪调研大模型以及相关方向(包括但不限于NLP/CV/多模态/具身智能)的前沿技术; 4、深入研究模型在未来生活中的更多使用场景,探索边缘计算与大模型的结合点,拓展模型在边缘计算的应用范围。