阿里巴巴1688-引擎高级研发工程师-杭州
任职要求
1、热爱底层技术,喜欢深入钻研问题,追求严谨的逻辑推理; 2、分布式存储技术,熟悉业界某个大型分布式文件系统的工作原理; 3、Linux系统技术及研发,熟悉文件系统、内存管理、设备管理,在高并发编程、内存管理、网络通信等方面有丰富的经验和深刻理解; 4、软件过程管理,从事过大规模软件系统的CI/CD平台设计和研发,对分布式系统研发过程有深入理解; 5、有强烈的求知欲和较强的学习能力,良好的技术方案规划和沟通管理能力; 6、有大型互联网广告平台研发背景或具备搜索、推荐、机器学习等领域经验者优先。
工作职责
1. 负责广告引擎/索引平台的架构设计与深度优化; 2. 广告投放平台的架构设计与优化,分析现有系统不足,找到系统的瓶颈,改进、提高系统性能、扩展性; 3. 紧跟业界LLM生成式检索前沿,针对不断增长的业务需求和算法多样性创新提供技术解决方案
1、参与公司内基于Ray的分布式计算场景的方案设计以及研发,包括机器学习、图等场景; 2、参与Ray内核/Kuberay以及相关上层生态框架的功能开发&性能优化; 3、参与Ray在K8s上的弹性/潮汐资源集群稳定性/可观测性/平台化对接等能力建设; 4、参与Ray开源社区的建设。
作为大模型评测研发工程师,将负责“大模型通用Benchmark评测体系”与“业务领域Benchmark构建”的全链路研发:从评测数据集设计、智能化自动化评估方法探索研究、指标实现,到平台化落地,精准衡量模型能力边界,持续驱动模型语料优化与模型迭代 通用 Benchmark 研发 • 持续迭代覆盖语言理解、推理、知识、幻觉、对齐、代码、多模态、Agent 等各个维度的自动化评测框架; • 研究并实现更贴合业务发展的评测方法与指标,构建高效、可扩展、可复现、可解释的评测引擎 业务领域 Benchmark 构建与评测 • 深入跨境电商各个业务领域,构建领域Benchmark,真实反馈模型业务表现 • 设计场景化评估方案,如RAG、Agent、COT、 In-Context Learning等,并形成端到端评测能力; 评测方法研究 • 探索基于 LLM-as-a-Judge、人类偏好对齐、模型解释性等前沿评测技术 • 跟踪 ACL / EMNLP / NeurIPS / ICML / ICLR 等会议,高效复现SOTA方法,形成可比对可参考的评估系统
负责蚂蚁集团流量广告商业化变现技术工作,包括商业产品开发、百亿级流量广告投放引擎的设计和优化。业务增长空间大,成员大多来自国内外顶尖的高校及一线大厂,技术氛围浓厚。 1. 负责复杂商业产品系统的设计和开发,构建高性能、高可用的服务框架,承载多行业多业务场景的广告投放需求 2. 负责大规模高并发广告引擎的设计和开发,参与包括索引/召回/模型推理/动态算力/检索架构等核心能力的建设 3. 负责已有广告系统的平台化重构,以开放架构和平台化的方式支撑蚂蚁内各类广告业务