小红书【26届实习】AIOps开发工程师(Python/Java)
任职要求
【职位要求】 1. 全日制统招本科及以上学历,3年及以上计算机专业(AIOps相关实验室优先); 2. 熟悉Python或Java语言,熟悉并发编程、常见开发框架等,有扎实的编程基础和工程落地经验; 3. 熟练使用常见分类、聚类、回归、决策树、GBDT等算法以及扎实的概率统计知识与经验; 4. 熟悉时序异常检测、预测、分类、关联分析、根因分析等算法优先,有模型和算法落地经验,能独立完成对算法模型的评估、优化和应用者优先; 5. 熟悉云原生可观测性体系的相关产品及组件优先,包括不仅限于:CAT、OpenTelemetry、SkyWalking、Prometheus、ELK等,了解Kubernetes基本原理并能运用; 6. 善于发现、解决问题,善于总结、思考、跨团队协作,能吃苦耐劳;关注业界新技术,好奇求知,有强烈的责任心及抗压能力。
工作职责
基于Metric、Log、Trace等基础数据,进行智能告警、变更检测、根因分析、容量评估等能力和平台的建设
1、负责业务系统基础设施的维护和建设; 2、参与自动化基础设施系统的开发和功能集成,并持续为提升运维效率而优化工具; 3、和团队一起攻克各种业务系统会遇到的对基础设施的高并发、容灾、高可用、可观测等方面的诉求难题; 4、参与构建 SRE 知识体系与标准化文档流程,形成知识共享。
阿里云持续推进AI技术深化战略布局,围绕AI 和云计算的基础设施建设、AI基础模型平台、企业级AI应用方向构建核心场景。为此,我们正积极招募优秀人才: 负责云计算和大数据基础技术研发,包括不限于以下方向: 1、云基础设施技术,包括研发面向百万级服务器的网络(如RDMA、可编程芯片)、服务器(如异构计算)、数据中心,以及构建超大规模的基础设施智能化运维体系(如AIOps); 2、虚拟化技术,包括XEN、KVM等开源技术的改进,以及也包括我们自研的SDN、VPC等网络虚拟化、存储虚拟化技术,还包括Docker等轻量级的容器方案; 3、MySQL、PostgreSQL、MongoDB、Redis、HBase等开源数据库内核的改进; 4、包含单集群上万个节点,多地多集群的超大规模分布式存储系统(文件系统,KVstore,BigTable等等)、分布式计算系(MapReduce,DAG,MPI并行计算、Batch、类Hive/spark的计算系统包括离线,分布式开发语言,分布式开发IDE,查询优化,流式实时计算,图计算,MPP等等)、弹性分布式资源管理和调度(海量多维度的多目标的调度系统,多个资源维度资源隔离技术等等)、机器学习平台(包括Paratemter Server,深度学习,逻辑回归等等)、异构等新型硬件上计算(包括CPU,GPU,FPGA,RDMA等等); 5、大数据在线引擎体系的目标是集广告、搜索、推荐的投放三位于一体,在近百毫秒周期内,从服务端跨越至移动端上智能,支撑总体近TB级的模型,完成知识推理向量匹配等各种召回,以及其它深度学习的排序和预测算法,参与计算的数十亿商品保持实时更新,支持数百位算法工程师面向众多场景展开测试,在算子流图化的抽象之下,引擎内的模型和数据可随时调整布局满足迭代所需; 6、参与大规模高并发场景下的开发者工具如IDE、SDK、CLI的开发工作,toB相关认证、权限、审计平台合规等相关工具平台的研发工作。
1. 协助大模型安全团队做一些前沿的安全技术研究,能够结合业务现状,输出可实施的技术方案策略 2. 协助aios安全团队做智能体安全的风险评估和治理,利用当前成熟的测试工具发现风险项,并推动整改 3. 熟悉和跟进企业内部大模型服务的技术路线,协助盘点企业内部的模型和数据等资产,利用已有的测试工具发现其中数据安全等问题,并推动治理 4. 协助大模型安全测试集和工具的完善,保证大模型风险的识别率