阿里云阿里云智能-高级安全算法专家-北京/杭州
任职要求
ꔷ 本科及以上学历,计算机科学、人工智能、网络安全等相关专业,5年及以上算法研发经验; ꔷ 精通深度学习、图神经网络、迁移学习等技术,熟悉PyTorch/TensorFlow等框架,具备大规模分布式训练和模型优化经验。 ꔷ 深入理解云安全业务逻辑,熟悉常见攻击手法(如APT攻击、0day漏洞利用)及防御技术,有威胁狩猎、UEBA、反欺诈等项目经验者优先。 ꔷ 具备扎实的工程能力,熟悉高并发、低延迟的在线推理系统设计,有Flink/Spark等大数据处理经验。 ꔷ 出色的业务洞察力和技术判断力,能快速将业务问题转化为算法问题并提出创新解法。 ꔷ 优秀的跨团队协作与资源整合能力,擅长在复杂组织中推动技术方案落地,对技术趋势敏感,具备开源社区贡献或顶会论文(如KDD、CCS、NDSS)者优先。
工作职责
ꔷ 深入理解云安全业务场景(如攻击检测、异常行为分析、数据隐私保护、风险画像等),设计算法解决方案并实现规模化落地; ꔷ 参与设计安全大模型的规划、研发和技术迭代,构建高精度、低时延、可解释的AI模型,解决安全场景特有的技术挑战; ꔷ 负责云安全中心安全助手相关算法研究、开发、架构相关工作,提升安全助手的智能化能力和产品竞争力; ꔷ 负责算法工具链与自动化平台建设,提升算法研发效率,降低业务团队使用门槛; ꔷ 追踪AI与安全交叉领域的前沿技术(如AIGC安全、大模型对抗攻防),推动创新技术在业务场景中的预研与应用。
● 设计和实现高效的训练推理框架,提升多节点、多GPU环境下特别是异构算力场景下的计算效率。具备良好的工程实践和算法理论基础,熟悉底层的硬件编程和常见GPU的算子库开发,能对算法的运行效率如速度、显存占用等进行优化,推动算法稳定、高效的运行。 ● 完善优化训练推理框架,针对市面上的国产信创卡能提出统一的优化方案,并推进在底层的通信效率、资源占用、稳定性方面持续建设。 ● 设计并实现能够处理大规模并发请求的系统架构,确保极端负载下的稳定性和性能。完善错误自愈机制,提升平台训练的MFU,打造行业内一流的异构算力混训混推GPU框架。 ● 技术方案设计:主导核心模块技术方案设计与评审,结合业务需求与系统现状,制定可落地的架构规划。 ● 基础服务开发:构建高可用、可扩展的基础服务组件,支持训练/推理框架的快速迭代与稳定部署。 ● 项目管理:主导跨团队协作项目的全生命周期管理,包括需求拆解、排期规划、进度跟踪与风险控制,确保项目高效交付。 ● 持续关注并跟进业界技术发展,比如超长上下文、端到端推理思维链、多模态等方向。
1、结合安全业务发展战略,制定AI技术架构或者战略规划,推动业务或者产品能力创新; 2、推动千卡级大模型集群训练与推理体系建设,解决训练或者推理过程中技术瓶颈,为业务场景大模型应用提升效果; 3、有良好的团队管理能力和决策能力,激励团队成员的工作积极性和创造力,促进跨团队协同,营造技术创新氛围; 4、跟踪AI领域的前沿技术和研究成果,应用到实际项目,推动安全AI技术发展。
1. 制定平台内容生态治理长期策略,构建覆盖内容质量优化、黑灰产打击、反作弊、创作者信用体系的系统性解决方案。 2. 主导虚假互动的识别模型设计,提升作弊识别准确率;主导高风险场景的治理模型设计,平衡用户体验、商业价值与合规要求。 3. 联合风控团队搭建黑灰产行为画像库,建立实时监测与拦截系统;推动跨部门联动打击黑产团伙,降低平台生态损失。 4. 设计平台内容健康度指标体系,定期输出治理效果分析报告;推动产品、运营、算法团队迭代策略,对生态治理结果负责。
1、设计并实现高精度定位的多模态数据融合方案(如GPS、IMU、视觉等),提升环境感知与定位鲁棒性。 2、开发端到端的定位及轨迹预测算法,结合自回归模型(AR)或时序建模技术,实现复杂交通场景下的高可靠性决策。 3、探索大模型(如Transformer、GNN)在自动驾驶中的应用,设计基于强化学习(RL)的决策优化框架,提升动态环境下的安全性和效率。 4、研究并实现基于强化学习的运动规划算法,结合奖励函数设计与策略优化。 5、将算法部署至实际终端,完成实时性、稳定性优化,推动算法在真实场景中的闭环迭代。 6、技术攻坚与创,跟踪学术界与工业界最新进展(如BEV感知、diffusion policy、模仿学习等),主导关键技术预研与原型开发。