
智能互联集团安全部-内容安全大模型算法专家-杭州
任职要求
1、学历背景:计算机、数学、统计学或相关专业硕士及以上学历,具备扎实的理论基础; 2、编程能力:熟练掌握 Python / Java / C++ 中至少一门语言,具备优秀的数据结构与算法功底; 3、机器学习基础:熟悉主流机器学习算法(如分类、聚类、序列模型、图神经网络等),了解深度学习框架(如 PyTorch、TensorFlow); 4、大模型经验:有大模型(LLM)在自然语言处理、内容理解、文本分类、异常检测等场景的实际应用经验者优先; 5、研究能力:具备优秀的分析与问题解决能力,熟悉数据挖掘、机器学习、信息检索、NLP、推荐系统、计算广告等领域,有相关研究成果者优先; 6、学术成果:在 SIGIR、SIGKDD、ICML、NeurIPS、WSDM、WWW、AAAI、CIKM、ACL、RecSys 等国际顶级会…
工作职责
1. 负责内容安全领域的大模型算法研发与落地,构建面向国际及国内多场景(如商品审核、社区内容、广告等)的智能识别与风险防控体系; 2. 设计并实现基于大模型的自动化审核系统,提升审核效率与准确率,支持高并发、低延迟的在线服务; 3. 负责商品治理领域的风险防控算法研发与落地,面向数十亿级商品库,构建覆盖假货、侵权、山寨、劣质、滥发等核心场景的智能识别体系,通过大模型驱动的内容理解、行为建模与知识推理技术,提升风险识别准确率与自动化处置能力,保障消费者购物体验与权利人平台权益,支撑电商生态健康可持续发展; 4. 探索大模型在内容理解、行为建模、团伙识别、跨语言语义分析等方向的应用,推动从传统规则/小模型向知识驱动AGI范式的演进; 5. 构建可解释、可迭代的知识生产闭环,支撑风险感知、策略生成与防控标准动态更新; 6. 参与大模型训练、微调、推理优化及部署全流程,提升模型在真实业务中的泛化能力与稳定性。

1、评测是大模型下半场的重中之重。构建面向大模型的多维度评估体系,包含安全垂域能力(内容、商品、行为风险识别,变异对抗)、通用能力(指令遵循、长上下文理解、工具调用)等。通过算法实现科学有效、持续进化的自动化评估方案,深入大模型训练的各个阶段,为模型能力持续提升提供精准反馈与指导 2、负责基础模型和安全应用的效果评估工作,深度参与安全大模型的性能分析与评估,尤其聚焦于基础模型、多模态、agent、和前沿技术(RL、对抗学习)等方向的能力定向分析,驱动模型迭代优化,直接影响前沿技术落地效果与用户体验 3、紧跟业界人工智能技术前沿动态,结合大模型发展成果,将Agent、RAG、Post-Train等技术在实际场景中落地。积极分享和沉淀关键技术,推动技术创新

1. 面向安全垂域大模型,构建安全领域知识体系,将高质量领域知识转化为适用于大模型的有效训练数据,提升基座模型在业务场景的知识理解与推理能力; 2. 深入研究大语言模型的知识理解、表征与记忆机制,探索知识在模型内部的存储、激活与推理路径,为高效的知识注入提供理论基础; 3. 建立安全领域知识的质量标准和评估体系,驱动安全基座模型的持续迭代与优化,形成“知识-数据-模型-评测”的安全数据飞轮; 4. 探索安全特色的知识增强技术,提升基座模型在安全攻防对抗环境的知识应用与规划能力,通过自我博弈提升模型智能水平。

我们要寻找一位对数据安全和人工智能充满热情的大模型应用算法工程师加入我们的团队。在这里,你将加入一个充满热情的技术团队,参与构建智能化的数据安全防护体系,利用前沿的机器学习与数据挖掘技术,探索大模型在数据安全领域的深度应用。 具体职责包括但不限于: ● 大模型微调与实战 参与开源大模型的后训练(SFT、RL)与效果调优;针对具体的数据安全场景(如敏感词识别、API 风险检测),优化模型推理效果与性能。 ● 数据处理与工程化 参与高质量训练数据集的构建,编写自动化脚本进行数据清洗、增强与合成(Synthetic Data);协助解决模型部署中的工程问题,提升服务稳定性。 ● 算法落地与迭代 利用 NLP 技术(如 NER 实体识别、文本分类)解决实际业务中的隐私保护问题;持续跟踪测试最新的 RAG、Agent 技术,并在业务中尝试落地。 ● 前沿技术复现 跟踪学界/业界在 LLM 与安全结合领域的最新论文与技术报告,快速复现并验证其在内部场景的有效性。