Key points are not available for this paper at this time.
摘要 计算机网络及其应用的指数级增长与全球网络攻击激增相匹配。为此,创建了如CSE-CIC-IDS2018之类的数据集,用于训练基于网络的入侵检测预测模型。这些数据集不旨在作为基于签名的检测系统的存储库,而是推动通过各种机器学习方法研究基于异常的检测。CSE-CIC-IDS2018包含约16,000,000个实例,数据采集时间为十天。它是最新的、可公开获取的大数据入侵检测数据集,涵盖广泛的攻击类型。该多类别数据集存在类别不平衡,约17%的实例是攻击(异常)流量。我们的调研工作提供了若干关键发现。我们发现各研究中最佳性能得分总体出乎意料地高,可能是过拟合所致。我们还发现大多数研究未处理类别不平衡问题,该问题可能导致大数据研究结果偏差。最后,我们发现关于CSE-CIC-IDS2018数据清洗的信息普遍不足,可能影响实验可重复性。我们的调研还识别了主要研究空白。
Building similarity graph...
Analyzing shared references across papers
Loading...
Joffrey L. Leevy
Taghi M. Khoshgoftaar
Journal Of Big Data
Florida Atlantic University
Building similarity graph...
Analyzing shared references across papers
Loading...
Leevy等人(Mon,)研究了该问题。
www.synapsesocial.com/papers/69d8c6842c39562886ae2a64 — DOI: https://doi.org/10.1186/s40537-020-00382-x
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: