Key points are not available for this paper at this time.
要約 世界中のコンピュータネットワークおよびネットワークアプリケーションの指数関数的な増加は、サイバー攻撃の急増と並行しています。このため、CSE-CIC-IDS2018のようなデータセットが作成され、ネットワークベースの侵入検知に関する予測モデルの訓練に用いられています。これらのデータセットはシグネチャベースの検知システムのためのリポジトリとしてではなく、様々な機械学習手法を通じた異常検知の研究促進を目的としています。CSE-CIC-IDS2018には約1,600万件のインスタンスが10日間かけて収集されています。これは最も新しいビッグデータの侵入検知データセットであり、公開されており、幅広い攻撃タイプを網羅しています。この多クラスのデータセットはクラスの不均衡があり、約17%のインスタンスが攻撃(異常)トラフィックを占めています。本調査研究は重要な知見を複数もたらしました。利用可能な各研究における最高性能スコアが全体的に予想外に高かったことが判明し、これは過学習による可能性があります。また、大部分の研究がクラスの不均衡に対処しておらず、その影響がビッグデータ研究の結果にバイアスを生じさせることがあることも見出しました。最後に、CSE-CIC-IDS2018のデータクリーニングに関する情報が総じて不十分であることを発見し、これは実験の再現性に問題がある可能性を示唆しています。本調査では、主要な研究ギャップも特定されています。
Building similarity graph...
Analyzing shared references across papers
Loading...
Joffrey L. Leevy
Taghi M. Khoshgoftaar
Journal Of Big Data
Florida Atlantic University
Building similarity graph...
Analyzing shared references across papers
Loading...
Leevyら(Mon,)はこの問題を研究しました。
www.synapsesocial.com/papers/69d8c6842c39562886ae2a64 — DOI: https://doi.org/10.1186/s40537-020-00382-x
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: