روش ترکیبی نوین برای تشخیص نفوذ با استفاده از نورو-فازی، SVM و PSO







📘 مقالهٔ پژوهشی · دسترسی آزاد

روش ترکیبی نوین برای تشخیص نفوذ با استفاده از نورو-فازی، SVM و PSO

✍️ ، ،
📅 انتشار: ۶ اوت ۲۰۲۵
⭐ جدید
📖 دسترسی آزاد
🔬 مقاله پژوهشی

چکیده

این مقاله یک روش نوین برای بهینه‌سازی سیستم‌های تشخیص نفوذ (IDS) با استفاده از دو تکنیک قدرتمند، یعنی «تحلیل مؤلفه‌های اصلی (PCA)» و «بهینه‌سازی ازدحام ذرات (PSO)» ارائه می‌دهد. رویکرد پیشنهادی بر روی دو دسته از طبقه‌بندی‌کننده‌ها، یعنی نورو-فازی و ماشین بردار پشتیبان (SVM)، پیاده‌سازی شده و روی چهار مجموعه داده رایج تشخیص نفوذ: CAIDA، DARPA، NSL-KDD و ISCX2012 عملکرد خود را نشان می‌دهد. نتایج عملکرد به طور جداگانه بر اساس معیارهای ارزیابی تعیین‌شده تحلیل می‌شوند. الگوریتم PSO برای یافتن بهترین ترکیب از خروجی‌های مدل‌های نورو-فازی و SVM به کار می‌رود که منجر به دقت تشخیص حمله بالاتر با نرخ هشدار اشتباه کمتر می‌شود. استفاده از PCA در روش پیشنهادی با محاسبه مؤلفه‌های اصلی، ابعاد داده را به طور قابل‌توجهی کاهش می‌دهد. این مزایایی مانند کاهش پیچیدگی مدل، زمان آموزش و اجرا، مصرف حافظه و جلوگیری از بیش‌برازش مدل را به همراه دارد. با تمرکز بر مؤلفه‌های اصلی، PCA تا حدی نویز داده را کاهش داده و منجر به افزایش دقت طبقه‌بندی و استحکام می‌شود. همچنین تفسیرپذیری مدل را با برجسته‌سازی مؤلفه‌های کلیدی بهبود می‌بخشد. کاربرد PSO برای یافتن پارامترهای بهینه، منجر به بهینه‌سازی پارامترهای مدل‌های نورو-فازی و SVM می‌شود. نتایج به‌دست‌آمده نشان می‌دهد که روش پیشنهادی برای ترکیب خروجی در هر دو دسته نورو-فازی و SVM به طور قابل‌توجهی دقت تشخیص حمله را افزایش داده و نرخ هشدار اشتباه را کاهش می‌دهد.

📜 مجوز Creative Commons (دسترسی آزاد)
🔓 بدون هزینه

۴مجموعه داده
PCA+PSOبهینه‌سازی
نورو-فازی + SVMطبقه‌بندی‌کننده‌ها
دسترسی آزادنوع دسترسی

کلمات کلیدی

تشخیص نفوذ (IDS)
تحلیل مؤلفه‌های اصلی (PCA)
بهینه‌سازی ازدحام ذرات (PSO)
نورو-فازی
ماشین بردار پشتیبان (SVM)
NSL-KDD
ISCX2012

۱. مقدمه

تشخیص نفوذ در سیستم یا شبکه یکی از چالش‌های حیاتی امنیت در اکثر حوزه‌ها است. حجم زیادی از داده باید تحلیل و مطالعه شود تا سیستم‌های تشخیص نفوذ ساخته و توسعه داده شوند. روش‌های طبقه‌بندی ترکیبی به طور گسترده‌ای در سیستم‌های تشخیص نفوذ مبتنی بر ناهنجاری در دو دهه اخیر استفاده شده‌اند. روش‌های ترکیبی معمولاً از طبقه‌بندی‌کننده‌های تکی بهتر عمل می‌کنند و موفقیت آنها به تنوع در خروجی طبقه‌بندی‌کننده‌ها و روش ترکیب آنها بستگی دارد.

۲. روش پیشنهادی

شکل زیر نمای کلی روش پیشنهادی را نشان می‌دهد که از ترکیب قدرتمند PCA و الگوریتم بهینه‌سازی PSO استفاده می‌کند. این روش بر روی دو دسته اصلی طبقه‌بندی‌کننده‌ها، یعنی نورو-فازی و SVM، اعمال شده است.

مراحل مدل پیشنهادی:

  1. دریافت داده: جمع‌آوری داده‌های خام از ترافیک شبکه.
  2. پیش‌پردازش با PCA: کاهش ابعاد داده با استفاده از الگوریتم PCA برای بهبود کارایی.
  3. آموزش نورو-فازی: داده‌های پیش‌پردازش‌شده برای آموزش الگوریتم نورو-فازی استفاده می‌شوند.
  4. آموزش SVM: داده‌های پیش‌پردازش‌شده برای آموزش مدل SVM نیز استفاده می‌شوند.
  5. ترکیب خروجی با PSO: الگوریتم PSO خروجی‌های هر دو مدل نورو-فازی و SVM را ترکیب می‌کند.
  6. ارزیابی عملکرد: عملکرد مدل نهایی با استفاده از مجموعه داده تست ارزیابی می‌شود.

۲.۱ الگوریتم PCA

PCA یک روش کلاسیک تحلیل چندمتغیره است که کاربرد گسترده‌ای در یادگیری ماشین و آمار دارد. هدف اصلی PCA، کاهش ابعاد داده‌ها با حفظ بیشترین اطلاعات حیاتی است. این کار با کشف مؤلفه‌های اصلی، که گروه جدیدی از متغیرها هستند و بیشترین واریانس داده را دربرمی‌گیرند، انجام می‌شود. مزایای PCA شامل کاهش پیچیدگی مدل، کاهش زمان آموزش، افزایش دقت با حذف نویز و بهبود تفسیرپذیری مدل است.

۲.۲ سیستم نورو-فازی

سیستم‌های نورو-فازی نقاط قوت شبکه‌های عصبی و منطق فازی را ترکیب می‌کنند. این سیستم‌ها می‌توانند قوانین فازی را از داده‌ها یاد بگیرند و برای طبقه‌بندی یا پیش‌بینی استفاده شوند. قابلیت یادگیری شبکه‌های عصبی و توانایی منطق فازی در برخورد با اطلاعات نادقیق، این سیستم‌ها را برای تشخیص نفوذ بسیار مناسب ساخته است.

۲.۳ ماشین بردار پشتیبان (SVM)

SVM یک الگوریتم قدرتمند یادگیری ماشین است که به دلیل دقت بالا و توانایی تعمیم‌پذیری خوب، به طور گسترده در تشخیص نفوذ استفاده می‌شود. SVM با استفاده از توابع هسته (Kernel) می‌تواند روابط غیرخطی پیچیده بین ویژگی‌ها را مدل‌سازی کند. در این پژوهش از هسته RBF با پارامتر گاما ۰.۲ استفاده شده است.

۲.۴ بهینه‌سازی ازدحام ذرات (PSO)

PSO یک تکنیک بهینه‌سازی جمعیتی است که از رفتار اجتماعی پرندگان یا ماهی‌ها الهام گرفته شده است. در این روش، هر ذره نمایانگر یک راه‌حل بالقوه است و با حرکت در فضای جستجو، به دنبال یافتن بهترین پاسخ می‌گردد. در این تحقیق، PSO برای یافتن بهترین ترکیب وزنی از خروجی‌های طبقه‌بندی‌کننده‌های نورو-فازی و SVM استفاده شده است.

فرمول ترکیب خروجی با PSO:

Y = sign( w₁ × Output_NeuroFuzzy + w₂ × Output_SVM )

که در آن w₁ و w₂ وزن‌های بهینه‌شده توسط PSO هستند.

۳. مجموعه داده‌ها و نتایج تجربی

روش پیشنهادی روی چهار مجموعه داده رایج تشخیص نفوذ ارزیابی شده است:

  • CAIDA: ترافیک واقعی شبکه با حملات DoS و نفوذ.
  • DARPA: ترافیک شبیه‌سازی‌شده با حملات DoS در مقیاس بزرگ.
  • NSL-KDD: مجموعه داده شبیه‌سازی‌شده با حملات نفوذ، متعادل‌تر و با نویز کمتر.
  • ISCX2012: ترافیک واقعی شبکه از یک شبکه سازمانی با حملات متنوع.

۳.۱ عملکرد SVM

مجموعه داده دقت (Precision) بازخوانی (Recall) F1-Measure
CAIDA 0.87 0.64 0.74
DARPA 0.78 0.72 0.75
NSL-KDD 0.81 0.69 0.75
ISCX2012 0.85 0.71 0.77

۳.۲ عملکرد نورو-فازی

مجموعه داده دقت (Precision) بازخوانی (Recall) F1-Measure
CAIDA 0.89 0.78 0.83
DARPA 0.88 0.79 0.83
NSL-KDD 0.90 0.81 0.85
ISCX2012 0.91 0.80 0.85

📌 مشاهده می‌شود که نورو-فازی در تمام مجموعه داده‌ها عملکرد بهتری نسبت به SVM دارد، زیرا توانایی یادگیری روابط غیرخطی پیچیده را دارد.

۳.۳ عملکرد مدل ترکیبی با PSO

مجموعه داده دقت (Precision) بازخوانی (Recall) F1-Measure
CAIDA 0.92 0.84 0.88
DARPA 0.94 0.85 0.89
NSL-KDD 0.94 0.86 0.90
ISCX2012 0.93 0.87 0.90

🚀 ترکیب خروجی دو طبقه‌بندی‌کننده با PSO منجر به بهبود قابل‌توجهی در تمام معیارها شده است. مدل ترکیبی نه تنها از هر دو مدل تکی بهتر عمل کرده، بلکه در برخی مجموعه داده‌ها به F1-score 0.90 دست یافته است.

۳.۴ مقایسه با روش‌های دیگر

مجموعه داده مدل دقت بازخوانی F1-Score
CAIDA مدل پیشنهادی (PSO+PCA) 0.92 0.84 0.88
Random Forest 0.90 0.81 0.85
K-NN 0.88 0.79 0.83
Deep Learning 0.93 0.86 0.89
DARPA مدل پیشنهادی (PSO+PCA) 0.94 0.85 0.89
Random Forest 0.91 0.82 0.86
K-NN 0.89 0.80 0.84
Deep Learning 0.95 0.88 0.91
NSL-KDD مدل پیشنهادی (PSO+PCA) 0.94 0.86 0.90
Random Forest 0.91 0.82 0.86
K-NN 0.88 0.80 0.84
Deep Learning 0.95 0.89 0.92
ISCX2012 مدل پیشنهادی (PSO+PCA) 0.93 0.87 0.90
Random Forest 0.91 0.83 0.87
K-NN 0.89 0.81 0.85
Deep Learning 0.94 0.90 0.92

📊 مدل پیشنهادی عملکرد رقابتی با Deep Learning دارد، اما با پیچیدگی محاسباتی بسیار کمتر و نیاز به داده‌های آموزشی کمتر، گزینه‌ای کارآمدتر برای سیستم‌های تشخیص نفوذ بلادرنگ محسوب می‌شود.

۴. نتیجه‌گیری

این مقاله یک رویکرد جدید برای طبقه‌بندی حملات سایبری در شبکه‌های کامپیوتری ارائه داده است. ترکیب الگوریتم‌های نورو-فازی و SVM با بهینه‌سازی PSO و کاهش ابعاد با PCA، منجر به بهبود قابل‌توجهی در دقت تشخیص نفوذ و کاهش نرخ هشدار اشتباه شده است. نتایج تجربی روی چهار مجموعه داده استاندارد نشان داد که روش ترکیبی PSO از هر دو الگوریتم به تنهایی بهتر عمل می‌کند. این نشان می‌دهد که یکپارچه‌سازی روش‌های نورو-فازی و SVM می‌تواند دقت طبقه‌بندی حملات سایبری را افزایش دهد. همچنین، استفاده از PCA به طور مؤثری پیچیدگی محاسباتی را کاهش داده و مدل را برای پیاده‌سازی در سیستم‌های بلادرنگ مناسب‌تر ساخته است.


📚 منابع (گزیده)

  • Wang et al. (2024) Detecting abnormal traffic in SDN based on hybrid deep learning models.
  • Mhawi et al. (2022) Advanced hybrid learning algorithms based on feature selection for network intrusion detection systems.
  • Tian and Miyata (2023) A method for detecting DDoS attacks using conditional entropy based on SDN traffic.
  • Melvin et al. (2022) Dynamic Malware Attack Dataset Using Virtual Machine Monitor Audit Data for Cloud Intrusion Detection.
  • Zedouri (2023) Analysis of the impact of dimension reduction on the accuracy and performance of intrusion detection systems in IoT environments.
  • Wang et al. (2023) Detection of network anomaly penetration based on deep learning approach.
  • Ali et al. (2024) Combining machine learning for landslide susceptibility mapping in northern Pakistan.
  • Shafieian and Zulkernine (2023) Multilayer hybrid learners for low-power network intrusion detection.
  • El-Shafiey et al. (2022) A hybrid optimization approach GA and PSO for prediction of heart disease based on RF.
  • Yadav et al. (2020) Heart disease prediction methodology using RF combined with feature selection techniques.
  • Hao et al. (2020) Intrusion Detection System using a sequence-based ANN model.
  • Stiawan et al. (2020) Optimization of ensemble IDS using meta-heuristic search algorithms.

انتشار: ۶ اوت ۲۰۲۵
بدون بودجه اختصاصی

IET