Ham Verilerin Anlamlı Hale Getirilmesi

Ham veri kümesinden elde edilen bilgiler, makine öğrenimini uygulamak için yeterli olmayacaktır. Zayıf düğümler içeren simülasyonlardan elde edilen ham veriler, normal düğümler içeren simülasyonlardan elde edilen ham verilerden tamamen farklıdır. Bu farkın paket sayısı, mesaj türleri, toplam paket uzunlukları ve oranları olduğu gözlemlenmiştir. Bu anormalliği algılamak için, ham veriler 1 saniyelik karelere bölünmüştür. Her saniyenin çerçeveleri içinde aşağıdaki değerler hesaplanmış ve yeni bir veri kümesi oluşturulmuştur.
Simülasyon ve Ham Veri

Önceki makalede, D’Hondt ve diğerlerinin yapmış olduğu RPL Saldırıları İş Çerçevesinden (Framework) Taşma Saldırıları, Azaltılmış Rank Saldırıları ve Sürüm Numarası Artırma Saldırıları için oluşturulan düğümlerin nasıl elde edildiğini açıklamıştım.
Bu makalede ise, bu düğümlerle Cooja’yı kullanarak simülasyon yapacak ve ağ verilerini elde edeceğim.
Makine öğrenmesi için iki adet sınıflandırılmış veri setine ihtiyacımız olacaktır. Bunlardan bir tanesi, içerisinde zafiyetli düğüm barındırmayan ve tamamen normal IoT düğümleri ile yapılan simülasyondan oluşturulan verilerdir. Diğeri ise çerisinde zafiyetli düğüm barındıran normal IoT düğümleri ile yapılan simülasyondan oluşturulan verilerdir. Böylece, bu iki veri setini sınıflandırıp, sınıflandırma algoritmaları ile anomaliyi tespit edeceğiz.