Ko'p O'zgaruvchili Anomaliya Aniqlash Nima?

Ko'p o'zgaruvchili anomaliya aniqlash — bir nechta sensor yoki xususiyatning bir vaqtdagi xatti-harakatini modellashtirish va tizim "normal"dan chiqib ketgan lahzalarni aniqlash jarayonidir. Bitta o'zgaruvchini chegara qiymati bilan solishtirishning o'rniga, o'zgaruvchilar orasidagi korrelyatsiya naqshlarini o'rganadi va bu naqshlar buzilgan nuqtalarni anomaliya sifatida belgilaydi.

Chandola va boshq. (2009) anomaliyalarni uch paradigma bo'yicha tasniflaydi: nuqta anomaliyalari (bitta kuzatuvning ekstremal qiymat olishi), kontekstual anomaliyalar (faqat ma'lum kontekstda g'ayritabiiy bo'lgan qiymatlar) va kollektiv anomaliyalar (alohida-alohida normal, lekin birgalikda g'ayritabiiy naqsh hosil qiluvchi kuzatuvlar). Ko'p o'zgaruvchili tizimlar asosan kollektiv anomaliyalarni ushlaydi — bu ularni sanoat monitoringi uchun zarur qiladi (Chandola et al., 2009).

Aggarwal (2017) ko'p o'zgaruvchili fazoda anomaliya aniqlashning asosiy qiyinligini "o'lchamlilik la'nati" deb ta'riflaydi: o'zgaruvchilar soni ortishi bilan evklid masofasi mazmunini yo'qotadi, zichlikka asoslangan usullar siyraklashadi va intuitiv chegaralar ishlamay qoladi.

---

Yagona O'zgaruvchili Chegara Yondashuvi Nima Uchun Yetarli Emas?

Klassik monitoring tizimlari har bir metrika uchun alohida chegara belgilaydi: CPU foydalanishi 90% dan oshsa ogohlantirish berish, paket yo'qotilishi 5% dan oshsa signal yuborish. Bu yondashuv boshqaruvni soddalashtiradi, lekin real dunyodagi nosozliklarning aksariyatini o'tkazib yuboradi.

Sababi oddiy: murakkab tizimlardagi nosozliklar kamdan-kam hollarda bitta metrikaning ekstremal qiymat olishi bilan namoyon bo'ladi. Ko'proq uchraydigan ssenariy — bir nechta metrikaning birgalikda g'ayrioddiy naqsh hosil qilishidir. Masalan, AV projektor qurilmasida ventilyator tezligi 10% oshishi, ichki harorat 3°C ko'tarilishi va ruxsat xatosi darajasi 0,8% oshishi mumkin. Ularning hech biri alohida chegarani faollashtirmaydi; ammo uchala signalning bir vaqtdagi siljishi issiqlik nosozligining erta ko'rsatkichidir.

Ko'p o'zgaruvchili yondashuvlar bu muammoni hal qiladi: model yaxlit naqshni o'rganadi, shuning uchun individual metrikalardagi vaqtinchalik o'zgarishlarga sezgir bo'lmaydi, ammo haqiqiy korrelyatsiya buzilishlarini aniqlaydi.

---

Isolation Forest Algoritmi Qanday Ishlaydi?

Isolation Forest (Liu et al., 2008) anomaliya aniqlashni tasniflash muammosi sifatida emas, izolyatsiya muammosi sifatida ko'rib chiqadi. Asosiy g'oya: anomaliyalar kam sonli va normal kuzatuvlardan aniq farq qiladi, shuning uchun tasodifiy bo'limlash daraxtlarida ular kamroq bo'linish bilan izolyatsiya qilinadi.

Algoritm quyidagicha ishlaydi:

Ma'lumotlar to'plamidan tasodifiy xususiyat tanlanadi.
Tanlangan xususiyatning minimum va maksimum qiymatlari orasida tasodifiy bo'linish nuqtasi belgilanadi.
Bu jarayon rekursiv ravishda takrorlanib iTree (izolyatsiya daraxti) hosil qiladi.
Ko'p daraxt qurilgach, har bir ma'lumot nuqtasi uchun o'rtacha izolyatsiya chuqurligi hisoblanadi.
Chuqurligi kichik bo'lgan nuqtalar anomaliya sifatida belgilanadi.

Liu va boshq. (2008) ROC-AUC taqqoslashlarida Isolation Forest'ning LOF va One-Class SVM dan ko'plab ma'lumotlar to'plamida ustun kelishini ko'rsatgan. Algoritm chiziqli vaqt murakkabligi O(n) va o'lchamlilik lanatiga nisbatan barqarorlik kabi muhim afzalliklarga ega.

---

Autoencoder Asosidagi Anomaliya Aniqlash Qanday Amalga Oshiriladi?

Autoencoder — kirish ma'lumotlarini siqilgan yashirin tasvirga kodlaydigan va undan kirish ma'lumotlarini qayta tiklaydigan neyron tarmoq arxitekturasidir. O'qitish faqat normal ma'lumotlar bilan amalga oshiriladi; anomaliyalar qayta tiklashda yuqori qayta tiklash xatosi beradi, chunki model ularni hech qachon ko'rmagan.

Sakurada va Yairi (2014) autoencoderlarning yuqori o'lchamli, chiziqsiz ma'lumotlarda anomaliya aniqlashda chiziqli PCA dan aniq ustunlik berishini ko'rsatdi. Qayta tiklash xatosi belgilangan darajadan oshsa, tizim anomaliya bayrog'ini ko'taradi.

LSTM asosidagi autoencoderlar (Hochreiter & Schmidhuber, 1997) vaqt qatorlari ma'lumotlaridagi vaqtinchalik bog'liqliklarni ushlash uchun ayniqsa samaralidir. Bu arxitektura nafaqat daqiqalik qiymatlarni, balki oldingi qadamlardan kelgan naqshni ham kodlaydi.

Xulosa chiqarish bosqichida har bir oyna uchun MSE (o'rtacha kvadrat xato) hisoblanadi; bu qiymat oldindan belgilangan persentil chegarasidan oshsa anomaliya hisoblanadi.

---

Real Vaqtli Ko'p O'zgaruvchili Monitoring Qanday Amalga Oshiriladi?

Real vaqtli amalga oshirish uch qatlamdan iborat:

1. Ma'lumotlarni qabul qilish qatlami: Sensor ma'lumotlari MQTT yoki Kafka orqali yig'iladi. Har bir qurilma uchun alohida mavzu belgilanadi; xabarlarga vaqt tamg'asi va qurilma identifikatori qo'shiladi.

2. Xulosa chiqarish qatlami: O'qitilgan model (Isolation Forest yoki LSTM Autoencoder) mikroxizmat sifatida taqdim etiladi. Har bir kiruvchi oyna (masalan, 30 soniyali siljuvchi oyna) modelga yuboriladi; anomaliya ballari real vaqtda hisoblanadi.

3. Ogohlantirish va javob qatlami: Anomaliya tasdiqlangach, SHAP yoki o'xshash tushuntirish vositasi bilan tetiklovchi xususiyatlar ro'yxatlanadi, so'ngra texnik xizmat guruhiga bildirishnoma yuboriladi. Bu dizayn yuqori soxta signal darajasini oldini oladi va operator ishonchini saqlaydi (Aggarwal, 2017).

Kechikish nuqtai nazaridan, Isolation Forest xulosa chiqarish odatda <5ms, GPU bilan LSTM Autoencoder esa <20ms oladi — bu ko'rsatkichlar real vaqtli AV va ishlab chiqarish monitoringi uchun yetarli.

---

Adabiyotlar

Liu, F. T., Ting, K. M., & Zhou, Z. H. (2008). Isolation Forest. *Proceedings of the 8th IEEE International Conference on Data Mining (ICDM)*, 413–422.
Chandola, V., Banerjee, A., & Kumar, V. (2009). Anomaly Detection: A Survey. *ACM Computing Surveys*, 41(3), 1–58.
Aggarwal, C. C. (2017). Outlier Analysis (2nd ed.). Springer.
Sakurada, M., & Yairi, T. (2014). Anomaly Detection Using Autoencoders with Nonlinear Dimensionality Reduction. *Proceedings of the MLSDA Workshop*, 4–11.
Hochreiter, S., & Schmidhuber, J. (1997). Long Short-Term Memory. *Neural Computation*, 9(8), 1735–1780.

---

Ko'p So'raladigan Savollar

Isolation Forest va LSTM Autoencoder birgalikda ishlatilishi mumkinmi? Ha. Gibrid yondashuvlarda Isolation Forest tezkor birinchi filtr, LSTM Autoencoder esa chuqur vaqtinchalik tahlil uchun ikkinchi qatlam sifatida ishlatiladi. Birinchi bosqich past anomaliya bali bersa, oyna ikkinchi bosqichga yuborilmaydi — bu kechikish va hisoblash xarajatini kamaytiradi.

Anomaliya chegarasini qanday belgilash kerak? O'qitish to'plamidagi qayta tiklash xatolari ustidan 95 yoki 99-persentil hisoblanadi. Soxta signal tolerantligiga va aniqlash sezgirligiga qarab bu persentil sozlanadi.

Ko'p o'zgaruvchili anomaliya aniqlash uchun qancha ma'lumot kerak? Isolation Forest uchun bir necha ming normal kuzatuv yetarli. LSTM Autoencoder uchun kamida 2–4 haftalik uzluksiz sensor ma'lumotlari tavsiya etiladi (30 soniyalik namuna olish bilan taxminan 60,000–120,000 qator).

Soxta signal darajasini qanday kamaytirish mumkin? Model natijasini to'g'ridan-to'g'ri ogohlantirishga aylantirish o'rniga qoidalar mexanizmi qatlami qo'shilishi kerak. Masalan, bir xil qurilmadan 3 ketma-ket oynada anomaliya bali chegaradan oshsa ogohlantirish beriladi; bir martalik og'ishlar shunchaki jurnalga yoziladi.

Blogga qaytish

Anomaliya aniqlashda yangi yondashuvlar: Ko'p o'zgaruvchili tahlil