This is an old revision of the document!
Przegląd Algorytmów Machine Learning w FM
Machine Learning nie jest jedną metodą, lecz zbiorem różnorodnych algorytmów matematycznych. W inżynierii budynkowej dobór odpowiedniego algorytmu zależy od rodzaju dostępnych danych oraz problemu, jaki chcemy rozwiązać (prognoza liczbowaa vs. wykrycie awarii).
Poniżej przedstawiono przegląd metod wykorzystywanych w ramach niniejszego projektu.
1. Algorytmy Regresji (Regression)
Typ uczenia: Nadzorowane (Supervised Learning) Cel: Przewidywanie wartości ciągłej (liczby).
Jest to najczęściej stosowana grupa algorytmów w Facility Management, służąca do prognozowania zużycia mediów.
- Regresja Liniowa (Linear Regression): Modeluje prostą zależność, np. “im zimniej na zewnątrz, tym wyższy koszt ogrzewania”.
- Regresja Wielomianowa (Polynomial Regression): Bardziej zaawansowana, potrafi modelować krzywe (np. nieliniową charakterystykę pracy wentylatora).
Zastosowanie w projekcie: Prognozowanie zużycia energii elektrycznej [kWh] w zależności od temperatury zewnętrznej.
2. Algorytmy Klasyfikacji (Classification)
Typ uczenia: Nadzorowane (Supervised Learning) Cel: Przypisanie danych do konkretnej kategorii (klasy).
Algorytm odpowiada na pytania typu “TAK/NIE” lub “A/B/C”.
- Support Vector Machines (SVM): Bardzo skuteczny w znajdowaniu granicy między stanem “normy” a “awarią” w danych o wysokim zaszumieniu (np. wibracje).
- Drzewa Decyzyjne (Decision Trees) i Random Forest: Budują strukturę warunkową (“jeśli temp > X i ciśnienie < Y, to awaria”). Są łatwe do interpretacji przez inżynierów.
Zastosowanie w projekcie: Predictive Maintenance – klasyfikacja stanu urządzenia jako “Sprawne” lub “Wymaga serwisu”.
3. Algorytmy Klasteryzacji (Clustering)
Typ uczenia: Nienadzorowane (Unsupervised Learning) Cel: Wykrywanie grup i wzorców w danych nieetykietowanych.
Tu algorytm sam szuka podobieństw, nie wiedząc, czego szuka.
- K-Means Clustering: Grupuje punkty danych w 'k' skupisk.
- DBSCAN: Wykrywa skupiska o nieregularnych kształtach i odrzuca punkty odstające (szum).
Zastosowanie w projekcie: Segmentacja typów dni w biurowcu (Dni robocze / Weekendy / Święta) na podstawie profili zużycia wody.
4. Sieci Neuronowe (Neural Networks)
Typ uczenia: Głębokie (Deep Learning) Cel: Modelowanie bardzo złożonych, nieliniowych zależności.
- LSTM (Long Short-Term Memory): Specjalny rodzaj sieci rekurencyjnej (RNN), idealny do analizy szeregów czasowych. Pamięta, co działo się wczoraj, co jest kluczowe przy bezwładności cieplnej budynku.
Zastosowanie w projekcie: Zaawansowana predykcja temperatury wewnętrznej z uwzględnieniem historii pogody z ostatnich 24h.
Podsumowanie doboru metod
W ramach części praktycznej projektu (kod Python) wykorzystano bibliotekę Scikit-Learn. Tabela przedstawia dobór metod do problemów:
| Problem Inżynierski | Rodzaj Danych | Wybrany Algorytm |
|---|---|---|
| Ile prądu zużyje budynek? | Ciągłe (kWh, Temp) | Regresja Liniowa |
| Czy silnik zaraz ulegnie awarii? | Wibracje (Hz) | SVM (Klasyfikacja) |
| Jakie są typy użytkowników biura? | Wejścia (Logs) | K-Means (Klasteryzacja) |
| Jaka będzie temperatura za 4h? | Szereg czasowy | LSTM / Regresja |