PSI

 0    41 flashcards    mateuszzarzecznymodliborzyce
download mp3 print play test yourself
 
Question język polski Answer język polski
Drzewo decyzyjne
start learning
Model uczenia nadzorowanego podejmujący decyzje poprzez sekwencję pytań o cechy danych
Elementy drzewa decyzyjnego
start learning
Składa się z korzenia węzłów decyzyjnych oraz liści zawierających decyzję
Zasada działania drzewa
start learning
Dane są dzielone według cech tak aby jak najlepiej rozdzielić klasy lub zminimalizować błąd
Overfitting
start learning
Zbyt dobre dopasowanie modelu do danych treningowych skutkujące słabą generalizacją
Jak przeciwdziałać overfittingowi
start learning
Ograniczyć głębokość drzewa zastosować przycinanie lub minimalną liczbę próbek
Bagging
start learning
Metoda zespołowa polegająca na trenowaniu wielu modeli na losowych próbkach danych
Cel baggingu
start learning
Zmniejszenie wariancji modelu i ograniczenie overfittingu
Random Forest
start learning
Zespół drzew decyzyjnych uczonych metodą baggingu z losowym wyborem cech
Gradient Boosting
start learning
Metoda zespołowa w której kolejne modele uczą się na błędach poprzednich
Cel gradient boosting
start learning
Minimalizacja błędu poprzez stopniowe poprawianie słabych modeli
SVM
start learning
Metoda klasyfikacji i regresji oparta na maksymalizacji marginesu między klasami
SVR
start learning
Wersja regresyjna SVM przewidująca wartości ciągłe z tolerancją błędu
Różnica SVM i SVR
start learning
SVM służy do klasyfikacji a SVR do regresji
Model liniowy
start learning
Model opisujący zależność liniową pomiędzy cechami a wynikiem
Model wielomianowy
start learning
Model umożliwiający opisywanie zależności nieliniowych
Zmiana modelu liniowego na wielomianowy
start learning
Zwiększa elastyczność modelu ale grozi overfittingiem
Klasyfikacja
start learning
Przypisywanie obiektów do jednej z określonych klas
Regresja
start learning
Przewidywanie wartości liczbowych ciągłych
Klasteryzacja
start learning
Grupowanie danych bez etykiet na podstawie podobieństwa
Różnica klasyfikacji i klasteryzacji
start learning
Klasyfikacja używa etykiet a klasteryzacja nie
K means
start learning
Algorytm klasteryzacji dzielący dane na k klastrów minimalizując odległość od centroidów
Wady K means
start learning
Wymaga podania liczby klastrów i jest wrażliwy na obserwacje odstające
Klasteryzacja hierarchiczna
start learning
Metoda tworząca hierarchię klastrów poprzez ich łączenie lub dzielenie
Klasteryzacja gęstościowa
start learning
Metoda oparta na zagęszczeniu punktów danych np DBSCAN
Różnica hierarchicznej i gęstościowej
start learning
Hierarchiczna tworzy strukturę drzewa a gęstościowa wykrywa skupiska
Macierz pomyłek
start learning
Tabela przedstawiająca poprawne i błędne decyzje klasyfikatora
True Positive
start learning
Poprawnie wykryta klasa pozytywna
False Positive
start learning
Błędnie wykryta klasa pozytywna
False Negative
start learning
Niewykryta klasa pozytywna
True Negative
start learning
Poprawnie wykryta klasa negatywna
Accuracy
start learning
Stosunek poprawnych predykcji do wszystkich predykcji
Precision
start learning
Udział poprawnych predykcji pozytywnych we wszystkich pozytywnych
Recall
start learning
Udział wykrytych przypadków pozytywnych
F1 score
start learning
Średnia harmoniczna precision i recall
Zastosowanie precision
start learning
Stosowana gdy ważne jest ograniczenie fałszywych alarmów
Zastosowanie recall
start learning
Stosowana gdy ważne jest wykrycie wszystkich przypadków
Regresja liniowa
start learning
Model opisujący liniową zależność pomiędzy zmiennymi
Założenie regresji liniowej
start learning
Reszty mają rozkład normalny i stałą wariancję
Regresja odporna
start learning
Regresja niewrażliwa na obserwacje odstające
Błąd średniokwadratowy
start learning
Miara jakości regresji oparta na średnim kwadracie błędów
Różnica regresji i klasyfikacji
start learning
Regresja przewiduje wartości a klasyfikacja klasy

You must sign in to write a comment