Różnica Między Uczeniem Maszynowym Nadzorowanym I Nienadzorowanym

Spisu treści:

Różnica Między Uczeniem Maszynowym Nadzorowanym I Nienadzorowanym
Różnica Między Uczeniem Maszynowym Nadzorowanym I Nienadzorowanym

Wideo: Różnica Między Uczeniem Maszynowym Nadzorowanym I Nienadzorowanym

Wideo: Różnica Między Uczeniem Maszynowym Nadzorowanym I Nienadzorowanym
Wideo: DeWALT DCS577 2024, Listopad
Anonim

Kluczowa różnica - uczenie maszynowe nadzorowane i nienadzorowane

Uczenie nadzorowane i uczenie nienadzorowane to dwie podstawowe koncepcje uczenia maszynowego. Uczenie nadzorowane to zadanie uczenia maszynowego polegające na uczeniu się funkcji, która odwzorowuje dane wejściowe na dane wyjściowe na podstawie przykładowych par wejście-wyjście. Uczenie się nienadzorowane to zadanie uczenia maszynowego polegające na wywnioskowaniu funkcji opisującej ukrytą strukturę na podstawie danych bez etykiety. Kluczowa różnica między uczeniem maszynowym nadzorowanym i nienadzorowanym polega na tym, że uczenie nadzorowane wykorzystuje dane oznakowane, podczas gdy uczenie nienadzorowane wykorzystuje dane nieoznakowane.

Uczenie maszynowe to dziedzina informatyki, która daje systemowi komputerowemu możliwość uczenia się na podstawie danych bez konieczności bezpośredniego programowania. Pozwala analizować dane i przewidywać w nich wzorce. Istnieje wiele zastosowań uczenia maszynowego. Niektóre z nich to rozpoznawanie twarzy, rozpoznawanie gestów i rozpoznawanie mowy. Istnieje wiele algorytmów związanych z uczeniem maszynowym. Niektóre z nich to regresja, klasyfikacja i grupowanie. Najpopularniejszymi językami programowania do tworzenia aplikacji opartych na uczeniu maszynowym są R i Python. Można również używać innych języków, takich jak Java, C ++ i Matlab.

ZAWARTOŚĆ

1. Omówienie i kluczowa różnica

2. Czym jest uczenie się nadzorowane

3. Czym jest uczenie się bez nadzoru

4. Podobieństwa między uczeniem maszynowym nadzorowanym i nienadzorowanym

5. Porównanie obok siebie - uczenie maszynowe nadzorowane i nienadzorowane w formie tabelarycznej

6. Podsumowanie

Co to jest uczenie nadzorowane?

W systemach opartych na uczeniu maszynowym model działa według algorytmu. W uczeniu nadzorowanym model jest nadzorowany. Najpierw trzeba wytrenować model. Dzięki zdobytej wiedzy może przewidywać odpowiedzi dla przyszłych instancji. Model jest uczony przy użyciu oznaczonego zestawu danych. Gdy do systemu zostaną przekazane dane poza próbką, może on przewidzieć wynik. Poniżej znajduje się mały wyciąg z popularnego zbioru danych IRIS.

Różnica między uczeniem nadzorowanym i nienadzorowanym Rysunek 02
Różnica między uczeniem nadzorowanym i nienadzorowanym Rysunek 02

Zgodnie z powyższą tabelą, długość płatka, szerokość płatka, długość patel, szerokość patel i gatunek są nazywane atrybutami. Kolumny są znane jako funkcje. Jeden wiersz zawiera dane dla wszystkich atrybutów. Dlatego jeden wiersz nazywa się obserwacją. Dane mogą być liczbowe lub jakościowe. Model otrzymuje obserwacje z odpowiednią nazwą gatunku jako danymi wejściowymi. W przypadku podania nowej obserwacji model powinien przewidywać rodzaj gatunku, do którego należy.

W uczeniu nadzorowanym istnieją algorytmy klasyfikacji i regresji. Klasyfikacja to proces klasyfikowania oznaczonych danych. Model stworzył granice, które oddzieliły kategorie danych. Kiedy nowe dane są dostarczane do modelu, można go kategoryzować na podstawie tego, gdzie istnieje punkt. K-Nearest Neighbours (KNN) to model klasyfikacyjny. W zależności od wartości k decyduje się o kategorii. Na przykład, gdy k wynosi 5, jeśli konkretny punkt danych znajduje się blisko ośmiu punktów danych w kategorii A i sześciu punktów danych w kategorii B, wówczas punkt danych zostanie sklasyfikowany jako A.

Regresja to proces przewidywania trendu poprzednich danych w celu przewidzenia wyniku nowych danych. W przypadku regresji wynik może składać się z jednej lub większej liczby zmiennych ciągłych. Prognozowanie jest wykonywane przy użyciu linii obejmującej większość punktów danych. Najprostszym modelem regresji jest regresja liniowa. Jest szybki i nie wymaga parametrów strojenia takich jak w KNN. Jeśli dane pokazują trend paraboliczny, model regresji liniowej nie jest odpowiedni.

Różnica między uczeniem się nadzorowanym i nienadzorowanym
Różnica między uczeniem się nadzorowanym i nienadzorowanym

Oto kilka przykładów algorytmów uczenia nadzorowanego. Ogólnie rzecz biorąc, wyniki generowane za pomocą nadzorowanych metod uczenia są dokładniejsze i bardziej wiarygodne, ponieważ dane wejściowe są dobrze znane i oznaczone. Dlatego maszyna musi analizować tylko ukryte wzory.

Co to jest uczenie się bez nadzoru?

W uczeniu się bez nadzoru model nie jest nadzorowany. Model działa samodzielnie, aby przewidzieć wyniki. Wykorzystuje algorytmy uczenia maszynowego, aby wyciągać wnioski na temat nieoznakowanych danych. Ogólnie rzecz biorąc, nienadzorowane algorytmy uczenia się są trudniejsze niż nadzorowane algorytmy uczenia się, ponieważ jest niewiele informacji. Tworzenie klastrów to rodzaj uczenia się bez nadzoru. Może służyć do grupowania nieznanych danych za pomocą algorytmów. Klastrowanie średniej k i gęstości to dwa algorytmy grupowania.

Algorytm k-średniej, losowo umieszcza k centroidy dla każdego klastra. Następnie każdy punkt danych jest przypisywany do najbliższej centroidy. Odległość euklidesowa służy do obliczania odległości od punktu danych do środka ciężkości. Punkty danych są podzielone na grupy. Położenia k centroidów są obliczane ponownie. Nowa pozycja środka ciężkości jest określana jako średnia wszystkich punktów w grupie. Ponownie każdy punkt danych jest przypisany do najbliższej centroidy. Ten proces powtarza się, aż centroidy przestaną się zmieniać. k-mean to szybki algorytm grupowania, ale nie ma określonej inicjalizacji punktów skupień. Istnieje również duża różnorodność modeli grupowania opartych na inicjalizacji punktów klastrów.

Kolejnym algorytmem grupowania jest grupowanie oparte na gęstości. Jest również znany jako aplikacje klastrowania przestrzennego oparte na gęstości z szumem. Działa poprzez zdefiniowanie klastra jako maksymalnego zestawu połączonych punktów gęstości. Są to dwa parametry używane do grupowania na podstawie gęstości. Są to Ɛ (epsilon) i minimum punktów. Ɛ to maksymalny promień sąsiedztwa. Minimalna liczba punktów to minimalna liczba punktów w Ɛ sąsiedztwie, aby zdefiniować klaster. Oto kilka przykładów łączenia w klastry, które obejmuje uczenie się bez nadzoru.

Generalnie wyniki generowane przez nienadzorowane algorytmy uczenia się nie są zbyt dokładne i wiarygodne, ponieważ maszyna musi zdefiniować i oznaczyć dane wejściowe przed określeniem ukrytych wzorców i funkcji.

Jakie jest podobieństwo między uczeniem maszynowym nadzorowanym i nienadzorowanym?

Uczenie nadzorowane i nienadzorowane to typy uczenia maszynowego

Jaka jest różnica między uczeniem maszynowym nadzorowanym i nienadzorowanym?

Porównaj środek artykułu przed tabelą

Uczenie maszynowe nadzorowane i nienadzorowane

Uczenie nadzorowane to zadanie uczenia maszynowego polegające na uczeniu się funkcji, która mapuje dane wejściowe na dane wyjściowe w oparciu o przykładowe pary wejście-wyjście. Uczenie się nienadzorowane to zadanie uczenia maszynowego polegające na wywnioskowaniu funkcji opisującej ukrytą strukturę na podstawie danych bez etykiet.
Główna funkcjonalność
W uczeniu nadzorowanym model przewiduje wynik na podstawie oznaczonych danych wejściowych. W uczeniu się bez nadzoru model przewiduje wynik bez etykietowanych danych, samodzielnie identyfikując wzorce.
Dokładność wyników
Wyniki generowane przez nadzorowane metody uczenia są dokładniejsze i bardziej wiarygodne. Wyniki uzyskane z metod uczenia się bez nadzoru nie są zbyt dokładne i wiarygodne.
Główne algorytmy
Istnieją algorytmy regresji i klasyfikacji w uczeniu nadzorowanym. Istnieją algorytmy do grupowania w uczeniu się bez nadzoru.

Podsumowanie - uczenie maszynowe nadzorowane i nienadzorowane

Uczenie nadzorowane i uczenie nienadzorowane to dwa rodzaje uczenia maszynowego. Uczenie nadzorowane to zadanie uczenia maszynowego polegające na uczeniu się funkcji, która mapuje dane wejściowe na dane wyjściowe w oparciu o przykładowe pary wejście-wyjście. Uczenie się nienadzorowane to zadanie uczenia maszynowego polegające na wywnioskowaniu funkcji opisującej ukrytą strukturę na podstawie danych bez etykiet. Różnica między uczeniem maszynowym nadzorowanym i nienadzorowanym polega na tym, że nadzorowane uczenie się wykorzystuje dane oznaczone etykietami, podczas gdy nienadzorowane uczenie się wykorzystuje dane nieoznaczone.

Zalecane: