Differenza chiave: machine learning supervisionato e non supervisionato
L'apprendimento supervisionato e l'apprendimento non supervisionato sono due concetti fondamentali dell'apprendimento automatico. L'apprendimento supervisionato è un'attività di apprendimento automatico per l'apprendimento di una funzione che associa un input a un output in base alle coppie input-output di esempio. L'apprendimento senza supervisione è il compito di apprendimento automatico di inferire una funzione per descrivere la struttura nascosta da dati senza etichetta. La differenza fondamentale tra l'apprendimento automatico supervisionato e non supervisionato è che l'apprendimento supervisionato utilizza dati etichettati mentre l'apprendimento non supervisionato utilizza dati senza etichetta.
L'apprendimento automatico è un campo dell'informatica che offre la capacità di un sistema informatico di apprendere dai dati senza essere programmato esplicitamente. Consente di analizzare i dati e di prevedere i modelli in essi contenuti. Esistono molte applicazioni dell'apprendimento automatico. Alcuni di questi sono il riconoscimento facciale, il riconoscimento dei gesti e il riconoscimento vocale. Esistono vari algoritmi relativi all'apprendimento automatico. Alcuni di loro sono la regressione, la classificazione e il clustering. I linguaggi di programmazione più comuni per lo sviluppo di applicazioni basate sull'apprendimento automatico sono R e Python. Possono essere utilizzati anche altri linguaggi come Java, C ++ e Matlab.
CONTENUTI
1. Panoramica e differenza chiave
2. Che cos'è l'apprendimento supervisionato
3. Che cos'è l'apprendimento non supervisionato
4. Somiglianze tra apprendimento automatico supervisionato e non supervisionato
5. Confronto affiancato - Apprendimento automatico supervisionato e non supervisionato in forma tabulare
6. Riepilogo
Cos'è l'apprendimento supervisionato?
Nei sistemi basati sull'apprendimento automatico, il modello funziona secondo un algoritmo. Nell'apprendimento supervisionato, il modello è supervisionato. Innanzitutto, è necessario addestrare il modello. Con la conoscenza acquisita, può prevedere le risposte per i casi futuri. Il modello viene addestrato utilizzando un set di dati etichettato. Quando viene fornito un dato fuori campione al sistema, può prevedere il risultato. Di seguito è riportato un piccolo estratto dal popolare dataset IRIS.
Secondo la tabella sopra, lunghezza del sepalo, larghezza del sepalo, lunghezza della patella, larghezza della patella e specie sono chiamati attributi. Le colonne sono note come caratteristiche. Una riga contiene dati per tutti gli attributi. Pertanto, una riga è chiamata osservazione. I dati possono essere numerici o categoriali. Al modello vengono fornite le osservazioni con il nome della specie corrispondente come input. Quando viene fornita una nuova osservazione, il modello dovrebbe prevedere il tipo di specie a cui appartiene.
Nell'apprendimento supervisionato, ci sono algoritmi per la classificazione e la regressione. La classificazione è il processo di classificazione dei dati etichettati. Il modello ha creato confini che separavano le categorie di dati. Quando vengono forniti nuovi dati al modello, è possibile classificarli in base alla posizione in cui si trova il punto. Il K-Nearest Neighbors (KNN) è un modello di classificazione. A seconda del valore k, viene decisa la categoria. Ad esempio, quando k è 5, se un particolare punto dati è vicino a otto punti dati nella categoria A e sei punti dati nella categoria B, il punto dati sarà classificato come A.
La regressione è il processo di previsione dell'andamento dei dati precedenti per prevedere il risultato dei nuovi dati. Nella regressione, l'output può essere costituito da una o più variabili continue. La previsione viene eseguita utilizzando una linea che copre la maggior parte dei punti dati. Il modello di regressione più semplice è una regressione lineare. È veloce e non richiede parametri di regolazione come in KNN. Se i dati mostrano una tendenza parabolica, il modello di regressione lineare non è adatto.
Questi sono alcuni esempi di algoritmi di apprendimento supervisionato. In generale, i risultati generati dai metodi di apprendimento supervisionato sono più accurati e affidabili perché i dati di input sono ben noti ed etichettati. Pertanto, la macchina deve analizzare solo gli schemi nascosti.
Cos'è l'apprendimento senza supervisione?
Nell'apprendimento non supervisionato, il modello non è supervisionato. Il modello funziona da solo, per prevedere i risultati. Utilizza algoritmi di apprendimento automatico per trarre conclusioni su dati senza etichetta. In generale, gli algoritmi di apprendimento senza supervisione sono più difficili degli algoritmi di apprendimento supervisionato perché ci sono poche informazioni. Il clustering è un tipo di apprendimento senza supervisione. Può essere utilizzato per raggruppare i dati sconosciuti utilizzando algoritmi. La media k e il raggruppamento basato sulla densità sono due algoritmi di raggruppamento.
Algoritmo k-mean, posiziona k centroide in modo casuale per ogni cluster. Quindi ogni punto dati viene assegnato al centroide più vicino. La distanza euclidea viene utilizzata per calcolare la distanza dal punto dati al centroide. I punti dati sono classificati in gruppi. Le posizioni per k centroidi vengono calcolate di nuovo. La nuova posizione del baricentro è determinata dalla media di tutti i punti del gruppo. Anche in questo caso ogni punto dati viene assegnato al centroide più vicino. Questo processo si ripete fino a quando i centroidi non cambiano più. k-mean è un algoritmo di clustering veloce, ma non esiste un'inizializzazione specificata dei punti di clustering. Inoltre, vi è un'elevata variazione dei modelli di cluster basati sull'inizializzazione dei punti del cluster.
Un altro algoritmo di clustering è il clustering basato sulla densità. È anche noto come applicazioni di clustering spaziale basato sulla densità con rumore. Funziona definendo un cluster come l'insieme massimo di punti di densità connessi. Sono due parametri utilizzati per il clustering basato sulla densità. Sono Ɛ (epsilon) e punti minimi. Il Ɛ è il raggio massimo del quartiere. I punti minimi sono il numero minimo di punti nell'intorno Ɛ per definire un cluster. Questi sono alcuni esempi di raggruppamento che rientra nell'apprendimento senza supervisione.
In generale, i risultati generati da algoritmi di apprendimento non supervisionati non sono molto accurati e affidabili perché la macchina deve definire ed etichettare i dati di input prima di determinare i modelli e le funzioni nascoste.
Qual è la somiglianza tra machine learning supervisionato e non supervisionato?
Sia l'apprendimento supervisionato che quello non supervisionato sono tipi di machine learning
Qual è la differenza tra machine learning supervisionato e non supervisionato?
Articolo diff. Al centro prima della tabella
Apprendimento automatico supervisionato e non supervisionato |
|
L'apprendimento supervisionato è l'attività di apprendimento automatico di una funzione che associa un input a un output in base a coppie di input-output di esempio. | L'apprendimento non supervisionato è l'attività di apprendimento automatico di inferire una funzione per descrivere la struttura nascosta da dati senza etichetta. |
Funzionalità principali | |
Nell'apprendimento supervisionato, il modello prevede il risultato in base ai dati di input etichettati. | Nell'apprendimento non supervisionato, il modello prevede il risultato senza dati etichettati identificando i modelli da solo. |
Precisione dei risultati | |
I risultati generati dai metodi di apprendimento supervisionato sono più accurati e affidabili. | I risultati generati da metodi di apprendimento senza supervisione non sono molto accurati e affidabili. |
Algoritmi principali | |
Esistono algoritmi per la regressione e la classificazione nell'apprendimento supervisionato. | Esistono algoritmi per il clustering nell'apprendimento non supervisionato. |
Riepilogo: machine learning supervisionato e non supervisionato
L'apprendimento supervisionato e l'apprendimento non supervisionato sono due tipi di apprendimento automatico. L'apprendimento supervisionato è l'attività di apprendimento automatico di una funzione che associa un input a un output in base a coppie di input-output di esempio. L'apprendimento non supervisionato è l'attività di apprendimento automatico di inferire una funzione per descrivere la struttura nascosta da dati senza etichetta. La differenza tra l'apprendimento automatico supervisionato e non supervisionato è che l'apprendimento supervisionato utilizza dati etichettati mentre l'apprendimento non supervisionato utilizza dati senza etichetta.