Vad är övervakad maskininlärning?
I övervakad lärande tränar du maskinen med hjälp av data som är väl märkta . Det betyder att vissa data redan är taggade med rätt svar. Det kan jämföras med lärande som sker i närvaro av en handledare eller en lärare.
En övervakad inlärningsalgoritm lär sig av märkta träningsdata, hjälper dig att förutsäga resultat för oförutsedda data. Att framgångsrikt bygga, skala och distribuera noggrann övervakad maskininlärning Datavetenskapsmodell tar tid och teknisk expertis från ett team av högkvalificerade datavetare. Dessutom måste datavetare bygga om modeller för att säkerställa att insikterna förblir sanna tills dess data ändras.
I den här handledningen lär du dig
- Vad är övervakad maskininlärning?
- Vad är oövervakat lärande?
- Varför övervakat lärande?
- Varför oövervakat lärande?
- Hur övervakat lärande fungerar?
- Hur fungerar icke-övervakat lärande?
- Typer av övervakade maskininlärningstekniker
- Typer av icke-övervakade tekniker för maskininlärning
- Övervakad kontra icke övervakad inlärning
Vad är oövervakat lärande?
Oövervakat lärande är en maskininlärningsteknik där du inte behöver övervaka modellen. Istället måste du låta modellen arbeta på egen hand för att upptäcka information. Den handlar främst omärkta data.
Oövervakade inlärningsalgoritmer låter dig utföra mer komplexa bearbetningsuppgifter jämfört med övervakat lärande. Även om övervakat lärande kan vara mer oförutsägbart jämfört med andra naturliga inlärningsmetoder för djupinlärning och förstärkning.
Varför övervakat lärande?
- Med övervakat lärande kan du samla in data eller producera en datautgång från den tidigare erfarenheten.
- Hjälper dig att optimera prestandakriterier med hjälp av erfarenhet
- Övervakad maskininlärning hjälper dig att lösa olika typer av verkliga beräkningsproblem.
Varför oövervakat lärande?
Här är de främsta anledningarna till att använda icke-övervakat lärande:
- Oövervakad maskininlärning hittar alla slags okända mönster i data.
- Oövervakade metoder hjälper dig att hitta funktioner som kan vara användbara för kategorisering.
- Det äger rum i realtid, så alla ingångsdata som ska analyseras och märkas i närvaro av elever.
- Det är lättare att få omärkt data från en dator än märkt data, som behöver manuellt ingripande.
Hur övervakat lärande fungerar?
Du vill till exempel träna en maskin som hjälper dig att förutsäga hur lång tid det tar för dig att köra hem från din arbetsplats. Här börjar du med att skapa en uppsättning märkta data. Dessa uppgifter inkluderar
- Väderförhållanden
- Tid på dagen
- Högtider
Alla dessa detaljer är dina ingångar. Produktionen är den tid det tog att köra hem den specifika dagen.
Du vet instinktivt att om det regnar ute, tar det längre tid att köra hem. Men maskinen behöver data och statistik.
Låt oss nu se hur du kan utveckla en övervakad inlärningsmodell för detta exempel som hjälper användaren att bestämma pendeltiden. Det första du behöver skapa är en träningsdatauppsättning. Den här träningssatsen innehåller den totala pendeltiden och motsvarande faktorer som väder, tid etc. Baserat på den här träningsuppsättningen kanske din maskin ser att det finns ett direkt samband mellan mängden regn och tid det tar att komma hem.
Så det konstaterar att ju mer det regnar, desto längre kör du för att komma tillbaka till ditt hem. Det kan också se sambandet mellan tiden du lämnar jobbet och tiden du är på väg.
Ju närmare du är 18.00 desto längre tid tar det för dig att komma hem. Din maskin kan hitta några av förhållandena med dina märkta data.
Detta är början på din datamodell. Det börjar påverka hur regn påverkar hur människor kör. Det börjar också se att fler reser under en viss tid på dagen.
Hur fungerar icke-övervakat lärande?
Låt oss ta fallet med en baby och hennes familjens hund.
Hon känner till och identifierar den här hunden. Några veckor senare tar en familjevän med sig en hund och försöker leka med barnet.
Baby har inte sett den här hunden tidigare. Men det känner igen många funktioner (2 öron, ögon, gå på 4 ben) är som hennes husdjur. Hon identifierar ett nytt djur som en hund. Det här är inlärning utan tillsyn, där man inte lärs ut men man lär sig av uppgifterna (i det här fallet uppgifter om en hund.) Hade detta övervakat lärande, skulle familjevännen ha sagt till barnet att det är en hund.
Typer av övervakade maskininlärningstekniker
Regression:
Regressionsteknik förutspår ett enda utgångsvärde med hjälp av träningsdata.
Exempel: Du kan använda regression för att förutsäga huspriset från träningsdata. Ingångsvariablerna kommer att vara ort, storlek på ett hus etc.
Klassificering:
Klassificering innebär att gruppera utdata i en klass. Om algoritmen försöker märka inmatning i två distinkta klasser kallas det binär klassificering. Att välja mellan mer än två klasser kallas multiklassklassificering.
Exempel : Att avgöra om någon kommer att vara ett lånefall.
Styrkor : Output har alltid en sannolik tolkning, och algoritmen kan regleras för att undvika övermontering.
Svagheter : Logistisk regression kan underprestera när det finns flera eller icke-linjära beslutsgränser. Denna metod är inte flexibel, så den fångar inte mer komplexa relationer.
Typer av icke-övervakade tekniker för maskininlärning
Oövervakade inlärningsproblem grupperas ytterligare i kluster- och associeringsproblem.
Kluster
Clustering är ett viktigt begrepp när det gäller inlärning utan tillsyn. Det handlar främst om att hitta en struktur eller ett mönster i en samling okategoriserade data. Klusteralgoritmer bearbetar dina data och hittar naturliga kluster (grupper) om de finns i data. Du kan också ändra hur många kluster dina algoritmer ska identifiera. Det låter dig justera granulariteten för dessa grupper.
Förening
Föreningsregler tillåter dig att skapa associering mellan dataobjekt i stora databaser. Den här tekniken utan tillsyn handlar om att upptäcka spännande förhållanden mellan variabler i stora databaser. Till exempel människor som köper ett nytt hem mest sannolikt att köpa nya möbler.
Andra exempel:
- En undergrupp av cancerpatienter grupperade efter deras genuttrycksmätningar
- Grupper av shoppare baserat på deras webb- och köphistorik
- Filmgrupp efter betyg från filmtittare
Övervakad kontra icke övervakad inlärning
Parametrar | Övervakad teknik för maskininlärning | Oövervakad maskininlärningsteknik |
Bearbeta | I en övervakad inlärningsmodell ges input- och output-variabler. | I icke-övervakad inlärningsmodell kommer endast indata att ges |
Indata | Algoritmer tränas med hjälp av märkta data. | Algoritmer används mot data som inte är märkta |
Algoritmer används | Stödvektormaskin, neurala nätverk, linjär och logistisk regression, slumpmässig skog och klassificeringsträd. | Oövervakade algoritmer kan delas in i olika kategorier: som klusteralgoritmer, K-medel, hierarkisk kluster etc. |
Beräkningskomplexitet | Övervakat lärande är en enklare metod. | Oövervakat lärande är beräkningsmässigt komplext |
Användning av data | Övervakad inlärningsmodell använder träningsdata för att lära sig en länk mellan ingången och utgångarna. | Icke-övervakat lärande använder inte utdata. |
Noggrannhet av resultat | Mycket noggrann och pålitlig metod. | Mindre noggrann och pålitlig metod. |
Realtidsinlärning | Inlärningsmetoden sker offline. | Inlärningsmetoden sker i realtid. |
Antal klasser | Antal klasser är känt. | Antal klasser är inte känt. |
Huvudnackdelen | Klassificering av big data kan vara en verklig utmaning i Supervised Learning. | Du kan inte få exakt information om datasortering, och utdata som data som används i oövervakad inlärning är märkta och inte kända. |
Sammanfattning
- I övervakad inlärning tränar du maskinen med hjälp av data som är väl märkta.
- Oövervakat lärande är en maskininlärningsteknik där du inte behöver övervaka modellen.
- Med övervakat lärande kan du samla in data eller producera en datautgång från den tidigare erfarenheten.
- Oövervakad maskininlärning hjälper dig att hitta alla slags okända mönster i data.
- Till exempel kommer du att kunna bestämma den tid det tar att komma tillbaka basera på väderförhållanden, tider på dagen och semester.
- Baby kan till exempel identifiera andra hundar baserat på tidigare övervakat lärande.
- Regression och klassificering är två typer av övervakade tekniker för maskininlärning.
- Clustering and Association är två typer av icke-övervakat lärande.
- I en övervakad inlärningsmodell kommer input- och output-variabler att ges medan med icke-övervakad inlärningsmodell kommer endast inputdata att ges