Ladda ner PDF
1) Vad är maskininlärning?
Maskininlärning är en gren av datavetenskap som handlar om systemprogrammering för att automatiskt lära sig och förbättra med erfarenhet. Till exempel: Robotar är programmerade så att de kan utföra uppgiften baserat på data de samlar in från sensorer. Det lär sig automatiskt program från data.
2) Nämn skillnaden mellan Data Mining och Machine Learning?
Maskininlärning avser studiet, designen och utvecklingen av algoritmerna som ger datorer förmågan att lära sig utan att uttryckligen programmeras. Data mining kan definieras som den process där ostrukturerad data försöker utvinna kunskap eller okända intressanta mönster. Under denna processmaskin används inlärningsalgoritmer.
3) Vad är 'överanpassning' i maskininlärning?
I maskininlärning, när en statistisk modell beskriver slumpmässigt fel eller brus i stället för underliggande förhållande uppträder 'överanpassning'. När en modell är alltför komplex observeras normalt överanpassning på grund av att ha för många parametrar med avseende på antalet träningsdatatyper. Modellen uppvisar dålig prestanda som har varit överdragen.
4) Varför överanpassning sker?
Möjligheten att överanpassa finns eftersom kriterierna som används för att utbilda modellen inte är desamma som de kriterier som används för att bedöma effektiviteten hos en modell.
5) Hur kan du undvika övermontering?
Genom att använda mycket data kan överanpassning undvikas, överanpassning sker relativt eftersom du har en liten dataset och du försöker lära dig av den. Men om du har en liten databas och du tvingas komma med en modell baserad på den. I en sådan situation kan du använda en teknik som kallas korsvalidering . I den här metoden delas datauppsättningen i två avsnitt, test- och träningsdatamängder, testdataset testar bara modellen medan datapunkterna i träningsdataset kommer med modellen.
I den här tekniken ges vanligtvis en modell en datamängd av kända data på vilka utbildning (träningsdatauppsättning) körs och en datamängd av okänd data mot vilken modellen testas. Tanken med korsvalidering är att definiera en dataset för att "testa" modellen i träningsfasen.
6) Vad är induktiv maskininlärning?
Den induktiva maskininlärningen involverar inlärningsprocessen genom exempel, där ett system från en uppsättning observerade instanser försöker framkalla en allmän regel.
7) Vilka är de fem populära algoritmerna för maskininlärning?
- Beslutsträd
- Neurala nätverk (återförökning)
- Probabilistiska nätverk
- Närmaste granne
- Stöd vektor maskiner
8) Vilka är de olika algoritmteknikerna i maskininlärning?
De olika typerna av tekniker inom maskininlärning är
- Övervakat lärande
- Oövervakat lärande
- Semiövervakat lärande
- Förstärkning lärande
- Transduktion
- Lära sig för att lära
9) Vilka är de tre stegen för att bygga hypoteserna eller modellen i maskininlärning?
- Modellbyggnad
- Modelltestning
- Tillämpa modellen
10) Vad är standardmetoden för övervakat lärande?
Standardmetoden för övervakat lärande är att dela upp exemplet i träningssatsen och testet.
11) Vad är "Training set" och "Test set"?
Inom olika områden inom informationsvetenskap som maskininlärning används en uppsättning data för att upptäcka det potentiellt förutsägbara förhållandet som kallas 'Training Set'. Träningssatsen är ett exempel som ges till eleven, medan testuppsättningen används för att testa noggrannheten hos de hypoteser som genereras av eleven, och det är exemplet som hålls tillbaka från eleven. Träningsset skiljer sig från testuppsättningen.
12) Lista upp olika metoder för maskininlärning?
De olika metoderna inom maskininlärning är
- Koncept mot klassificering
- Symboliskt mot statistiskt lärande
- Induktiv mot analytisk inlärning
13) Vad är inte maskininlärning?
- Artificiell intelligens
- Regelbaserad slutsats
14) Förklara vad som är '' Oövervakat lärande ''?
- Hitta kluster av data
- Hitta lågdimensionella representationer av data
- Hitta intressanta vägbeskrivningar i data
- Intressanta koordinater och korrelationer
- Hitta nya observationer / databasrengöring
15) Förklara vad funktionen "övervakat lärande" är?
- Klassificeringar
- Taligenkänning
- Regression
- Förutse tidsserier
- Kommentera strängar
16) Vad är algoritmoberoende maskininlärning?
Maskininlärning där matematiska grunder är oberoende av någon särskild klassificering eller inlärningsalgoritm kallas algoritmoberoende maskininlärning?
17) Vad är skillnaden mellan artificiellt lärande och maskininlärning?
Designa och utveckla algoritmer enligt beteenden baserat på empiriska data kallas Machine Learning. Medan artificiell intelligens utöver maskininlärning täcker den även andra aspekter som kunskapsrepresentation, naturlig språkbehandling, planering, robotik etc.
18) Vad är klassificerare i maskininlärning?
En klassificerare i en maskininlärning är ett system som matar in en vektor med diskreta eller kontinuerliga funktionsvärden och matar ut ett enskilt diskret värde, klassen.
19) Vilka är fördelarna med Naive Bayes?
I Naïve Bayes kommer klassificeraren att konvergera snabbare än diskriminerande modeller som logistisk regression, så du behöver mindre träningsdata. Den största fördelen är att den inte kan lära sig interaktioner mellan funktioner.
20) I vilka områden används mönsterigenkänning?
Mönsterigenkänning kan användas i
- Datorsyn
- Taligenkänning
- Data Mining
- Statistik
- Informell hämtning
- Bioinformatik
21) Vad är genetisk programmering?
Genetisk programmering är en av de två teknikerna som används vid maskininlärning. Modellen är baserad på testning och val av det bästa valet bland en uppsättning resultat.
22) Vad är induktiv logisk programmering i maskininlärning?
Induktiv logisk programmering (ILP) är ett underfält av maskininlärning som använder logisk programmering som representerar bakgrundskunskap och exempel.
23) Vad är modellval i maskininlärning?
Processen att välja modeller bland olika matematiska modeller, som används för att beskriva samma datamängd, kallas Model Selection. Modellval tillämpas på områdena statistik, maskininlärning och datautvinning.
24) Vilka är de två metoderna som används för kalibrering i övervakat lärande?
De två metoderna som används för att förutsäga goda sannolikheter i övervakat lärande är
- Platt kalibrering
- Isotonisk regression
Dessa metoder är utformade för binär klassificering, och det är inte trivialt.
25) Vilken metod används ofta för att förhindra övermontering?
När det finns tillräckligt med data används 'Isotonic Regression' för att förhindra överproblem.
26) Vad är skillnaden mellan heuristik för regelinlärning och heuristik för beslutsträd?
Skillnaden är att heuristiken för beslutsträd utvärderar den genomsnittliga kvaliteten på ett antal separerade uppsättningar medan regelelever endast utvärderar kvaliteten på den uppsättning instanser som täcks av kandidatregeln.
27) Vad är Perceptron i maskininlärning?
I maskininlärning är Perceptron en algoritm för övervakad klassificering av ingången i en av flera möjliga icke-binära utgångar.
28) Förklara de två komponenterna i det Bayesiska logikprogrammet?
Bayesian logikprogram består av två komponenter. Den första komponenten är en logisk; den består av en uppsättning Bayesian klausuler, som fångar domänens kvalitativa struktur. Den andra komponenten är kvantitativ, den kodar den kvantitativa informationen om domänen.
29) Vad är Bayesian Networks (BN)?
Bayesian Network används för att representera den grafiska modellen för sannolikhetsförhållande mellan en uppsättning variabler.
30) Varför kallas instansbaserad inlärningsalgoritm ibland som Lazy learning algoritm?
Instansbaserad inlärningsalgoritm kallas också som Lazy learning-algoritm eftersom de fördröjer induktions- eller generaliseringsprocessen tills klassificeringen utförs.
31) Vilka är de två klassificeringsmetoderna som SVM (Support Vector Machine) kan hantera?
- Kombinera binära klassificeringar
- Modifierar binär för att inkludera multiklassinlärning
32) Vad är ensembleinlärning?
För att lösa ett visst beräkningsprogram genereras och kombineras flera modeller som klassificerare eller experter. Denna process kallas ensemble learning.
33) Varför används ensembleinlärning?
Ensemble-lärande används för att förbättra klassificeringen, förutsägelsen, funktionstillnärmningen etc. av en modell.
34) När ska man använda ensemble-lärande?
Ensemble-lärande används när du bygger komponentklassificatorer som är mer exakta och oberoende av varandra.
35) Vilka är de två paradigmerna för ensemblemetoder?
De två paradigmerna för ensemblemetoder är
- Sekventiella ensemblemetoder
- Parallella ensemblemetoder
36) Vad är den allmänna principen för en ensemblemetod och vad är påsar och förstärkning i ensemblemetoden?
Den allmänna principen för en ensemblemetod är att kombinera förutsägelser från flera modeller byggda med en given inlärningsalgoritm för att förbättra robustheten över en enda modell. Bagging är en metod i ensemble för att förbättra instabila uppskattnings- eller klassificeringsscheman. Medan boosting-metoden används sekventiellt för att minska bias hos den kombinerade modellen. Boosting och Bagging båda kan minska felen genom att minska variansperioden.
37) Vad är bias-variansnedbrytning av klassificeringsfel i ensemblemetoden?
Det förväntade felet i en inlärningsalgoritm kan sönderdelas i förspänning och varians. En bias-term mäter hur nära den genomsnittliga klassificeraren som produceras av inlärningsalgoritmen matchar målfunktionen. Varianstermen mäter hur mycket inlärningsalgoritmens förutsägelse varierar för olika träningssatser.
38) Vad är en inkrementell inlärningsalgoritm i ensemblen?
Inkrementell inlärningsmetod är förmågan hos en algoritm att lära av nya data som kan vara tillgängliga efter att klassificeraren redan har genererats från redan tillgänglig dataset.
39) Vad används PCA, KPCA och ICA för?
PCA (Principal Components Analysis), KPCA (Kernel based Principal Component Analysis) och ICA (Independent Component Analysis) är viktiga funktioner för extraktionstekniker som används för dimensioneringsreduktion.
40) Vad är dimensionreduktion i maskininlärning?
I maskininlärning och statistik är dimensionreduktion processen för att minska antalet slumpmässiga variabler under överväganden och kan delas in i funktionsval och funktionsuttag.
41) Vad är supportvektormaskiner?
Supportvektormaskiner är övervakade inlärningsalgoritmer som används för klassificering och regressionsanalys.
42) Vilka är komponenterna i relationella utvärderingstekniker?
De viktiga komponenterna i relationella utvärderingstekniker är
- Datainsamling
- Markens sanningsförvärv
- Korsvalideringsteknik
- Frågetyp
- Poängvärde
- Betydelsestest
43) Vilka är de olika metoderna för sekventiellt övervakat lärande?
De olika metoderna för att lösa sekventiella övervakade inlärningsproblem är
- Metoder för skjutfönster
- Återkommande skjutfönster
- Dolda Markow-modeller
- Maximal entropi Markow-modeller
- Villkorliga slumpmässiga fält
- Graftransformatornätverk
44) Vilka är områdena inom robotik och informationsbehandling där sekventiella förutsägelsesproblem uppstår?
Områdena inom robotik och informationsbehandling där sekventiella förutsägelsesproblem uppstår är
- Imitation Learning
- Strukturerad förutsägelse
- Modellbaserad förstärkningslärande
45) Vad är batchstatistiskt lärande?
Statistiska inlärningstekniker gör det möjligt att lära sig en funktion eller prediktor från en uppsättning observerade data som kan göra förutsägelser om osedda eller framtida data. Dessa tekniker ger garantier för den inlärda prediktorens prestanda för framtida osedda data baserat på ett statistiskt antagande om datagenereringsprocessen.
46) Vad är PAC-lärande?
PAC-lärande (troligen ungefär korrekt) är en inlärningsram som har introducerats för att analysera inlärningsalgoritmer och deras statistiska effektivitet.
47) Vilka är de olika kategorierna du kan kategorisera sekvensinlärningsprocessen?
- Sekvensförutsägelse
- Sekvensgenerering
- Sekvensigenkänning
- Sekventiellt beslut
48) Vad är sekvensinlärning?
Sekvensinlärning är en metod för undervisning och inlärning på ett logiskt sätt.
49) Vad är två tekniker för maskininlärning?
De två teknikerna för maskininlärning är
- Genetisk programmering
- Induktivt lärande
Rekommendationsmotorn som implementeras av större e-handelswebbplatser använder Machine Learning.