Här är intervjufrågor för datamodellering för både fräschare och erfarna kandidater.
1) Vad är datamodellering?
Datamodellering är processen att skapa en modell för data som ska lagras i en databas. Det är en konceptuell representation av dataobjekt, sambandet mellan olika dataobjekt och reglerna.
2) Förklara olika typer av datamodeller
Det finns huvudsakligen tre olika typer av datamodeller:
Konceptuell: Konceptuell datamodell definierar vad systemet ska innehålla. Denna modell skapas vanligtvis av affärsintressenter och dataarkitekter. Syftet är att organisera, omfatta och definiera affärsidéer och regler.
Logiskt: Definierar hur systemet ska implementeras oavsett DBMS. Denna modell skapas vanligtvis av dataarkitekter och affärsanalytiker. Syftet är att utveckla en teknisk karta över regler och datastrukturer.
Fysisk: Denna datamodell beskriver hur systemet kommer att implementeras med ett specifikt DBMS-system. Denna modell skapas vanligtvis av DBA och utvecklare. Syftet är den faktiska implementeringen av databasen.
3) Förklara fakta- och faktatabellen
Faktum representerar kvantitativa data. Till exempel nettobeloppet som förfaller. En faktatabell innehåller numeriska data samt främmande nycklar från dimensionstabeller.
4) Lista ut olika designscheman i datamodellering
Det finns två olika typer av scheman för datamodellering: 1) Stjärnschema och 2) Snöflingaschema
5) När ska du överväga denormalisering?
Denormalisering används när tabellen är mycket involverad när data hämtas. Den används för att konstruera ett datalager.
6) Förklara dimension och attribut
Mått representerar kvalitativa data. Till exempel produkt, klass, plan etc. En dimensionstabell har text- eller beskrivande attribut. Produktkategorin och produktnamnet är till exempel två attribut i produktdimensionstabellen.
7) Vad är faktum mindre faktum?
Fakta mindre är en tabell utan faktamätning. Den innehåller endast dimensionstangenterna.
8) Vad är analys i minnet?
Analys i minnet är en process för att cacha databasen i RAM.
9) Vad är skillnaden mellan OLTP och OLAP?
OLTP | OLAP |
OLTP är ett transaktionssystem online. | OLAP är en online-analys och datainhämtningsprocess. |
Det kännetecknas av ett stort antal korta online-transaktioner. | Det kännetecknas av en stor datamängd. |
OLTP använder traditionella DBMS. | OLAP använder ett datalager. |
Tabeller i OLTP-databasen normaliseras. | Tabellerna i OLAP normaliseras inte. |
Dess svarstid är i millisekunder. | Svarstiden är i sekunder till minuter. |
OLTP är utformad för affärsverksamhet i realtid. | OLAP är utformad för analys av affärsmått efter kategori och attribut. |
10) Vad är tabell?
Samlingen av rader och kolumner kallas som tabell. Varje kolumn har en datatyp. Tabellen innehåller relaterade data i tabellformat.
11) Vad är kolumn?
Kolumn eller fält är ett vertikalt arrangemang av data som innehåller relaterad information.
12) Definiera sparsitet
Data sparsity är en term som används för hur mycket data du har för enhet / dimension av modellen.
13) Vad är sammansatt primärnyckel?
Sammansatt primärnyckel hänvisas till fallet där mer än en tabellkolumn används som en del av primärnyckeln.
14) Vad är primär nyckel?
Primär nyckel är en kolumn eller grupp av kolumner som ojämnt identifierar varje rad i tabellen. Värdet på primärnyckeln får inte vara noll. Varje tabell måste innehålla en primär nyckel.
15) Förklara främmande nyckel
Utländsk nyckel är en grupp attribut som används för att länka överordnad och underordnad tabell. Värdet på den främmande nyckelkolumnen, som finns i underordnad tabell, hänvisas till värdet på den primära nyckeln i överordnadstabellen.
16) Vad är metadata?
Metadata beskriver data om data. Den visar vilken typ av data som faktiskt lagras i databassystemet.
17) Vad är datamart?
En datamart är en kondenserad version av ett datalager och är utformad för användning av en specifik avdelning, enhet eller uppsättning användare i en organisation. Till exempel marknadsföring, HR eller ekonomi.
18) Vad är OLTP?
Online transaktionsbehandling, kort känd som OLTP, stöder transaktionsorienterad applikation i 3-stegsarkitektur. OLTP administrerar den dagliga transaktionen av företag eller organisation.
19) Vilka är exemplen på OLTP-systemet?
Exempel på OLTP-system är:
- Skicka ett textmeddelande
- Lägg till en bok i kundvagnen
- Online flygbiljettbokning
- Internet bank
- Orderläggning
20) Vad är kontrollbegränsning?
Kontrollbegränsning används för att verifiera ett värdeintervall i en kolumn.
21) Lista upp vilka typer av normalisering?
Typer av normaliseringar är: 1) första normala form, 2) andra normala form, 3) tredje normala former, 4) boyce-codd fjärde och 5) femte normala former.
22) Vad är forward data engineering?
Forward engineering är en teknisk term som används för att automatiskt beskriva processen att översätta en logisk modell till ett fysiskt redskap.
23) Vad är PDAP?
Det är en datakub som lagrar data som en sammanfattning. Det hjälper användaren att snabbt analysera data. Data i PDAP lagras på ett sätt som enkelt kan rapporteras.
24) Förklara design av snöflingascheman
Ett snöflingaschema är ett arrangemang av en dimensionstabell och faktatabell. Generellt är båda tabellerna uppdelade i fler dimensionstabeller.
25) Förklara analystjänst
Analystjänst ger en kombinerad bild av de data som används i data mining eller OLAP.
26) Vad är sekvensklusteringsalgoritm?
Sekvensklusteralgoritm samlar vägar som liknar eller är relaterade till varandra och sekvenser av data som har händelser.
27) Vad är diskreta och kontinuerliga data?
Diskreta data är slutliga data eller definierade data. Till exempel kön, telefonnummer. Kontinuerlig data är data som ändras kontinuerligt och ordnat. Till exempel ålder.
28) Vad är tidsseriealgoritmen?
Tidsseriealgoritm är en metod för att förutsäga kontinuerliga värden för data i tabellen. Exempelvis prestanda kan en anställd förutsäga vinst eller inflytande.
29) Vad är Business Intelligence?
BI (Business Intelligence) är en uppsättning processer, arkitekturer och teknologier som omvandlar rådata till meningsfull information som driver lönsamma affärshandlingar. Det är en svit av programvara och tjänster för att omvandla data till handlingsbar intelligens och kunskap.
30) Vad är bitmappat index?
Bitmappsindex är en speciell typ av databasindex som använder bitmappar (bitmatriser) för att svara på frågor genom att utföra bitvisa operationer.
31) Förklara datalagring i detalj
Datalager är en process för att samla in och hantera data från olika källor. Det ger meningsfull insikt om företagen. Datalager används vanligtvis för att ansluta och analysera data från heterogena källor. Det är kärnan i BI-systemet, som är byggt för dataanalys och rapportering.
32) Vad är skräpdimension?
Skräpdimension kombinerar två eller flera relaterade kardinaliteter i en dimension. Det är vanligtvis booleska eller flaggvärden.
33) Förklara datasystemet
Data Scheme är en schematisk framställning som illustrerar dataförhållanden och strukturer.
34) Förklara datainsamlingsfrekvensen
Datainsamlingsfrekvensen är frekvensen för att samla in data. Det går också igenom olika stadier. Dessa steg är: 1) extrahering från olika källor, 3) transformering, 4) rengöring och 5) lagring.
35) Vad är databaskardinalitet?
Kardinalitet är ett numeriskt attribut för förhållandet mellan två enheter eller enhetsuppsättningar.
36) Vilka är de olika typerna av kardinalrelationer?
Olika typer av viktiga kardinalrelationer är:
- En-till-en-relation
- En-till-många-relationer
- Mång-till-en-relation
- Många till många relationer
37) Definiera kritisk framgångsfaktor och ange dess fyra typer
Critical Success Factor är ett gynnsamt resultat av alla aktiviteter som behövs för att organisationen ska nå sitt mål.
Fyra typer av kritisk framgångsfaktor är:
- Industriella CSF: er
- Strategi CSF: er
- Miljö-CSF: er
- Temporal CSF
38) Vad är data mining?
Data mining är en tvärvetenskaplig färdighet som använder maskininlärning, statistik, AI och databasteknik. Det handlar om att upptäcka oväntade / tidigare okända relationer mellan data.
39) Vad är skillnaden mellan stjärnschema och snöflingaschema?
Stjärnskema | Snöflingaschema |
Hierarkier för dimensionerna lagras i dimensionstabellen. | Hierarkier är indelade i separata tabeller. |
Den innehåller en faktatabell omgiven av dimensionstabeller. | En faktabord omgiven av måttbord som i sin tur omges av måttbord |
I ett stjärnschema skapar endast en enda koppling förhållandet mellan faktatabellen och alla dimensionstabeller. | Ett snöflingaschema kräver många sammanfogningar för att hämta data. |
Den har en enkel databasdesign | Den har en komplex databasdesign |
Denormaliserad datastruktur och fråga körs också snabbare. | Normaliserad datastruktur. |
Hög dataredundans | Mycket låg dataredundans |
Erbjuder frågor med högre prestanda med hjälp av Star Join Query Optimization. Tabeller kan anslutas med flera dimensioner. | Snow Flake Schema representeras av en centraliserad faktatabell som osannolikt är kopplad till flera dimensioner. |
40) Vad är identifierande relation?
Identifiera enhetsrelationer i DBMS används för att identifiera en relation mellan två enheter: 1) stark enhet och 2) svag enhet.
41) Vad är ett självrekursivt förhållande?
Rekursivt förhållande är en fristående kolumn i en tabell som är ansluten till huvudnyckeln i samma tabell.
42) Förklara modellering av relationsdata
Relationsdatamodellering är representation av objekt i en relationsdatabas, som vanligtvis normaliseras.
43) Vad är prediktiv modelleringsanalys?
Processen att validera eller testa en modell som skulle användas för att förutsäga testning och validering av resultat. Den kan användas för maskininlärning, artificiell intelligens samt statistik.
44) Vad är skillnaden mellan logisk datamodell och fysisk datamodell?
Logisk datamodell | Fysisk datamodell |
En logisk datamodell kan utforma kravet på affärslogiskt. | En fysisk datamodell ger information om måldatabaskällan och dess egenskaper. |
Det ansvarar för det faktiska genomförandet av data som lagras i databasen. | En fysisk datamodell hjälper dig att skapa en ny databasmodell från befintlig och tillämpa begränsningen för referensintegritet. |
Den innehåller en enhet, primära nyckelattribut, inversionsnycklar, alternativ nyckel, regel, affärsrelation, definition etc. | En fysisk datamodell innehåller en tabell, nyckelbegränsningar, unik nyckel, kolumner, främmande nyckel, index, standardvärden etc. |
45) Vilka är de olika typerna av begränsningar?
En annan typ av begränsning kan vara unik, nullvärden, främmande nycklar, sammansatt nyckel eller kontrollbegränsning etc.
46) Vad är ett datamodelleringsverktyg?
Datamodelleringsverktyget är en programvara som hjälper till att konstruera dataflöde och förhållandet mellan data. Exempel på sådana verktyg är Borland Together, Altova Database Spy, casewise, Case Studio 2, etc.
47) Vad är hierarkiskt DBMS?
I den hierarkiska databasen är modelldata organiserade i en trädliknande struktur. Data lagras i ett hierarkiskt format. Data representeras med hjälp av ett förhållande mellan förälder och barn. I hierarkiska DBMS-föräldrar kan ha många barn, barn har bara en förälder.
48) Vilka är nackdelarna med den hierarkiska datamodellen?
Nackdelarna med den hierarkiska datamodellen är:
- Det är inte flexibelt eftersom det tar tid att anpassa sig till företagets förändrade behov.
- Strukturen utgör frågan inom kommunikation mellan avdelningar, vertikal kommunikation och kommunikation mellan myndigheter.
- Hierarkisk datamodell kan skapa problem med splittring.
49) Förklara det processdrivna tillvägagångssättet för datamodellering
Processdrivet tillvägagångssätt som används i datamodellering följer en steg för steg-metod för förhållandet mellan enhetsrelationsmodellen och organisationsprocessen.
50) Vilka är fördelarna med att använda datamodellering?
Fördelarna med att använda datamodellering i datalagring är:
- Det hjälper dig att hantera affärsdata genom att normalisera den och definiera dess attribut.
- Datamodellering integrerar data från olika system för att minska dataredundans.
- Det gör det möjligt att skapa effektiv databasdesign.
- Datamodellering hjälper organisationsavdelningen att fungera som ett team.
- Det underlättar åtkomst till data med lätthet.
51) Vilka är nackdelarna med att använda datamodellering?
Nackdelarna med att använda datamodellering är:
- Det har mindre strukturellt oberoende
- Det kan göra systemet komplicerat.
52) Vad är index?
Index används för en kolumn eller grupp av kolumner för att hämta data snabbt.
53) Vilka egenskaper kännetecknar en logisk datamodell?
Kännetecken för logisk datamodell är:
- Beskriver databehov för ett enda projekt men kan integreras med andra logiska datamodeller baserat på projektets omfattning.
- Designad och utvecklad oberoende av DBMS.
- Dataattribut kommer att ha datatyper med exakta precisioner och längd.
- Normaliseringsprocesser till modellen, som vanligtvis tillämpas vanligtvis till 3NF.
54) Vilka egenskaper kännetecknar den fysiska datamodellen?
Kännetecken för fysisk datamodell är:
- Den fysiska datamodellen beskriver databehovet för ett enda projekt eller en applikation. Den kan integreras med andra fysiska datamodeller baserat på projektets omfattning.
- Datamodellen innehåller förhållanden mellan tabeller som adresserar kardinaliteten och ogiltigheten av relationerna.
- Utvecklad för en specifik version av en DBMS, plats, datalagring eller teknik som ska användas i projektet.
- Kolumner ska ha exakta datatyper, tilldelade längder och standardvärden.
- Primära och främmande nycklar, vyer, index, åtkomstprofiler och behörigheter etc. definieras.
55) Vilka är de två typerna av datamodelleringstekniker?
Två typer av datamodelleringstekniker är: 1) enhetsrelation (ER) -modell och 2) UML (Unified Modeling Language).
56) Vad är UML?
UML (Unified Modeling Language) är ett allmänt ändamål, databasutveckling, modelleringsspråk inom programvaruteknik. Huvudsyftet är att tillhandahålla ett generaliserat sätt att visualisera systemdesign.
57) Förklara objektorienterad databasmodell
Den objektorienterade databasmodellen är en samling objekt. Dessa objekt kan ha tillhörande funktioner såväl som metoder.
58) Vad är en nätverksmodell?
Det är en modell som bygger på hierarkisk modell. Det tillåter mer än en relation att länka poster, vilket indikerar att den har flera poster. Det är möjligt att skapa en uppsättning överordnade poster och underordnade poster. Varje post kan tillhöra flera uppsättningar som gör att du kan utföra komplexa tabellrelationer.
59) Vad är hashing?
Hashing är en teknik som används för att söka i alla indexvärden och hämta önskad data. Det hjälper till att beräkna den direkta platsen för data som spelas in på hårddisken utan att använda indexets struktur.
60) Vad är affärs- eller naturnycklar?
affärs- eller naturnycklar är ett fält som unikt identifierar en enhet. Till exempel klient-ID, anställd, e-post etc.
61) Vad är sammansatt nyckel?
När mer än ett fält används för att representera en nyckel kallas det en sammansatt nyckel.
62) Vad är den första normala formen?
Första normala formen eller 1NF är en egenskap för en relation som finns i ett relationsdatabashanteringssystem. Varje relation kallas första normala formen om domänen för varje attribut innehåller värden som är atomära. Den innehåller ett värde från den domänen.
63) Vad är skillnaden mellan primärnyckel och främmande nyckel?
Primärnyckel | Främmande nyckel |
Primär nyckel hjälper dig att identifiera en post i tabellen. | Utländsk nyckel är ett fält i tabellen som är den primära nyckeln till en annan tabell. |
Primär nyckel accepterar aldrig nollvärden. | En främmande nyckel kan acceptera flera nollvärden. |
Primär nyckel är ett klusterindex och data i DBMS-tabellen är fysiskt organiserade i sekvensen för det klustrade indexet. | En främmande nyckel kan inte automatiskt skapa ett index, grupperat eller icke-klustrat. Du kan dock skapa ett index manuellt på den utländska nyckeln. |
Du kan ha den enda primära nyckeln i en tabell. | Du kan ha flera främmande nycklar i en tabell. |
64) Vilka är kraven för den andra normala formen?
Kraven på den andra normala formen är:
- Det borde vara i första normala form.
- Det innehåller inget attribut som inte är primärt, vilket är funktionellt beroende av någon delmängd av kandidatnyckeln i tabellrelationen.
65) Vilka är reglerna för den tredje normala formen?
Regler för tredje normala former är:
- Det ska vara i andra normala form
- Det har inga övergående funktionella beroenden.
66) Vilken betydelse är det att använda tangenter?
- Nycklar hjälper dig att identifiera valfri rad i en tabell. I en verklig applikation kan en tabell innehålla tusentals poster.
- Nycklar säkerställer att du unikt kan identifiera en tabellpost trots dessa utmaningar.
- Låter dig skapa en relation mellan och identifiera förhållandet mellan tabeller
- Hjälper dig att upprätthålla identitet och integritet i relationen.
67) Vad är en surrogatnyckel?
En konstgjord nyckel som syftar till att identifiera varje post unikt kallas en surrogatnyckel. Dessa typer av nycklar är unika eftersom de skapas när du inte har någon naturlig primärnyckel. De ger ingen mening med data i tabellen. Surrogatnyckel är vanligtvis ett heltal.
68) Förklara den alternativa tangenten i detalj
Alternativ nyckel är en kolumn eller grupp av kolumner i en tabell som unikt identifierar varje rad i den tabellen. En tabell kan ha flera val för en primärnyckel, men endast en kan ställas in som primärnyckel. Alla nycklar som inte är primärnyckel kallas en alternativ nyckel.
69) Vad är den fjärde normala formen i DBMS?
Den fjärde normala formen är en nivå av databasnormalisering där det inte får ha något triviellt beroende annat än kandidatnyckeln.
70) Vad är ett databashanteringssystem?
Database management system eller DBMS är en programvara för att lagra och hämta användardata. Den består av en grupp program som manipulerar databasen.
71) Vad är regeln för den femte normala formen?
En tabell är endast i femte normala formen om den är i den 4: e normala formen, och den kan inte sönderdelas i ett antal mindre tabeller utan förlust av data.
72) Vad är normalisering?
Normalisering är en databasdesignteknik som organiserar tabeller på ett sätt som minskar redundans och beroende av data. Den delar upp större tabeller i mindre tabeller och länkar dem med hjälp av relationer.
73) Förklara egenskaperna hos ett databashanteringssystem
- Ger säkerhet och tar bort överflöd
- Självbeskrivande typ av databassystem
- Isolering mellan program och dataabstraktion
- Stöd för flera datavyer.
- Delning av data och bearbetning av flera användare
- DBMS tillåter enheter och relationer mellan dem att bilda tabeller.
- Den följer ACID-konceptet (Atomicitet, Konsistens, Isolering och Hållbarhet).
- DBMS stöder en fleranvändarmiljö som tillåter användare att komma åt och komma åt och manipulera data parallellt.
74) Lista ut populär DBMS-programvara
Populär DBMS-programvara är:
- MySQL
- Microsoft Access
- Orakel
- PostgreSQL
- dbase
- FoxPro
- SQLite
- IBM DB2
- Microsoft SQL Server.
75) Förklara begreppet RDBMS
Relational Database Management System är en programvara som används för att lagra data i form av tabeller. I den här typen av system hanteras och lagras data i rader och kolumner, vilket kallas tuples och attribut. RDBMS är ett kraftfullt datahanteringssystem och används ofta i hela världen.
76) Vilka är fördelarna med datamodell?
Fördelarna med datamodellen är:
- Huvudmålet med en designande datamodell är att se till att dataobjekt som erbjuds av det funktionella teamet representeras exakt.
- Datamodellen bör vara tillräckligt detaljerad för att användas för att bygga den fysiska databasen.
- Informationen i datamodellen kan användas för att definiera förhållandet mellan tabeller, primära och främmande nycklar och lagrade procedurer.
- Data Model hjälper företag att kommunicera inom och mellan organisationer.
- Datamodellen hjälper till att dokumentera mappningar av data i ETL-processen
- Hjälp till att känna igen korrekta datakällor för att fylla i modellen
77) Vilka är nackdelarna med datamodellen?
Nackdelarna med datamodellen är:
- För att utveckla datamodellen bör man känna till fysiska datalagrade egenskaper.
- Detta är ett navigationssystem som producerar komplex applikationsutveckling, hantering. Det kräver alltså kunskap om den biografiska sanningen.
- Även mindre ändringar i strukturen kräver ändringar i hela applikationen.
- Det finns ingen uppsättning språk för databehandling i DBMS.
78) Förklara olika typer av faktatabeller
Det finns tre typer av faktatabeller:
- Tillsats: Det är ett mått som läggs till i alla dimensioner.
- Icke-tillsats: Det är ett mått som inte kan läggas till någon dimension.
- Halvadditiv: Det är ett mått som kan läggas till i några få dimensioner.
79) Vad är aggregattabell?
Aggregatstabellen innehåller aggregerade data som kan beräknas med funktioner som: 1) Genomsnitt 2) MAX, 3) Antal, 4) SUM, 5) SUM och 6) MIN.
80) Vad är en bekräftad dimension?
En anpassad dimension är en dimension som är utformad på ett sätt som kan användas i många faktatabeller i olika delar av ett datalager.
81) Lista typer av hierarkier i datamodellering
Det finns två typer av hierarkier: 1) nivåbaserade hierarkier och 2) föräldra-barnhierarkier.
82) Vad är skillnaden mellan en datamart och ett datalager?
Data mart | Datalager |
Data mart fokuserar på ett enda ämnesområde. | Datalager fokuserar på flera affärsområden. |
Den används för att fatta taktiska beslut för företagstillväxt. | Det hjälper företagare att ta ett strategiskt beslut |
Data mart följer bottom-up-modellen | Datalager följer en top-down-modell |
Datakällan kommer från en datakälla | Datakällan kommer från mer än en heterogen datakälla. |
83) Vad är XMLA?
XMLA är en XML-analys som anses vara standard för åtkomst till data i Online Analytical Processing (OLAP).
84) Förklara skräpdimension
Skräpdimension hjälper till att lagra data. Den används när data inte är korrekt att lagra i schemat.
85) Förklara kedjad replikering
Situationen när en sekundär nod väljer mål med hjälp av pingtid eller när närmaste nod är en sekundär kallas den som kedjad datareplikering.
86) Förklara virtuell datalagring
Ett virtuellt datalager ger en samlad bild av de ifyllda uppgifterna. Ett virtuellt datalager har inte historisk data. Det betraktas som en logisk datamodell med metadata.
87) Förklara ögonblicksbild av datalager
Ögonblicksbild är en fullständig visualisering av data vid den tidpunkt då datautvinningsprocessen börjar.
88) Vad är ett dubbelriktat extrakt?
Systemets förmåga att extrahera, rensa och överföra data i två riktningar kallas ett riktad extrakt.