Topp 50 Teradata intervjufrågor & Svar

Anonim

Ladda ner PDF

1) Hur definierar du Teradata? Ge några av de primära egenskaperna hos samma.

Teradata är i grunden en RDMS som används för att driva företagets Datamart, Datawarehouse, OLAP, OLTP, samt DSS-apparater. Några av de viktigaste egenskaperna hos Teradata ges nedan.

  • Kan köras på enskilda noder såväl som flera noder.
  • Parallelism är inbyggt i systemet.
  • Mycket kompatibel med standarderna för ANSI.
  • Tenderar att agera på samma sätt som en server.
  • Det är ett öppet system som i princip körs för UNIX MR-RAS, Suse Linux ETC, WIN2K, etc.

2) Vilka är de nyligen utvecklade funktionerna i Teradata?

Några av de nyligen utvecklade funktionerna i Teradata är: -

  • Automatiserad tidsanalys
  • Utvidgning av komprimeringsfunktionerna som möjliggör flexibel komprimering av data ungefär 20 gånger mer data än den tidigare versionen.
  • Kundrelaterad innovation som tetradata synvinkel.

3) Markera några av de viktiga komponenterna i Teradata.

Några av de viktiga komponenterna i Teradata är: -

  • Bynet
  • Access Module Processor (AMP)
  • Parsing Engine (PE)
  • Virtuell disk (vDisk)
  • Virtuellt lagringssystem (VSS)

4) Nämn proceduren genom vilken vi kan köra Teradata-jobb i en UNIX-miljö.

Allt du behöver göra är att utföra körning i UNIX på det sätt som nämns nedan.

$ Sh> BTEQ <[Script Path]> [Logfile Path]

eller

$ Sh> BTEQ <[Script Path] TEE [Logfile Path]

5) Hur genererar vi sekvens i Teradata?

I Teradata genererar vi sekvens genom att använda Identity Column

6) Hur genereras Teradata under visningstiden?

Allt du behöver göra är att använda CSUM.

7) En viss belastning läggs på bordet och det också varje timme. Trafiken på morgonen är relativt låg, och nattens trafik är mycket hög. Enligt denna situation, vilket är det lämpligaste verktyget och hur ska det verktyget laddas?

Det mest föreslagna verktyget här måste vara Tpump. Genom att använda paketstorleken som minskar eller ökar kan trafiken enkelt hanteras.

8) Om snabbladdningsskript misslyckas och endast feltabellerna görs tillgängliga för dig, hur kommer du då att starta om?

Det finns i princip två sätt att starta om i det här fallet.

  • Göra den gamla filen att köra - Se till att du inte tappar fel tabellerna helt. Försök istället att rätta till felen som finns i skriptet eller filen och kör sedan igen.
  • Köra en ny fil - I den här processen körs skriptet helt enkelt med hjälp av slutinläsning och början. Detta hjälper till att ta bort låset som har lagts upp på målbordet och kan också ta bort den angivna posten från snabbloggstabellen. När detta är klart kan du köra hela skriptet igen.

9) Nämn några av ETL-verktygen som faller under Teradata.

Några av ETL-verktygen som ofta används i Teradata är DataStage, Informatica, SSIS, etc.

10) Markera några av de fördelar som ETL-verktyg har jämfört med TD.

Några av fördelarna som ETL-verktyg har jämfört med TD är: -

  • Flera heterogena destinationer, liksom källor, kan drivas.
  • Felsökningsprocessen är mycket enklare med hjälp av ETL-verktyg på grund av fullfjädrat GUI-stöd.
  • Komponenter i ETL-verktyg kan lätt återanvändas, och om det finns en uppdatering till huvudservern uppdateras alla motsvarande applikationer som är anslutna till servern automatiskt.
  • Av- och svängning kan enkelt göras med ETL-verktyg.

11) Vad betyder Caching i Teradata?

Caching betraktas som en extra fördel med att använda Teradata eftersom det främst fungerar med källan som förblir i samma ordning, dvs. inte ändras ofta. Ibland delas Cache vanligtvis mellan applikationer.

12) Hur kan vi kontrollera den version av Teradata som vi använder för närvarande?

Ge bara kommandot .SHOW VERSION.

13) Ange ett motiverat skäl till varför Multi-load stöder NUSI istället för USI.

Indexundertabellraden råkar vara på samma förstärkare på samma sätt som datorraden i NUSI. Således styrs varje förstärkare separat och på ett parallellt sätt.

14) Hur startas om MLOAD Client System efter körning?

Skriptet måste skickas manuellt så att det enkelt kan ladda data från kontrollpunkten som kommer sist.

15) Hur startas om MLOAD Teradata Server efter körning?

Processen utförs i princip från den senast kända kontrollpunkten, och när data har utförts efter körning av MLOAD-skript startas servern om.

16) Vad menas med en nod?

En nod kallas i grunden ett sortiment av komponenter i hårdvara och programvara. Vanligtvis kallas en server för en nod.

17) Låt oss säga att det finns en fil som består av 100 poster där vi behöver hoppa över de första och de sista 20 posterna. Vad kommer kodavsnittet att göra?

Vi måste använda BTEQ Utility för att kunna utföra den här uppgiften. Hoppa över 20 samt Upprepa 60 kommer att användas i manuset.

18) Förklara PDE.

PDE står i grund och botten för Parallel Data Extension. PDE råkar vara ett gränssnittsskikt av programvara som finns ovanför operativsystemet och ger databasen en chans att fungera i en parallell miljö.

19) Vad är TPD?

TPD står i princip för Trusted Parallel Database, och det fungerar i grunden under PDE. Teradata råkar vara en databas som främst fungerar under PDE. Detta är anledningen till att Teradata vanligtvis kallas Trusted Parallel eller Pure Parallel database.

20) Vad menas med en Channel Driver?

En kanaldrivrutin är programvara som fungerar som ett kommunikationsmedium mellan PE och alla applikationer som körs på kanaler som är kopplade till klienterna.

21) Vad menas med Teradata Gateway?

Precis som kanaldrivrutinen fungerar Teradata Gateway som ett kommunikationsmedium mellan Parse Engine och applikationer som är kopplade till nätverksklienter. Endast en gateway tilldelas per nod.

22) Vad menas med en virtuell disk?

Virtual Disk är i grunden en sammanställning av en hel rad cylindrar som är fysiska diskar. Det kallas ibland disk Array.

23) Förklara innebörden av Amp?

Amp står i grunden för Access Module Processor och råkar vara en processor som fungerar virtuellt och används i princip för att hantera en enda del av databasen. Denna speciella del av databasen kan inte delas av någon annan förstärkare. Således kallas denna form av arkitektur vanligen som delad-ingenting-arkitektur.

24) Vad innehåller Amp och vad är alla operationer som den utför?

Amp består i grunden av ett Database Manager Subsystem och kan utföra de åtgärder som nämns nedan.

  • Utför DML
  • Utför DDL
  • Implementering av aggregat och sammanfogningar.
  • Släppa och applicera lås etc.

25) Vad menas med en Parsing Engine?

PE råkar vara en snäll Vproc. Dess primära funktion är att ta SQL-förfrågningar och leverera svar i SQL. Den består av ett brett utbud av mjukvarukomponenter som används för att dela upp SQL i olika steg och sedan skicka dessa steg till AMP.

26) Vad menar du med att analysera?

Parsing är en process som handlar om analys av strängsymboler som antingen finns på datorspråk eller i naturligt språk.

27) Vilka funktioner har en Parser?

En analysator: -

  • Kontrollerar semantikfel
  • Kontrollerar syntaktiska fel
  • Kontrollerar objektets existens

28) Vad menas med en avsändare?

Dispatcher tar en hel samling förfrågningar och lagrar dem sedan i en kö. Samma kö hålls under hela processen för att leverera flera uppsättningar svar.

29) Hur många sessioner av MAX kan PE hantera vid en viss tidpunkt?

PE kan hantera totalt 120 sessioner vid en viss tidpunkt.

30) Förklara BYNET.

BYNET fungerar i princip som ett kommunikationsmedium mellan komponenterna. Det är främst ansvarigt för att skicka meddelanden och ansvarar också för att slå samman och sortera.

31) Vad menas med en klick?

En klick är i grunden känd för att vara ett sortiment av noder som delas mellan vanliga hårddiskar. Närvaro av Clique är oerhört viktigt eftersom det hjälper till att undvika nodfel.

32) Vad händer när en nod drabbas?

Närhelst det förekommer en nods prestandanivå, migrerar alla motsvarande Vprocs omedelbart till en ny nod från failoden för att få tillbaka all data från vanliga enheter.

33) Lista ut alla former av LOCK som finns i Teradata.

Det finns i princip fyra typer av LOCK som faller under Teradata. Dessa är: -

  • Läs Lås
  • Åtkomstlås
  • Exklusivt lås
  • Skrivlås

34) Vilken är den speciella nivå där en LOCK kan tillämpas i Teradata?

  • Tabellnivå - Alla rader som finns i en tabell kommer säkert att vara låsta.
  • Databasnivålås - Alla objekt som finns i databasen kommer att låses.
  • Row Hash Level Lock - Endast de raderna kommer att låses som motsvarar den specifika raden.

35) Vad är poängen för AMP: er som är aktivt involverade i det primära indexet?

Endast en AMP är aktivt involverad i ett primärt index.

36) Vad betyder UPSERT-kommandot i Teradata?

UPSERT står i princip för Update Else Insert. Det här alternativet är endast tillgängligt i Teradata.

37) Markera fördelarna med PPI (Partition Primary Index).

PPI används i princip för intervallbaserade eller kategoribaserade datalagringsändamål. När det gäller områdesfrågor finns det inget behov av användning av fullständig tabellskanning eftersom den genast flyttar till den därav följande partitionen och därmed hoppar över alla andra partitioner.

38) Ange storlekarna SMALLINT, BYTEINT och INTEGER.

SMALLINT - 2 byte - 16 bitar -> -32768 till 32767

BYTEINT - 1 byte - 8 bitar -> -128 till 127

INTEGER - 4 byte - 32 bitar -> -2,147,483,648 till 2,147,483,647

39) Vad menas med en lägsta kostnadsplan?

En lägsta kostnadsplan körs i princip på kortare tid över den kortaste vägen.

40) Markera skillnadspunkterna mellan databasen och användaren i Teradata.

  • En databas är i grunden passiv, medan en användare är aktiv.
  • En databas lagrar främst alla objekt i databasen, medan en användare kan lagra vilket objekt som helst, oavsett om det är ett makro, en tabell, en vy etc.
  • Databasen har inte lösenord medan användaren måste ange lösenord.

41) Markera skillnaderna mellan Primary Key och Primary Index.

  • Primärt index är ganska obligatoriskt, medan Primary Key är valfritt.
  • Primary Index har en gräns på 64 tabeller / kolumner, medan Primary Key inte har någon gräns.
  • Primary Index tillåter dubbletter och nollor, medan Primary Key inte gör det.
  • Primary Index är en fysisk mekanism, medan Primary Key är en rent logisk mekanism.

42) Förklara hur spolutrymme används.

Spolutrymme i Teradata används i princip för att köra frågor. Av det totala utrymmet som finns tillgängligt i Teradata allokeras 20% av utrymmet i princip till spolutrymme.

43) Markera behovet av Performance Tuning.

Prestandajustering i Teradata görs i princip för att identifiera alla flaskhalsar och sedan lösa dem.

44) Kommentera om flaskhalsen är ett fel eller inte.

Tekniskt sett är flaskhals inte en form av fel, men det orsakar verkligen en viss fördröjning i systemet.

45) Hur kan flaskhalsar identifieras?

Det finns i princip fyra sätt att identifiera en flaskhals. Dessa är: -

  • Teradata Visual Förklara
  • Förklara begäran modifierare
  • Teradata Manager
  • Prestandaövervakare

46) Vad menas med en högsta kostnadsplan?

Enligt den högsta kostnadsplanen är det längre tid att genomföra processen och det tar den längsta tillgängliga vägen.

47) Markera alla lägen som finns under konfidensnivå.

Låg, Nej, Hög och Gå med är de fyra lägena som finns under konfidensnivå.

48) Namnge de fem faserna som ingår i MultiLoad Utility.

Preliminär fas, DML-fas, datainsamlingsfas, applikationsfas och slutfas.

49) Markera begränsningarna för TPUMP Utility.

Följande är begränsningarna för TPUMP-verktyget: -

  • Vi kan inte använda SELECT-satsen.
  • Datafiler kan inte sammanfogas.
  • Aggregerade och exponentiella operatörer stöds inte.
  • Aritmetiska funktioner kan inte stödjas.

50) Hur ställs parametrarna för sessionsläge i BTEQ in?

.set session transaktion BTET -> Teradata transaktionsläge

.set session transaktion ANSI -> ANSI-läge

Dessa kommandon fungerar bara när de matas in innan de loggar in på sessionen.