Topp 30 Hbase-intervjufrågor & Svar

Anonim

Ladda ner PDF

Följande är vanliga frågor i intervjuer för nybörjare och erfarna HBase-utvecklare.

1) Förklara vad som är Hbase?

Hbase är ett kolumnorienterat databashanteringssystem som körs ovanpå HDFS (Hadoop Distribute File System). Hbase är inte ett relationsdatalager och stöder inte strukturerat frågespråk som SQL.

I Hbase reglerar en masternod kluster- och regionservrarna för att lagra delar av tabellerna och hanterar arbetet med data.

2) Förklara varför man använder Hbase?

  • Högkapacitetslagringssystem
  • Distribuerad design för att tillgodose stora bord
  • Kolumnorienterade butiker
  • Horisontellt skalbar
  • Hög prestanda och tillgänglighet
  • Basmålet för Hbase är miljoner kolumner, tusentals versioner och miljarder rader
  • Till skillnad från HDFS (Hadoop Distribute File System) stöder den slumpmässiga CRUD-operationer i realtid

3) Nämn vilka huvudkomponenter i Hbase?

  • Zookeeper: Det fungerar samordningsarbetet mellan klient och Hbase Maser
  • Hbase Master: Hbase Master övervakar Region Server
  • RegionServer: RegionServer övervakar regionen
  • Region: Den innehåller i minnesdatalager (MemStore) och Hfile.
  • Katalogtabeller: Katalogtabeller består av ROOT och META

4) Förklara vad består Hbase av?

  • Hbase består av en uppsättning bord
  • Och varje tabell innehåller rader och kolumner som traditionell databas
  • Varje tabell måste innehålla ett element definierat som en primär nyckel
  • Hbase-kolumn anger ett attribut för ett objekt

5) Nämn hur många operativa kommandon i Hbase?

Operativt kommando i Hbases är ungefär fem typer

  • Skaffa sig
  • Sätta
  • Radera
  • Skanna
  • Ökning

6) Förklara vad är WAL och Hlog i Hbase?

WAL (Write Ahead Log) liknar MySQL BIN-loggen; den registrerar alla ändringar som sker i data. Det är en vanlig sekvensfil av Hadoop och den lagrar HLogkey's. Dessa nycklar består av ett löpnummer såväl som faktiska data och används för att spela upp ännu inte bestående data efter en serverkrasch. Så, i kontanter för serverfel fungerar WAL som en livslinje och hämtar förlorade data.

7) När ska du använda Hbase?

  • Datastorleken är enorm: När du har massor av miljoner poster att använda
  • Komplett omdesign: När du flyttar RDBMS till Hbase betraktar du det som en komplett omformning och bara bara byta portar
  • SQL-Less-kommandon: Du har flera funktioner som transaktioner; inre sammanfogningar, typade kolumner etc.
  • Infrastrukturinvesteringar: Du måste ha tillräckligt med kluster för att Hbase ska vara riktigt användbart

8) Vad är kolumnfamiljer i Hbase?

Kolumnfamiljer utgör den grundläggande enheten för fysisk lagring i Hbase där funktioner som kompressioner tillämpas.

9) Förklara vad som är radnyckeln?

Radnyckel definieras av applikationen. Eftersom den kombinerade nyckeln är förinställd av radnyckeln, gör det att applikationen kan definiera önskad sorteringsordning. Det tillåter också logisk gruppering av celler och se till att alla celler med samma radnyckel är placerade på samma server.

10) Förklara borttagning i Hbase? Nämn vilka är de tre typerna av gravstenmarkörer i Hbase?

När du tar bort cellen i Hbase raderas faktiskt inte data utan en gravstenmarkör ställs in, vilket gör de raderade cellerna osynliga. Hbase bort tas faktiskt bort under komprimering.

Tre typer av gravstenmarkörer finns där:

  • Markering för radering av version: För radering markerar den en enda version av en kolumn
  • Markering för kolumnradering: För radering markerar den alla versioner av en kolumn
  • Familjemarkeringsmarkör: För radering markerar den alla kolumner för en kolumnfamilj

11) Förklara hur raderar Hbase faktiskt en rad?

I Hbase, vad du än kommer att lagras från RAM till disk, är dessa diskskrivningar oföränderlig spärrkomprimering. Under borttagningsprocessen i Hbase tar markören för större komprimeringsprocess bort medan mindre komprimeringar inte gör det. I normala borttagningar resulterar det i en radering av gravstenmarkör - dessa borttagningsdata de representerar tas bort under komprimering.

Om du tar bort data och lägger till mer data, men med en tidigare tidsstämpel än tidsstenen för gravstenen, kan ytterligare Gets maskeras av borttagnings- / gravstenmarkören och därför får du inte det infogade värdet förrän efter den stora komprimeringen.

12) Förklara vad som händer om du ändrar blockstorleken för en kolumnfamilj i en redan upptagen databas?

När du ändrar blockstorleken för kolumnfamiljen upptar den nya data den nya blockstorleken medan den gamla informationen förblir inom den gamla blockstorleken. Under datakompaktering kommer gamla data att ta den nya blockstorleken. Nya filer när de spolas, har en ny blockstorlek medan befintlig data fortsätter att läsas korrekt. All data ska omvandlas till den nya blockstorleken efter nästa stora komprimering.

13) Nämn skillnaden mellan Hbase och Relational Database?

Hbase Relationsdatabas
  • Det är schemafritt
  • Det är en kolumnorienterad datalager
  • Den används för att lagra avnormaliserad data
  • Den innehåller glesbefolkade tabeller
  • Automatiserad partitionering görs i Hbase
  • Det är en schemabaserad databas
  • Det är en radorienterad datalager
  • Den används för att lagra normaliserad data
  • Den innehåller tunna bord
  • Det finns inget sådant tillhandahållande eller inbyggt stöd för partitionering

14) Vad är HBaseFsck-klass?

Det finns ett verktygsnamn som kallas tillbaka är tillgängligt i HBase, vilket implementeras av HBaseFsck-klassen. Det erbjuder flera kommandoradsomkopplare som påverkar dess beteende.

15) Vilka är de viktigaste nyckelstrukturerna för HBase?

Radnyckel och kolumnnyckel är de två viktigaste nyckelstrukturerna som används i HBase

16) Diskutera hur du kan använda filter i Apache HBase

Filter i HBase Shell. Det introducerades i Apache HBase 0.92 som hjälper dig att genomföra serversidesfiltrering för åtkomst till HBase över HBase-skal eller sparsamhet.

17) HBase-stöd för syntaxstruktur som SQL ja eller nej?

Nej, tyvärr finns inte SQL-stöd för HBase för närvarande. Men genom att använda Apache Phoenix kan vi hämta data från HBase genom SQL-frågor.

18) Vad är innebörden av komprimering i HBase?

Vid tidpunkten för stora inkommande skrivningar är det omöjligt att uppnå optimal prestanda genom att ha en fil per butik. HBase hjälper dig att kombinera alla dessa HFiles för att minska antalet diskfrön för varje läsning. Denna process kallas för komprimering i HBase.

19) Hur kommer du att implementera kopplingar i HBase?

HBase, stöder inte anslutningar direkt men använder MapReduce-jobb. Anslutningsfrågor kan implementeras genom att hämta data med hjälp av olika HBase-tabeller.

20) Förklara JMX angående HBSE

Java Management Extensions eller JMX är en exportstatus för Java-applikationer är standarden för dem.

21) Vad använder MasterServer?

Master sever hjälper dig också att tilldela en region till regionservern. Det hjälper dig också att hantera lastbalanseringen som vi använder MasterServer.

22) Definiera termen sparsamhet

Apache Thrift är skrivet i C ++. Det ger schemakompilatorer för olika programmeringsspråk som C ++, Perl, PHP, Python, Ruby och mer.

23) Varför använda klassen HColumnDescriptor?

Detaljen angående kolumnfamiljen som komprimeringsinställningar, Antal versioner, lagras .i HColumnDescriptor.

24) Vad är en cell i HBase?

En cell i HBase är den minsta enheten i en Hbase-tabell. Det hjälper dig att hålla en bit data i form av en tupel {rad, kolumn, version}

25) Vad är ett Bloom-filter?

HBase stöder Bloom Filter hjälper dig att förbättra klustrets totala genomströmning. Ett HBase Bloom-filter är en rymdeffektiv mekanism för att testa om en HFile innehåller en viss rad eller rad-kol-cell.

26) Berätta om vilka typer av HBase-operationer?

Ans. Två typer av HBase-operationer är:

  • Läs operation
  • Skriv operation

27) Vad är användningen av HBase HMaster?

En befälhavares huvudansvar är:

  1. Koordinering av regionens servrar
  2. Admin-funktioner

28) Vilken teknik kan du använda i HBase för att komma åt HFile direkt utan hjälp av HBase?

För att komma åt HFile direkt utan att använda HBase använder vi metoden HFile.main ().

29) Kan regionservern placeras på alla DataNodes?

Ja, Region Servers körs på samma servrar som DataNodes

30) Namnge filtret som accepterar sidstorleken som parameter i HBase

Ett filter med namnet PageFilter accepterar sidstorleken som parameter.

Detta dokument har komponerats med verktygen för omedelbar HTML-omvandlare.