top 29 data engineer interview questions
Seznam najpogostejših vprašanj in odgovorov za intervju z inženirjem podatkov, ki vam bodo v pomoč pri pripravi na prihodnji intervju:
Danes je podatkovno inženirstvo najbolj razvito področje po razvoju programske opreme in je postalo ena najhitreje rastočih zaposlitvenih možnosti na svetu. Anketarji želijo najboljše podatkovne inženirje za svojo ekipo in zato se navadno temeljito pogovarjajo s kandidati. Iščejo določene veščine in znanja. Torej, na to morate biti pripravljeni, da izpolnite njihova pričakovanja.
Kaj se boste naučili:
- Odgovornosti inženirja podatkov
- Spretnosti podatkovnega inženirja
- Pogosto zastavljena vprašanja o intervjuju za inženirja podatkov
- Zaključek
Odgovornosti inženirja podatkov
Odgovornosti vključujejo:
- Za obdelavo in nadzor podatkov v podjetju.
- Vzdrževajte in upravljajte z izvornim sistemom podatkov in območji uprizoritve.
- Poenostavite čiščenje podatkov skupaj z nadaljnjo gradnjo in izboljšanjem zmanjšanja podatkov.
- Na voljo in izvedite tako preoblikovanje podatkov kot postopek ETL.
- Izdvajanje in izvedba ad hoc gradnje poizvedb po podatkih.
Spretnosti podatkovnega inženirja
S kvalifikacijami potrebujete tudi določena znanja. Oba sta ključnega pomena, ko se pripravljate na delovno mesto inženirja podatkov. Tukaj navajamo 5 najboljših spretnosti, ne glede na vrstni red, ki jih boste morali postati uspešen inženir podatkov.
- Spretnosti vizualizacije podatkov.
- Python in SQL.
- Znanje o modeliranju podatkov tako za velike podatke kot za skladiščenje podatkov
- Matematika
- Znanje o ETL
- Izkušnja prostora z velikimi podatki
Torej, preden se začnete pripravljati na razgovor, si morate prizadevati za izboljšanje teh sklopov. In ko izpopolnite svoje spretnosti, je tu nekaj vprašanj za razgovore, ki jih lahko pripravite, da vas anketarji opazijo in najamejo tudi vas.
Pogosto zastavljena vprašanja o intervjuju za inženirja podatkov
Splošna vprašanja za intervju
V # 1) Zakaj ste študirali podatkovno tehniko?
Odgovor: To vprašanje želi spoznati vašo izobrazbo, delovne izkušnje in ozadje. Morda bi bila to naravna izbira v nadaljevanju vašega študija informacijskih sistemov ali računalništva. Morda ste že delali na podobnem področju ali pa prehajate s povsem drugega delovnega področja.
Kakršna koli že bo vaša zgodba, ne zadržujte se ali se ne izogibajte. Medtem ko delite, še naprej poudarjajte veščine, ki ste se jih naučili na tej poti, in odlično opravljeno delo.
Vendar ne začnite pripovedovanja zgodb. Začnite s svojo izobrazbo, nato pa do dela, ko ste vedeli, da želite biti podatkovni inženir. In potem nadaljujte, kako pridete sem.
V # 2) Kaj je po vašem mnenju najtežje v tem, da ste inženir podatkov?
Odgovor: Na to vprašanje morate odgovoriti iskreno. Vsak vidik vseh delovnih mest ni enostaven in vaš anketar to ve. Cilj tega vprašanja ni natančno določiti svojo šibkost, temveč vedeti, kako obvladujete stvari, s katerimi se težko spopadate.
Lahko rečete nekaj takega: »Kot podatkovni inženir težko izpolnim zahtevo vseh oddelkov v podjetju, kjer večina od njih pogosto postavlja nasprotujoče si zahteve. Torej, pogosto se mi zdi izziv, da jih ustrezno uravnotežim.
Vendar mi je ponudil dragocen vpogled v delovanje oddelkov in vlogo, ki jo imajo v celotni strukturi podjetja. ' In to je le en primer. Lahko in morate postaviti svoje stališče.
V # 3) Povejte nam incident, v katerem naj bi zbirali podatke iz različnih virov, a so se soočili z nepričakovanimi težavami in kako ste jih rešili?
Odgovor: To vprašanje je priložnost, da pokažete svoje sposobnosti reševanja problemov in kako se prilagodite nenadnim spremembam načrta. Vprašanje bi lahko obravnavali splošno ali posebej v povezavi s podatkovnim inženiringom. Če še niste doživeli takšne izkušnje, lahko podate hipotetičen odgovor.
Tu je vzorec odgovora: »V moji prejšnji franšizni družbi naj bi jaz in moja ekipa zbirali podatke z različnih lokacij in sistemov. Toda ena od franšiz je spremenila svoj sistem, ne da bi nas o tem predhodno obvestila. Posledica tega je bilo nekaj vprašanj za zbiranje in obdelavo podatkov.
Da bi to rešili, smo morali najprej najti hitro kratkoročno rešitev za vnos bistvenih podatkov v sistem podjetja. In po tem smo razvili dolgoročno rešitev, da se takšna vprašanja ne bi več ponovila. '
V # 4) V čem se delo inženirja podatkov razlikuje od dela arhitekta podatkov?
Odgovor: To vprašanje naj bi preverilo, ali razumete, da znotraj ekipe skladišča podatkov obstajajo razlike. Z odgovorom ne morete zgrešiti. Odgovornosti obeh se prekrivajo ali se razlikujejo glede na to, kaj potrebuje oddelek za vzdrževanje zbirke podatkov ali podjetje.
Lahko rečete, da se »po mojih izkušnjah razlika med vlogami podatkovnega inženirja in podatkovnega arhitekta razlikuje od podjetja do podjetja. Čeprav zelo tesno sodelujejo, obstajajo razlike v njihovih splošnih odgovornostih.
Za upravljanje strežnikov in gradnjo arhitekture podatkovnega sistema podjetja je odgovoren arhitekt podatkov. In delo inženirja podatkov je preizkušanje in vzdrževanje te arhitekture. Poleg tega tudi mi, inženirji podatkov, skrbimo, da so podatki, ki so na voljo analitikom, kakovostni in zanesljivi. '
Vprašanja za tehnični intervju
V # 5) Kateri so štirje V-ji Big Data?
(slika vir )
Odgovor:
Štirje V-ji velikih podatkov so:
- Prvi V je Hitrost kar se nanaša na hitrost ustvarjanja velikih podatkov skozi čas. Torej se lahko šteje za analizo podatkov.
- Drugi V je Raznolikost različnih oblik velikih podatkov, najsi gre za slike, dnevniške datoteke, predstavnostne datoteke in glasovne posnetke.
- Tretji V je Glasnost podatkov. Lahko je v številu uporabnikov, številu tabel, velikosti podatkov ali številu zapisov.
- Četrti V je Verodostojnost povezane z negotovostjo ali gotovostjo podatkov. Z drugimi besedami, odloča, kako prepričani ste v točnost podatkov.
V # 6) V čem se strukturirani podatki razlikujejo od nestrukturiranih?
Odgovor: Spodnja tabela pojasnjuje razlike:
Strukturirani podatki | Nestrukturirani podatki | |
---|---|---|
7) | Združeni podatki so v eni dimenziji. | Podatki so razdeljeni na različne dimenzijske tabele. |
1) | Lahko se shrani v MS Access, Oracle, SQL Server in druge podobne tradicionalne sisteme baz podatkov. | Ni ga mogoče shraniti v tradicionalnem sistemu baz podatkov. |
dva) | Lahko se shrani v različne stolpce in vrstice. | Ni ga mogoče shraniti v vrstice in stolpce. |
3) | Primer strukturiranih podatkov so transakcije spletnih aplikacij. | Primeri nestrukturiranih podatkov so tviti, iskanja v Googlu, všečki na Facebooku itd. |
4) | V podatkovnem modelu ga je mogoče enostavno definirati. | Ni ga mogoče določiti glede na podatkovni model. |
5) | Na voljo je s fiksno velikostjo in vsebino. | Na voljo je v različnih velikostih in vsebinah. |
V # 7) Katera orodja ETL so vam znana?
Odgovor: Poimenujte vsa orodja ETL, s katerimi ste delali. Lahko rečete: »Sodeloval sem s SAS Data Management, IBM Infosphere in SAP Data Services. Toda moj najljubši je PowerCenter iz Informatice. Je učinkovit, ima izjemno visoko zmogljivost in je prilagodljiv. Skratka, ima vse pomembne lastnosti dobrega ETL orodja.
Neprekinjeno vodijo operacije s poslovnimi podatki in zagotavljajo dostop do podatkov, tudi če pride do sprememb v podjetju ali njegovi strukturi. ' Poskrbite, da se pogovarjate samo o tistih, s katerimi ste sodelovali, in tistih, s katerimi imate radi. Ali pa bi lahko kasneje pospravil vaš intervju.
V # 8) Povejte nam o shemah načrtovanja podatkovnega modeliranja.
Odgovor: Modeliranje podatkov ima dve vrsti načrtovalnih shem.
Razloženi so na naslednji način:
- Prvi je Zvezdni urnik , ki je razdeljen na dva dela - tabelo dejstev in tabelo dimenzij. Tu sta obe tabeli povezani. Shema zvezd je najpreprostejši slog sheme podatkovnih martov in je tudi najbolj razširjena. Poimenovan je tako, ker je po svoji zgradbi podoben zvezdi.
- Drugi je Shema snežinke kar je podaljšek zvezdne sheme. Dodaja dodatne dimenzije in se imenuje snežinka, ker je po strukturi podobna snežinki.
V # 9) Kakšna je razlika med shemo zvezd in shemo snežinke?
(slika vir )
Odgovor: Spodnja tabela pojasnjuje razlike:
Zvezdni urnik | Shema snežinke | |
---|---|---|
1) | Tabela dimenzij vsebuje hierarhije dimenzij. | Obstajajo ločene tabele za hierarhije. |
dva) | Tu so dimenzijske tabele obkrožene s tabelo dejstev. | Tabele dimenzij obkrožajo tabelo dejstev, nato pa so nadalje obdane s tabelami dimenzij. |
3) | Tabela dejstev in katera koli dimenzijska tabela sta povezani samo z enim samim spajanjem. | Če želite pridobiti podatke, potrebujete veliko združitev. |
4) | Na voljo je s preprosto zasnovo DB. | Ima zapleteno zasnovo DB. |
5) | Dobro deluje tudi z denormaliziranimi poizvedbami in podatkovnimi strukturami. | Deluje samo z normalizirano strukturo podatkov. |
6) | Presežek podatkov - visoka. | Odvečnost podatkov - zelo nizka. |
8) | Hitrejša obdelava kock. | Kompleksno združevanje upočasni obdelavo kock. |
V # 10) Kakšna je razlika med podatkovnim skladiščem in operativno bazo podatkov?
Odgovor: Spodnja tabela pojasnjuje razlike:
Podatkovno skladišče | Operativna podatkovna baza | |
---|---|---|
7) | Podpira peščico OLTP, kot sočasnih odjemalcev. | Podpira številne sočasne odjemalce. |
1) | Namenjeni so analitični obdelavi velike količine. | Ti podpirajo obdelavo transakcij velikega obsega. |
dva) | Zgodovinski podatki vplivajo na podatkovno skladišče. | Trenutni podatki vplivajo na operativno bazo podatkov. |
3) | Novi, nehlapni podatki se redno dodajajo, vendar se še vedno redko spreminjajo. | Podatki se po potrebi redno posodabljajo. |
4) | Zasnovan je za analizo poslovnih ukrepov po lastnostih, predmetnih področjih in kategorijah. | Zasnovan je za sprotno obdelavo in poslovno poslovanje. |
5) | Optimizirano za velike obremenitve in zapletene poizvedbe z dostopom do številnih vrstic za vsako mizo. | Optimizirano za preprost nabor transakcij, kot je pridobivanje in dodajanje ene vrstice naenkrat za vsako tabelo. |
6) | Je poln veljavnih in doslednih informacij in ne potrebuje nobenega preverjanja v realnem času. | Izboljšano za preverjanje veljavnosti dohodnih informacij in uporablja tabele podatkov o preverjanju veljavnosti. |
8) | Njeni sistemi so večinoma predmetno usmerjeni. | Njeni sistemi so v glavnem usmerjeni v procese. |
9) | Podatki ven. | Podatki v. |
10) | Dostopno je ogromno podatkov. | Dostop do omejenega števila podatkov. |
enajst) | Ustvarjeno za spletno analitično obdelavo OLAP. | Ustvarjeno za obdelavo spletnih transakcij OLTP. |
V # 11) Izpostavite razliko med OLTP in OLAP.
Odgovor: Spodnja tabela pojasnjuje razlike:
OLTP | OLAP | |
---|---|---|
7) | Obseg podatkov ni zelo velik. | Ima veliko količino podatkov. |
1) | Uporablja se za upravljanje operativnih podatkov. | Uporablja se za upravljanje informacijskih podatkov. |
dva) | Stranke, uradniki in IT-strokovnjaki ga uporabljajo. | Uporabljajo ga upravitelji, analitiki, vodstveni delavci in drugi delavci, ki delajo z znanjem. |
3) | Je usmerjen k strankam. | Je tržno naravnan. |
4) | Upravlja trenutne podatke, ki so izjemno podrobni in se uporabljajo za odločanje. | Obvladuje ogromno zgodovinskih podatkov. Ponuja tudi možnosti za združevanje in povzemanje ter upravljanje in shranjevanje podatkov na različnih ravneh podrobnosti. Tako postanejo podatki bolj udobni za uporabo pri odločanju. |
5) | Ima 100 MB GB podatkovne baze. | Velikost baze podatkov je 100 GB-TB. |
6) | Uporablja podatkovni model ER (razmerje entitete) skupaj z zasnovo baze podatkov, ki je usmerjena v uporabo. | OLAP uporablja model snežinke ali zvezde skupaj z zasnovo zbirke podatkov, ki je usmerjena v predmet. |
8) | Način dostopa - branje / pisanje. | Način dostopa je večinoma pisanje. |
9) | Popolnoma normalizirano. | Delno normalizirano. |
10) | Njegova hitrost obdelave je zelo hitra. | Hitrost obdelave je odvisna od števila datotek, ki jih vsebuje, zapletenih poizvedb in osveževanja paketnih podatkov |
V # 12) Pojasnite glavni koncept okvira Apache Hadoop.
Odgovor: Temelji na algoritmu MapReduce. V tem algoritmu se za obdelavo velikega nabora podatkov uporabljajo operacije Map in Reduce. Zemljevid, filtriranje in razvrščanje podatkov, medtem ko Zmanjšaj, povzema podatke. Prilagodljivost in odpornost na napake sta ključni točki tega koncepta. Te funkcije lahko dosežemo v Apache Hadoop z učinkovitim izvajanjem MapReduce in Multi-threading.
V # 13) Ste že kdaj delali s Hadoop Framework?
(slika vir )
Odgovor: Številni najemni vodje v intervjuju sprašujejo o orodju Hadoop, da bi vedeli, ali poznate orodja in jezike, ki jih podjetje uporablja. Če ste sodelovali s Hadoop Framework, jim povejte podrobnosti svojega projekta, da razkrijejo vaše znanje in spretnosti z orodjem in njegovimi zmožnostmi. In če še nikoli niste delali z njim, bodo delovale tudi nekatere raziskave, ki bodo pokazale, da ste seznanjeni z njegovimi lastnostmi.
Lahko rečeš, na primer, »Med delom v skupinskem projektu sem imel priložnost sodelovati s Hadoopom. Osredotočeni smo bili na povečanje učinkovitosti obdelave podatkov, zato smo se zaradi njegove zmožnosti povečevanja hitrosti obdelave podatkov, ne da bi pri tem ogrozili kakovost med njihovo porazdeljeno obdelavo, odločili za uporabo Hadoop-a.
In ker je moje prejšnje podjetje v naslednjih nekaj mesecih pričakovalo znatno povečanje obdelave podatkov, je tudi njegova razširljivost prišla prav. Hadoop je tudi odprtokodna mreža, ki temelji na Javi, zaradi česar je najboljša možnost za projekte z omejenimi sredstvi in enostavna za uporabo brez dodatnega usposabljanja. '
je omrežni ključ enako geslu
V # 14) Omenite nekatere pomembne lastnosti Hadoopa.
Odgovor: Funkcije so naslednje:
- Hadoop je brezplačen odprtokodni okvir, kjer lahko spremenimo izvorno kodo v skladu z našimi zahtevami.
- Podpira hitrejšo porazdeljeno obdelavo podatkov. HDFS Hadoop podatke shranjuje porazdeljeno in za vzporedno obdelavo podatkov uporablja MapReduce.
- Hadoop je zelo strpen in privzeto na različnih vozliščih omogoča uporabniku, da ustvari tri replike vsakega bloka. Če je eno od vozlišč neuspešno, lahko obnovimo podatke iz drugega vozlišča.
- Je tudi prilagodljiv in združljiv s številnimi strojnimi napravami.
- Ker je Hadoop podatke shranil v gruče, neodvisno od vseh drugih operacij. Zato je zanesljiv. Na shranjene podatke ne vpliva napaka v delovanju strojev. Tako je tudi zelo na voljo.
V # 15) Kako lahko z analizo velikih podatkov povečate poslovni prihodek?
Odgovor: Analiza velikih podatkov je pomemben del podjetij, saj jim pomaga, da se med seboj razlikujejo, hkrati pa povečujejo prihodke. Analiza velikih podatkov ponuja podjetjem prilagojene predloge in priporočila s pomočjo napovedne analize.
Prav tako podjetjem pomaga pri lansiranju novih izdelkov, ki temeljijo na željah in potrebah kupcev. To pomaga podjetjem zaslužiti bistveno več, približno 5-20% več. Podjetja, kot so Bank of America, LinkedIn, Twitter, Walmart, Facebook itd., Za povečanje prihodkov uporabljajo analizo velikih podatkov.
V # 16) Katere korake morate uvesti med uvajanjem rešitve za velike podatke?
Odgovor: Med uvajanjem rešitve za velike podatke je treba upoštevati tri korake:
- Zaužitje podatkov- To je prvi korak pri uvajanju rešitve za velike podatke. Gre za pridobivanje podatkov iz različnih virov, kot so SAP, MYSQL, Salesforce, dnevniške datoteke, notranja baza podatkov itd. Do vnosa podatkov lahko pride v realnem času s pretakanjem ali s paketnimi opravili.
- Shranjevanje podatkov Po zaužitju podatkov je treba pridobljene podatke nekje shraniti. Shranjena je bodisi v zbirkah podatkov HDFS ali NoSQL. HDFS dobro deluje za zaporedni dostop prek HBase za naključni dostop do branja ali pisanja.
- Obdelava podatkov- To je tretji in zaključni korak pri uvajanju rešitve za velike podatke. Po shranjevanju se podatki obdelajo skozi enega glavnih okvirov, kot sta MapReduce ali Pig.
V # 17) Kaj je skener blokov in blokov v HDFS?
Odgovor: Blok je najmanjša količina podatkov, ki jo je mogoče zapisati ali prebrati v HDFS. 64 MB je privzeta velikost bloka.
Optični bralnik je program, ki redno spremlja število blokov v DataNode, skupaj z preverjanjem morebitnih napak kontrolne vsote in poškodb podatkov.
V # 18) S kakšnimi izzivi ste se srečali pri uvajanju novih aplikacij za analizo podatkov, če ste jih kdaj uvedli?
Odgovor: Če še niste uvedli nove podatkovne analitike, lahko to preprosto rečete. Ker so precej drage, zato jih podjetja pogosto ne počnejo. A če se podjetje odloči, da bo vanj vlagalo, je to lahko izjemno ambiciozen projekt. Za namestitev, povezovanje, uporabo in vzdrževanje teh orodij bi potrebovali visoko usposobljene zaposlene.
Če ste bili kdaj skozi postopek, jim povejte, s katerimi ovirami ste se soočili in kako ste jih premagali. Če še niste, jim podrobno povejte, kaj veste o postopku. To vprašanje določa, ali imate osnovno znanje za reševanje težav, ki bi se lahko pojavile med uvajanjem novih aplikacij za analizo podatkov.
Vzorec odgovora; »V svojem prejšnjem podjetju sem sodeloval pri uvajanju nove analitike podatkov. Celoten postopek je dodelan in za čim bolj tekoč prehod potrebuje dobro načrtovan postopek.
Vendar se tudi z brezhibnim načrtovanjem ne moremo vedno izogniti nepredvidenim okoliščinam in težavam. Takšno vprašanje je bilo neverjetno veliko povpraševanje po uporabniških licencah. Šlo je čez, kar smo pričakovali. Za pridobitev dodatnih licenc je moralo podjetje prerazporediti finančna sredstva.
Prav tako je bilo treba usposabljanje načrtovati tako, da ne ovira poteka dela. Prav tako smo morali optimizirati infrastrukturo, da podpremo veliko število uporabnikov. '
V # 19) Kaj, če se NameNode zruši v gruči HDFS?
Odgovor: Skupina HDFS ima samo eno NameNode in vzdržuje metapodatke DataNode. Če imate samo eno NameNode, grozdi HDFS dobijo eno samo točko okvare.
Torej, če NameNode zruši, sistemi morda ne bodo na voljo. Da bi to preprečili, lahko določimo sekundarno NameNode, ki zajema periodične kontrolne točke v datotečnih sistemih HDFS, vendar ni varnostna kopija NameNode. Lahko pa ga uporabimo za ponovno ustvarjanje NameNode in ponovni zagon.
V # 20) Razlika med NAS in DAS v grozdu Hadoop.
Odgovor: V NAS so shranjevalni in računski sloji ločeni, nato pa se shramba porazdeli med različne strežnike v omrežju. Medtem ko je v DAS, je shramba običajno pritrjena na računsko vozlišče. Apache Hadoop temelji na principu obdelave v bližini določene lokacije podatkov.
Zato mora biti pomnilniški disk lokalni za izračun. DAS vam pomaga doseči zmogljivost grozda Hadoop in se lahko uporablja na osnovni strojni opremi. Z enostavnimi besedami je bolj stroškovno učinkovit. Shramba NAS je zaželena z visoko pasovno širino približno 10 GbE.
V # 21) Ali je gradnja baze podatkov NoSQL boljša od izdelave relacijske baze podatkov?
(slika vir )
Odgovor: Kot odgovor na to vprašanje morate predstaviti svoje znanje o obeh zbirkah podatkov. Prav tako morate to podkrepiti s primerom situacije, ki dokazuje, kako boste ali ste uporabili znanje in izkušnje v resničnem projektu.
Vaš odgovor bi lahko bil nekako takšen: 'V nekaterih primerih bi bilo koristno zgraditi bazo podatkov NoSQL. V mojem zadnjem podjetju, ko se je franšizni sistem eksponentno povečeval, smo se morali hitro razširiti, da smo kar najbolje izkoristili vse operativne in prodajne podatke, ki smo jih imeli.
Pri ravnanju s povečano obremenitvijo obdelave podatkov je izboljšanje velikosti boljše od povečanja z večjimi strežniki. To je stroškovno učinkovito in lažje doseči z bazami podatkov NoSQL, saj lahko zlahka obravnava velike količine podatkov. To pride prav, ko se boste morali v prihodnosti hitro odzvati na precejšnje premike podatkov.
Čeprav so relacijske podatkovne baze boljše povezane s katerim koli analitičnim orodjem. Toda baze podatkov NoSQL lahko veliko ponudijo. '
V # 22) Kaj storite, ko naletite na nepričakovano težavo pri vzdrževanju podatkov? Ste za to že preizkusili kakšno pravo rešitev?
Odgovor: Pri vsakem rutinskem opravilu se vsake toliko časa pojavijo nepričakovane težave, tudi med vzdrževanjem podatkov. To vprašanje želi vedeti, ali se lahko spopadate z visokotlačnimi situacijami in kako.
Lahko rečete nekaj takega: »Vzdrževanje podatkov je lahko rutinsko opravilo, vendar je ključnega pomena natančno spremljanje določenih nalog, vključno z zagotavljanjem uspešne izvedbe skriptov.
Ko sem med preverjanjem integritete naletel na pokvarjen indeks, ki bi lahko v prihodnosti povzročil resne težave. Zato sem pripravil novo vzdrževalno nalogo za preprečevanje dodajanja pokvarjenih indeksov v bazo podatkov podjetja. '
V # 23) Ste že kdaj usposobili koga na svojem področju? Če je odgovor da, kaj se vam je zdelo najbolj zahtevno?
Odgovor: Ponavadi so potrebni podatkovni inženirji, da svoje sodelavce usposobijo za nove sisteme ali procese, ki ste jih ustvarili, ali za nove zaposlene na že obstoječih sistemih in arhitekturi. Torej, s tem vprašanjem želi vaš anketar vedeti, ali lahko to rešite. Če še niste imeli priložnosti nekoga usposobiti, se pogovorite o izzivih nekoga, ki je treniral ali če veste, da ste se soočali.
Vzorec idealnega odgovora bo približno takšen. »Da, imel sem priložnost usposobiti majhne in velike obe skupini sodelavcev. Izobraževanje novih zaposlenih z velikimi izkušnjami v drugem podjetju je najzahtevnejša naloga, s katero sem se srečal. Pogosto so tako navajeni pristopiti k podatkom z ene drugačne perspektive, da se trudijo sprejeti način, kako stvari počnemo.
Pogosto so izjemno samozavestni in mislijo, da vse dobro vedo in zato traja veliko časa, da spoznajo, da ima lahko težava več kot eno rešitev. Poskušam jih spodbuditi, da odprejo svoj um in sprejmejo nadomestne možnosti, tako da poudarjajo, kako uspešni so bili naša arhitektura in procesi. '
V # 24) Kakšne so prednosti in slabosti dela v računalništvu v oblaku?
(slika vir )
Odgovor:
Prednosti:
- Brez infrastrukturnih stroškov.
- Minimalno upravljanje.
- Brez težav glede upravljanja in upravljanja.
- Enostaven dostop.
- Plačajte za tisto, kar uporabljate.
- Je zanesljiv.
- Ponuja nadzor, varnostno kopiranje in obnovitev podatkov.
- Ogromna shramba.
Slabosti:
- Za dobro delovanje potrebuje dobro internetno povezavo z enako dobro pasovno širino.
- Ima izpad.
- Vaš nadzor nad infrastrukturo bo omejen.
- Prožnosti je malo.
- Ima določene stalne stroške.
- Morda obstajajo varnostne in tehnične težave.
V # 25) Delo inženirjev podatkov je običajno v zakulisju. Vam je prijetno delati stran od 'žarometov'?
Odgovor: Vaš vodja najema želi vedeti, ali imate radi v središču pozornosti ali lahko dobro delate v obeh situacijah. Vaš odgovor jim mora povedati, da čeprav vam je všeč središče pozornosti, vam je všeč tudi delo v ozadju.
»Pomembno mi je, da bi moral biti strokovnjak na svojem področju in prispevati k rasti svojega podjetja. Če moram delati v središču pozornosti, mi je tudi to všeč. Če obstaja težava, ki jo morajo vodstveni delavci odpraviti, ne bom okleval, ko bom dvignil glas in ga opozoril nanje. '
V # 26) Kaj se zgodi, ko optični bralnik zazna poškodovan podatkovni blok?
Odgovor: Najprej DataNode poroča NameNode. Nato NameNode začne ustvarjati novo repliko skozi kopijo poškodovanega bloka. Poškodovan podatkovni blok ne bo izbrisan, če se število replikacij desnih replik ujema s faktorjem replikacije.
V # 27) Ste že kdaj našli novo inovativno uporabo že obstoječih podatkov? Je to pozitivno vplivalo na podjetje?
Odgovor: To vprašanje je namenjeno njim, da ugotovijo, ali ste dovolj motivirani in nestrpni, da prispevate k uspehu projektov. Če je mogoče, odgovorite na vprašanje s primerom, ko ste prevzeli odgovornost za projekt ali prišli do ideje. In če ste kdaj predstavili novo rešitev problema, je tudi ne zamudite.
Primer odgovora: »Na zadnjem delovnem mestu sem sodeloval pri ugotavljanju, zakaj imamo visoko stopnjo fluktuacije zaposlenih. Podatke sem natančno opazoval z različnih oddelkov, kjer sem našel zelo povezane podatke na ključnih področjih, kot so finance, trženje, poslovanje itd., In stopnja fluktuacije zaposlenih.
Za boljše razumevanje teh povezav je sodeloval z analitiki oddelka. Z našim razumevanjem smo naredili nekaj strateških sprememb, ki so pozitivno vplivale na stopnjo fluktuacije zaposlenih. «
V # 28) Katera netehnična znanja so po vašem mnenju najbolj uporabna kot podatkovni inženir?
Odgovor: Poskusite se izogniti najbolj očitnim odgovorom, kot so komunikacijske ali medosebne veščine. Lahko rečete: »Dajanje prednosti in večopravilnost sta mi pogosto prišla prav. V enem dnevu dobimo različne naloge, ker sodelujemo z različnimi oddelki. Zato je nujno, da jim damo prednost. Olajša nam delo in nam pomaga učinkovito jih dokončati. «
V # 29) Katere pogoste težave ste imeli kot podatkovni inženir?
Odgovor: To so:
- Stalna in sprotna integracija.
- Shranjevanje ogromnih količin podatkov in informacij iz teh podatkov.
- Omejitev virov.
- Upoštevanje, katera orodja uporabiti in katera lahko prinesejo najboljše rezultate.
Zaključek
Podatkovni inženiring se morda sliši kot rutinsko dolgočasno delo, vendar obstaja veliko zanimivih vidikov. To je razvidno iz možnih scenarijev, ki bi jih anketarji lahko postavili. Pripravljeni morate biti odgovoriti ne le na tehnična knjižna vprašanja, ampak tudi na situacijska vprašanja, kot so zgoraj navedena. Šele takrat boste lahko dokazali, da lahko dobro opravljate svoje delo in si ga zaslužite.
Vse najboljše!!
Priporočeno branje
- Vprašanja in odgovori za intervju
- Vprašanja in odgovori za preizkušanje ETL
- 32 najboljših vprašanj in odgovorov za intervju z Datastage
- Najpogostejša vprašanja in odgovori za JSON
- Najboljša vprašanja in odgovori za intervjuje Teradata
- Najboljših 24 vprašanj za modeliranje podatkov z intervjuji s podrobnimi odgovori
- Top 50+ vprašanj in odgovorov za intervjuje v zbirki podatkov
- Top 30 vprašanj in odgovorov za intervju s SAS