Co to jest jezioro danych w Hadoop?
Co to jest jezioro danych w Hadoop?

Wideo: Co to jest jezioro danych w Hadoop?

Wideo: Co to jest jezioro danych w Hadoop?
Wideo: What is Data Lake | Understand the Data Lake Architecture | Data Lake using Apache Spark 2024, Listopad
Anonim

A Jezioro danych Hadoop jest dane platforma zarządzania składająca się z jednego lub więcej Hadoop klastry. Służy głównie do przetwarzania i przechowywania nierelacyjnych dane , takich jak pliki dziennika, zapisy strumienia kliknięć w Internecie, czujnik dane , obiekty JSON, obrazy i posty w mediach społecznościowych.

Pod tym względem, jaka jest różnica między hurtownią danych a jeziorem danych?

Jeziora danych oraz dane magazyny są szeroko stosowane do przechowywania dużych dane , ale nie są to terminy zamienne. A jezioro danych to ogromna pula surowego dane , którego cel nie został jeszcze określony. A hurtownia danych jest repozytorium uporządkowanych, filtrowanych dane które zostały już przetworzone w określonym celu.

Co to jest architektura jeziora danych? A Jezioro danych to repozytorium pamięci, które może przechowywać dużą ilość uporządkowanych, częściowo ustrukturyzowanych i nieustrukturyzowanych dane . W przeciwieństwie do hierarchicznego domu Dataware, w którym dane jest przechowywany w plikach i folderach, Jezioro danych ma mieszkanie architektura.

W związku z tym, co należy rozumieć przez jezioro danych?

A jezioro danych to repozytorium przechowywania, które przechowuje ogromną ilość surowych dane w swoim natywnym formacie, dopóki nie będzie potrzebny. Chociaż hierarchiczny dane magazyny sklepów dane w plikach lub folderach, a jezioro danych wykorzystuje płaską architekturę do przechowywania dane . Termin jezioro danych jest często kojarzony z obiektową pamięcią masową zorientowaną na Hadoop.

Czy Elasticsearch jest jeziorem danych?

A jezioro danych to po prostu miejsce do zaparkowania dane dopóki tego nie potrzebujesz i może obejmować HDFS (najczęściej), obiektową pamięć masową, skrzynki NAS lub cokolwiek innego. Zasadniczo, Elastyczne wyszukiwanie to narzędzie do indeksowania dane , nie do przechowywania dane samo.

Zalecana: