Co to jest MapReduce AWS?
Co to jest MapReduce AWS?

Wideo: Co to jest MapReduce AWS?

Wideo: Co to jest MapReduce AWS?
Wideo: What is AWS EMR | Introduction to Amazon EMR | Data Processing with AWS EMR | Edureka Rewind - 7 2024, Listopad
Anonim

Amazonka elastyczna MapaReduce (EMR) to Amazon Web Services ( AWS ) narzędzie do przetwarzania i analizy dużych zbiorów danych. Amazon EMR przetwarza duże zbiory danych w klastrze wirtualnych serwerów Hadoop w Amazon Elastic Compute Cloud (EC2) i Amazon Simple Storage Service (S3).

W ten sposób, jak działa AWS EMR?

Usługa uruchamia określoną przez klienta liczbę instancji Amazon EC2, składającą się z jednego węzła głównego i wielu innych węzłów. Amazonka EMR uruchamia w tych instancjach oprogramowanie Hadoop. Węzeł nadrzędny dzieli dane wejściowe na bloki i dystrybuuje przetwarzanie bloków do innych węzłów.

Poza powyższym, jaka jest różnica między ec2 a EMR? w odróżnieniu EMR , EC2 nie dzieli węzłów podrzędnych na węzły podstawowe i zadania. Zwiększa to ryzyko utraty danych HDFS w przypadku usunięcia/utracenia węzła. EC2 używa bibliotek Apache (s3a) do dostępu do danych w s3. Z drugiej strony, EMR używa zastrzeżonego kodu AWS, aby mieć szybszy dostęp do s3.

Poza tym, czy AWS EMR jest w pełni zarządzany?

Amazonka Elastyczna mapaReduce ( EMR ) jest w pełni zarządzany Platforma Hadoop i Spark od Amazonka Serwis internetowy ( AWS ). Z EMR , AWS klienci mogą szybko uruchomić wielowęzłowe klastry Hadoop w celu przetwarzania dużych obciążeń danych.

Czy AWS używa Hadoop?

Amazonka Usługi internetowe używa open-source Apache Hadoop rozproszona technologia obliczeniowa ułatwiająca dostęp do dużych ilości mocy obliczeniowej w celu wykonywania zadań wymagających dużej ilości danych. Hadoop , otwarta wersja MapReduce firmy Google, jest już wykorzystywana przez firmy takie jak Yahoo i Facebook.

Zalecana: