Amazon Web Services (AWS) : Langkah-langkah Membuat dan Konfigurasi Kluster Amazon Elastic MapReduce (EMR)
Pada laman Amazon Web Services (AWS) , login ke AWS Management Console kemudian pilih service Amazon Elasctic MapReduce (EMR).
Selanjutnya, ikuti langkah-langkah berikut:
Selanjutnya, mari kita coba mengakses Master node pada kluster yang telah dibuat dengan menggunakan Secure Shell (SSH).
Langkah-langkahnya ada di artikel : Cara Koneksi SSH (Secure Shell) ke Amazon Elastic MapReduce (EMR) dari OS Linux dan MacOS.
Jika error ini muncul, klik sekali lagi button Create Cluster.
Setelah ini, kemungkinan akan muncul error terkait nama bucket S3 sebagai destinasi logging.
Jika error ini muncul, login ke Amazon S3 dan hapus bucket S3 destinasi logging tersebut.
Setelah itu, klik lagi button Create Cluster.
Selanjutnya, ikuti langkah-langkah berikut:
- Pada laman Amazon EMR klik button Create Cluster.
- Isi kolom nama cluster (contoh : My Cluster) dan aktifkan Logging
- Isi parameter-parameter berikut untuk mengkonfigurasi kluster :
- Pilih Launch Mode : Cluster
- Release : pilih release terbaru (saat artikel ini dibuat, versi terbaru adalah emr-6.0.0
- Application : Spark: Spark 2.4.4 on Hadoop 3.2.1 YARN with Ganglia 3.7.2 and Zeppelin 0.9.0-SNAPSHOT
- Instance Type : m5.xlarge (atau pilih sesuai kebutuhan)
- Number of Instances : 3 (1 master dan 2 core nodes)
- EC2 key pair : pilih nama EC2 key pair yang telah dibuat sebelumnya (jika belum buat, silakan ikuti langkah-langkah pembuatan EC2 key pair di artikel ini : )
- Permission : Default
- EMR role : EMR_DefaultRole
- EC2 instance profile : EMR_EC2_DefaultRole
- Cek kembali konfigurasi yang telah dibuat. Jika sudah yakin benar, klik button Create Cluster.
- Kluster akan ditampilkan dengan status Starting (pada tahap ini kluster akan melalui proses validasi yang memakan waktu maksimal 2 jam)
- Setelah validasi selesai dan sukses, status kluster akan menjadi Waiting (sampai disini, kluster telah sukses dibuat dan dikonfigurasi, dan seharusnya sudah siap pakai)
Selanjutnya, mari kita coba mengakses Master node pada kluster yang telah dibuat dengan menggunakan Secure Shell (SSH).
Langkah-langkahnya ada di artikel : Cara Koneksi SSH (Secure Shell) ke Amazon Elastic MapReduce (EMR) dari OS Linux dan MacOS.
Catatan :
Pada langkah 3.10. , ada kalanya muncul error terkait EMR_EC2_DefaultRole.Jika error ini muncul, klik sekali lagi button Create Cluster.
Setelah ini, kemungkinan akan muncul error terkait nama bucket S3 sebagai destinasi logging.
Jika error ini muncul, login ke Amazon S3 dan hapus bucket S3 destinasi logging tersebut.
Setelah itu, klik lagi button Create Cluster.
Comments