어느덧 임팔라의 버전이 3.4까지 올라갔다.
그리고 설치방법은 더욱 어려워졌다.

다운로드는 아래 링크에서 받을 수 있다.
https://impala.apache.org/downloads.html

함정이 하나 있는데, 설치 스크립트 안의 ant 버전이 9.14로 되어있지만
인터넷으로 다운받아오는 과정에서 해당 링크가 잘려있다.
9.15로 수동으로 변경해주자.

이런것만 봐도 CDH 5.x 버전에서는 yum으로 간편하게 설치했는데
CDH6.x로 넘어오면서 CDH의 무료버전이 없어져서 그런지 접근성이 너무 안좋다.

빌드는 의외로 이 세가지만 하면되는데 오래걸린다. (2시간..? )
./bin/bootstrap_system.sh
source ./bin/impala-config.sh
./buildall.sh -noclean -notests -format -start_minicluster -start_impala_cluster

설치가 완료되면, 용량 16GB만큼의 파일이 생성되게 되고,
보이지 않은 .m2 레파지토리까지 합하면 20GB 가까이 된다.
1

실행은 어떻게 할까?
apache-impala-3.4.0/testdata/bin/run-all.sh 으로 hadoop과 hive등 필요한 리스트들을 켜주고 부가적인거지만, 2.x 버전에서는 보이지 않던 centry, ranger 등도 켜줄뿐더러
kudu도 켜주고... hbase랑 hive도 켜준다 ( ???? )

마지막으로
./apache-impala-3.4.0/bin/start-impala-cluster.py 를 사용하여 임팔라를 실행시켜주면 된다.

테스는 impala-shell을 이용하면 된다.
성공적으로 클러스터들이 켜져있다면
localhost.localdomain:21000라는 호스트가 앞에 붙게된다.
2

그래서...

이 인프라를 개발용으로만 쓴다면 아무 문제가 없겠지만,
나의 인프라에 요걸 넣으려면 골치가 아파진다.

그래서 다음 포스팅에는 빌드한 임팔라를 바탕으로
다른 서버에 구축하는것을 다룰 예정이다.