Data Engineering/spark

Spark 와 HBase 연동

quantapia 2018. 5. 14. 15:54

두가지 방법이 있다.


1. 호톤웍스 이용 


2. HBase-Connector 이용


1번은 DataFrame으로 데이터 입력이 가능하다.

spark.ml을 이용하여 머신러닝을 사용한다면 추천한다.


2번은 RDD로 데이터 입력이 가능하다.

MLlib를 이용한다면 2번을 추천한다.