두가지 방법이 있다.
1. 호톤웍스 이용
1번은 DataFrame으로 데이터 입력이 가능하다.
spark.ml을 이용하여 머신러닝을 사용한다면 추천한다.
2번은 RDD로 데이터 입력이 가능하다.
MLlib를 이용한다면 2번을 추천한다.
두가지 방법이 있다.
1. 호톤웍스 이용
1번은 DataFrame으로 데이터 입력이 가능하다.
spark.ml을 이용하여 머신러닝을 사용한다면 추천한다.
2번은 RDD로 데이터 입력이 가능하다.
MLlib를 이용한다면 2번을 추천한다.