mapreduce 와 hbase 간의 성능 테스트 중
hbase 를 실행시켰는데 map의 갯수가.. mapreduce 로 실행시켰을때에 비해...
현격하게 적게 나와서. 100 : 1.. 나와서.. 당황.............
왜????
Hbase의 실행구조에 대해서.. 잘모르니. 당최 알수가 있나..
무식한게 죄지..
reducetask를 조정하는 메소드는. 있는데 왜. maptask는 없는거지..
뭐...일단... 왜 한개만 발생하였는지는
hbase의 어드민 페이지에서
Table Regions 를 확인 하면 알수 있다.
내가 5만건의 데이터를 Scan을 하는데 해당데이터가
한개의 Region Server에 다들어가 있다면. 한개의map만 동작한다는것..
즉. 1 ,50000 건의 데이터가
5개의 Region Server에 나누어 존재한다면. 5개의 map이 동작한다는..것.