[수집 레이어] - 로그 수집을 위한 플럼 사용 - 실시간 로그 이벤트를 처리하기 위한 스톰 사용 - 카프카 : 플럼과 스톰 사이에서 데이터의 안정적인 수집을 위해 버퍼링 및 트랜잭션 처리 담당 [적재 레이어] - 적재 대상은 하둡, HBase, 레디스 - 대용량 로그 파일 : 플럼->하둡 - 실시간 데이터 : 플럼->카프카->스톰->HBase/레디스 [처리/탐색 레이어] - 하둡에 적재된 데이터는 하이브를 이용해 정제/변형/통합/분리/탐색 등의 작업 수행 - 데이터를 정형화된 구조로 정규화 하여 데이터 마트 생성 - 가공/분석된 데이터를 외부로 제공하기 위해 스쿱 사용 - 우지의 워크플로를 통새 프로세스 구성 및 자동화 [분석/응용 레이어] - 임팔라/제플린을 통해 데이터 분석 - 머하웃과 스파트ML로..