티스토리 뷰
728x90
### MR
Map Reduce 반복하는 과정 Disk I/O
### Tez
DAG(비동기 사이클 그래프)
stage(map + reduce)
stage 가 나뉘지 않는 작업에는 속도 향상 기대가 어렵다. (mapper only)
SET hive.execution.engine = tez;
Tez가 MR보다 빠른이유.
1.Tez와 MapReduce의 동작 차이.
snowturtle93.github.io
https://gyuhoonk.github.io/hive-merge-query
Merge Files in HDFS
HDFS에서 작은 용량의 파일들을 합쳐보자 Blocks in HDFS 데이터는 HDFS 상에서 Block이라는 단위로 저장됩니다. 일반적으로 하나의 Block에 128MB를 저장합니다. 따라서 Block Size, 128MB를 넘는 데이터는 여
gyuhoonk.github.io
728x90
'공부' 카테고리의 다른 글
[docker] apt-get update && apt-get install vim (0) | 2022.09.25 |
---|---|
[Presto] JSON `( json, '$.root.child')` (0) | 2022.09.25 |
[kotlin] collection.forEachIndexed { index, element -> (0) | 2022.09.24 |
[spark] sql repartition (by query hint) `SELECT /*+ COALESCE(1) */` is better than `SELECT /*+ REPARTITION(1) */` (0) | 2022.09.22 |
[kotlin] camelToSnake (0) | 2022.09.21 |
댓글
250x250
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
TAG
- 테슬라 크레딧 사용
- 테슬라
- 팔로워 수 세기
- 테슬라 리퍼럴 코드
- 테슬라 레퍼럴
- COUNT
- 유투브
- 개리마커스
- 인스타그램
- 클루지
- follower
- 메디파크 내과 전문의 의학박사 김영수
- Kluge
- 테슬라 리퍼럴 코드 생성
- 어떻게 능력을 보여줄 것인가?
- 할인
- 책그림
- 연애학개론
- wlw
- 테슬라 레퍼럴 코드 확인
- 테슬라 리퍼럴 코드 혜택
- 레퍼럴
- 모델 Y 레퍼럴
- 모델y
- 김달
- 테슬라 추천
- Bot
- 테슬라 레퍼럴 적용 확인
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
글 보관함