티스토리 뷰
728x90
PARTITIONED BY (dt string)
CLUSTERED BY (user_key)
SORTED BY (user_key ASC)
INTO 256 BUCKETS
CLUSTERED BY ~ SORTED BY ~ INTO {size} BUCKETS 을 사용해도,
spark sql plan partitioning 작업에는 영향 없음.
비용이 많이 나온 것과 관련해서는, 로드되는 data size가 커서 발생하는 것 같음.
향후에, small files merge 를 통해서, 비용을 최적화할 수 있음.
https://sparkbyexamples.com/apache-hive/hive-partitioning-vs-bucketing-with-examples/
https://medium.com/nerd-for-tech/hive-data-organization-partitioning-clustering-3e14ef6ab121
https://aws.amazon.com/ko/s3/pricing/?nc=sn&loc=4
728x90
'공부' 카테고리의 다른 글
[sh] grep exclude word `grep -v 'exclude_word' file` (0) | 2022.12.28 |
---|---|
[spark] text files (0) | 2022.12.20 |
[scp] tez.tar.gz (0) | 2022.12.20 |
[hive] DESCRIBE FORMATTED {db}.{table} (0) | 2022.12.20 |
[spark] explain(true), explain("cost") (0) | 2022.12.20 |
댓글
250x250
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
TAG
- 연애학개론
- 모델y
- 테슬라
- Kluge
- follower
- 테슬라 레퍼럴 코드 확인
- COUNT
- 테슬라 리퍼럴 코드 혜택
- 클루지
- 테슬라 크레딧 사용
- 어떻게 능력을 보여줄 것인가?
- 모델 Y 레퍼럴
- 테슬라 추천
- 메디파크 내과 전문의 의학박사 김영수
- 테슬라 레퍼럴 적용 확인
- 할인
- 레퍼럴
- 유투브
- 인스타그램
- 테슬라 리퍼럴 코드 생성
- 김달
- 책그림
- 개리마커스
- Bot
- 테슬라 레퍼럴
- 테슬라 리퍼럴 코드
- wlw
- 팔로워 수 세기
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
글 보관함