티스토리 뷰
PARTITIONED BY (dt string)
CLUSTERED BY (user_key)
SORTED BY (user_key ASC)
INTO 256 BUCKETS
CLUSTERED BY ~ SORTED BY ~ INTO {size} BUCKETS 을 사용해도,
spark sql plan partitioning 작업에는 영향 없음.
비용이 많이 나온 것과 관련해서는, 로드되는 data size가 커서 발생하는 것 같음.
향후에, small files merge 를 통해서, 비용을 최적화할 수 있음.
https://sparkbyexamples.com/apache-hive/hive-partitioning-vs-bucketing-with-examples/
Hive Partitioning vs Bucketing with Examples?
In this article, I will explain what is Hive Partitioning and Bucketing, the difference between Hive Partitioning vs Bucketing by exploring the advantages
sparkbyexamples.com
https://medium.com/nerd-for-tech/hive-data-organization-partitioning-clustering-3e14ef6ab121
Hive data organization — Partitioning & Clustering
Data organization impacts the query performance of any warehouse system. Hive is no exception to that. This blog aim at discussing…
medium.com
https://aws.amazon.com/ko/s3/pricing/?nc=sn&loc=4
Amazon S3 Simple Storage Service 요금 - Amazon Web Services
S3 버킷 및 객체를 대상으로 수행한 요청에 대해 요금을 지불합니다. S3 요청 요금은 요청 유형을 기준으로 하며 아래 표와 같이 요청 수에 따라 요금이 부과됩니다. Amazon S3 콘솔을 사용하여 스토
aws.amazon.com
'공부' 카테고리의 다른 글
[sh] grep exclude word `grep -v 'exclude_word' file` (0) | 2022.12.28 |
---|---|
[spark] text files (0) | 2022.12.20 |
[scp] tez.tar.gz (0) | 2022.12.20 |
[hive] DESCRIBE FORMATTED {db}.{table} (0) | 2022.12.20 |
[spark] explain(true), explain("cost") (0) | 2022.12.20 |
- Total
- Today
- Yesterday
- 테슬라 레퍼럴 적용 확인
- 테슬라 레퍼럴
- COUNT
- Bot
- 모델y
- 김달
- 개리마커스
- 연애학개론
- 테슬라 레퍼럴 코드 확인
- 메디파크 내과 전문의 의학박사 김영수
- 테슬라
- follower
- 어떻게 능력을 보여줄 것인가?
- 유투브
- 테슬라 크레딧 사용
- wlw
- 할인
- 테슬라 리퍼럴 코드
- 테슬라 리퍼럴 코드 생성
- 클루지
- 팔로워 수 세기
- 책그림
- 모델 Y 레퍼럴
- Kluge
- 레퍼럴
- 테슬라 리퍼럴 코드 혜택
- 인스타그램
- 테슬라 추천
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |