티스토리 뷰
728x90
- 일반적으로 파티션의 개수를 늘리는 것은 오버헤드가 너무 많아지는 수준이 되기 전까지는 성능을 높여준다.
- 최소한 총코어 개수 이상의 파티션을 사용해야 한다.
- 각 Executor에서 스파크가 한 번에 처리하는 양이 적어지므로 메모리 부족 오류를 줄이는데 도움을 준다.
- 파티션이 부족한 것보다는 차라리 조금 더 많은 것이 낫다.
- MapReduce에서 보수적으로 task의 수를 늘려나가는 것과는 가이드가 다른데, 이는 MapReduce는 각 task의 스타트업 오버헤드가 큰 반면 스파크는 그렇지 않기 때문이다.
- 파티션의 메타데이터를 보관
- Driver memory errors & Driver overhead errors를 유발할 수 있다.
- 작은 사이즈의 파일들을 생성하기 위한 I/O가 많이 발생하며, 이 시간 또한 오래 걸릴 수 있다.(특히 block store에서)
728x90
'공부' 카테고리의 다른 글
[STS] openJDK (0) | 2022.10.15 |
---|---|
[AWS] S3 The bucket does not allow ACLs (0) | 2022.10.15 |
[flink] Question about NoResourceAvailableException in Flink (0) | 2022.10.12 |
How to overcome 3 multi-tenancy security issues (0) | 2022.10.12 |
zsh: command not found: celery (0) | 2022.10.11 |
댓글
250x250
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
TAG
- COUNT
- wlw
- 테슬라 레퍼럴 코드 확인
- 모델y
- 테슬라 크레딧 사용
- follower
- 책그림
- Kluge
- 테슬라
- 할인
- 레퍼럴
- 어떻게 능력을 보여줄 것인가?
- Bot
- 김달
- 테슬라 리퍼럴 코드
- 테슬라 레퍼럴 적용 확인
- 모델 Y 레퍼럴
- 테슬라 레퍼럴
- 테슬라 리퍼럴 코드 생성
- 테슬라 리퍼럴 코드 혜택
- 메디파크 내과 전문의 의학박사 김영수
- 인스타그램
- 개리마커스
- 연애학개론
- 유투브
- 클루지
- 팔로워 수 세기
- 테슬라 추천
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 |
글 보관함