[spark] partition
일반적으로 파티션의 개수를 늘리는 것은 오버헤드가 너무 많아지는 수준이 되기 전까지는 성능을 높여준다. 최소한 총코어 개수 이상의 파티션을 사용해야 한다. 각 Executor에서 스파크가 한 번에 처리하는 양이 적어지므로 메모리 부족 오류를 줄이는데 도움을 준다. 파티션이 부족한 것보다는 차라리 조금 더 많은 것이 낫다. MapReduce에서 보수적으로 task의 수를 늘려나가는 것과는 가이드가 다른데, 이는 MapReduce는 각 task의 스타트업 오버헤드가 큰 반면 스파크는 그렇지 않기 때문이다. 파티션의 메타데이터를 보관 Driver memory errors & Driver overhead errors를 유발할 수 있다. 작은 사이즈의 파일들을 생성하기 위한 I/O가 많이 발생하며, 이 시간 또한..
공부
2022. 10. 14. 07:13
전설의 프로그래머 형님들의 '찐' 개발 훈수
좋은 에너지를 주는 것들
2022. 10. 14. 07:00
728x90
728x90
250x250
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
TAG
- Kluge
- 책그림
- Bot
- 테슬라 레퍼럴 적용 확인
- 테슬라 리퍼럴 코드
- 테슬라 레퍼럴
- 연애학개론
- 테슬라 레퍼럴 코드 확인
- 팔로워 수 세기
- 테슬라 추천
- 할인
- 모델 Y 레퍼럴
- 인스타그램
- 메디파크 내과 전문의 의학박사 김영수
- COUNT
- 테슬라
- 레퍼럴
- 김달
- 유투브
- follower
- 어떻게 능력을 보여줄 것인가?
- 테슬라 리퍼럴 코드 혜택
- 클루지
- 개리마커스
- wlw
- 테슬라 리퍼럴 코드 생성
- 테슬라 크레딧 사용
- 모델y
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
글 보관함