[spark] RDD, DataFrame
https://alex-blog.tistory.com/entry/Spark-%ED%94%84%EB%A1%9C%EA%B7%B8%EB%9E%98%EB%B0%8D-RDD-DataFrame Spark 프로그래밍 - RDD, DataFrame Spark는 Mapreduce의 대체자 MapReduce의 경우 Disk에서 매번 데이터를 처음부터 읽어야한다. (-> RDD는 데이터를 처음부터 읽을 필요가 없게 만들어준다.) Spark는 데이터를 메모리에 올려서 연산 방식 데 alex-blog.tistory.com
공부
2022. 9. 3. 16:56
[spark] lazy evalution
1. 스파크(SPARK)의 연산 방식은 lazy evaluation으로 수행된다. Lazy evaluation(굳이 번역해 보자면 느긋한 연산 정도 되겠다)을 사용함으로써 action이 시작되는 시점에 트랜스포메이션(transformation)끼리의 연계를 파악해 실행 계획의 최적화가 가능해진다. 사용자가 입력한 변환 연산들을 즉시 수행하지 않고 모아뒀다가 가장 최적의 수행 방법을 찾아 처리하는 장점을 가진다. 여기서 말하는 최적화란 대부분 지역성(locality)에 관한 것이다. 예를 들어 물건을 사오는 심부름을 시킬 때 A상점에서 파는 물건과 B상점에서 파는 물건을 따로따로 여러 번사오게 하는 것보다 필요한 물건을 한꺼번에 주문해서 한 번 방문했을 때 필요한 물건을 한 번에 사는 것이 효율적이기 떄문..
공부
2022. 9. 3. 16:47
728x90
728x90
250x250
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
TAG
- 테슬라 크레딧 사용
- 할인
- 어떻게 능력을 보여줄 것인가?
- 모델y
- 연애학개론
- 유투브
- 메디파크 내과 전문의 의학박사 김영수
- wlw
- 팔로워 수 세기
- 테슬라
- 테슬라 리퍼럴 코드
- 모델 Y 레퍼럴
- 테슬라 레퍼럴 적용 확인
- 책그림
- 테슬라 레퍼럴
- 테슬라 리퍼럴 코드 혜택
- 테슬라 추천
- 클루지
- 테슬라 레퍼럴 코드 확인
- 개리마커스
- Bot
- follower
- 김달
- 레퍼럴
- 테슬라 리퍼럴 코드 생성
- COUNT
- 인스타그램
- Kluge
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 |
글 보관함