[spark] keyword
- dataframe
- dataset
- sql
- rdd
- optimized plan
- specialized code
- explain
- predicate push down
- logical plan
- physical plan
- transformation
- action
- lazy evaluation
- partition
https://www.brainbackdoor.com/data/spark-concept
Spark는 어떤 컨셉인가?
1. DataFrame
www.brainbackdoor.com
https://spidyweb.tistory.com/326
[spark] RDD vs DataFrame 큰 차이점, Dataframe을 사용해야 되는 이유, RDD를 사용해야 하는 경우는? RDD, Data
RDD란? 정의 및 특징, dataframe과의 차이는? RDD(Resilient Distributed Dataset) 특징 설명 Resilient RDD lineage 그래프를 통한 fault-tolerant가 빠졌거나,node의 실패로 인한 손상된 파티션을 다시 실행시킨다. Distribu
spidyweb.tistory.com
https://ddaengddaeng.tistory.com/m/114
[Spark] 스파크 완벽 가이드 #2장
책 소개 제목 : 스파크 완벽 가이드 저자 : 빌 체임버스, 마테이 자하리아 https://www.aladin.co.kr/shop/wproduct.aspx?ItemId=175546079 스파크 완벽 가이드 스파크 창시자가 알려주는 스파크 활용과 배포, 유지
ddaengddaeng.tistory.com