티스토리 뷰

공부

[spark] keyword

승가비 2022. 11. 23. 22:18
728x90

- dataframe

- dataset

- sql

- rdd

- optimized plan

- specialized code

- explain

- predicate push down

- logical plan

- physical plan

- transformation

- action

- lazy evaluation

- partition

 

https://www.brainbackdoor.com/data/spark-concept

 

Spark는 어떤 컨셉인가?

1. DataFrame

www.brainbackdoor.com

https://spidyweb.tistory.com/326

 

[spark] RDD vs DataFrame 큰 차이점, Dataframe을 사용해야 되는 이유, RDD를 사용해야 하는 경우는? RDD, Data

RDD란? 정의 및 특징, dataframe과의 차이는? RDD(Resilient Distributed Dataset) 특징 설명 Resilient RDD lineage 그래프를 통한 fault-tolerant가 빠졌거나,node의 실패로 인한 손상된 파티션을 다시 실행시킨다. Distribu

spidyweb.tistory.com

https://ddaengddaeng.tistory.com/m/114

 

[Spark] 스파크 완벽 가이드 #2장

책 소개 제목 : 스파크 완벽 가이드 저자 : 빌 체임버스, 마테이 자하리아 https://www.aladin.co.kr/shop/wproduct.aspx?ItemId=175546079 스파크 완벽 가이드 스파크 창시자가 알려주는 스파크 활용과 배포, 유지

ddaengddaeng.tistory.com

728x90
댓글