티스토리 뷰
728x90
ORC(Optimized Row Columnar)
컬럼단위로 데이터 기록
인덱스를 기록하여 컬럼에 바로 접근
JSON 중첩구조, 리스트, 맵 복합 형태
### 특징
- 결과가 하나의 파일, 네임노드의 부하를 줄여줌
- datetime, decimal, complex type (struct, list, map, union) 지원
- 파일 경량 인덱스가 저장
- 데이터 타입 기반의 block-mode 압축
- 하나의 파일을 여러개의 리더로 동시에 읽기 가능
- 마커 스캐닝 없이 파일 분할 가능
- 파일 읽기 쓰기에 일정한 메모리 용량만 필요
- 필드의 추가나 제거가 가능한 메타 데이터는 Protocol Buffers 를 사용해서 저장
https://cwiki.apache.org/confluence/display/hive/languagemanual+orc
728x90
'공부' 카테고리의 다른 글
[Spark] App name (0) | 2021.12.18 |
---|---|
[Java] map.foreach((k, v) -> {}) (0) | 2021.12.18 |
[Hive] ROW FORMAT DELIMITED is only compatible with 'textfile', not 'orc' (0) | 2021.12.18 |
[Linux] Couldn't authenticate to server: Bad sendauth version was sent (0) | 2021.12.18 |
[Java] intersection retainAll() (0) | 2021.12.18 |
댓글
250x250
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
TAG
- 연애학개론
- 개리마커스
- 팔로워 수 세기
- 클루지
- 테슬라 레퍼럴
- follower
- 책그림
- 유투브
- 모델y
- 테슬라 크레딧 사용
- 어떻게 능력을 보여줄 것인가?
- Bot
- Kluge
- 테슬라 레퍼럴 적용 확인
- wlw
- 할인
- 테슬라 리퍼럴 코드
- 레퍼럴
- 메디파크 내과 전문의 의학박사 김영수
- 인스타그램
- 테슬라 리퍼럴 코드 혜택
- 모델 Y 레퍼럴
- 테슬라 리퍼럴 코드 생성
- 테슬라 레퍼럴 코드 확인
- 김달
- 테슬라 추천
- 테슬라
- COUNT
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
글 보관함