티스토리 뷰

공부

[Hive] `internal` vs `external` of Table

승가비 2020. 5. 31. 13:22
728x90

관리 테이블

관리되는 테이블은 hi.metastore아래에 저장됩니다. warehouse.dir경로 속성, 기본적으로 와 유사한 폴더 경로/user/hive/warehouse/databasename.db/tablename/. 기본 위치는 다음에 의해 재정의될 수 있습니다.location테이블 생성 중 속성. 관리되는 테이블 또는 파티션이 삭제되면 해당 테이블 또는 파티션과 연결된 데이터 및 메타 데이터가 삭제됩니다. PURGE옵션을 지정하지 않으면 데이터가 정의된 기간 동안 휴지통 폴더로 이동됩니다.

Hive가 테이블의 수명 주기를 관리해야 하거나 임시 테이블을 생성할 때 관리되는 테이블을 사용하십시오.

외부 테이블

외부 테이블은 외부 파일의 메타 데이터/스키마를 설명합니다. 외부 테이블 파일은 하이브 외부의 프로세스에 의해 액세스하고 관리할 수 있습니다. 외부 테이블은 Azure스토리지 볼륨(ASV)또는 원격 HDFS위치와 같은 소스에 저장된 데이터에 액세스 할 수 있습니다. 외부 테이블의 구조 또는 분할이 변경된 경우 MSCKREPANDLETABLE_name문을 사용하여 메타 데이터 정보를 새로 고칠 수 있습니다.

파일이 이미 있거나 원격 위치에 있을 때 외부 테이블을 사용하고 테이블을 삭제해도 파일이 유지되어야 합니다.

 

 

https://cwiki.apache.org/confluence/display/Hive/Managed+vs.+External+Tables

 

Managed vs. External Tables - Apache Hive - Apache Software Foundation

Hive fundamentally knows two different types of tables: Managed (Internal)External Introduction This document lists some of the differences between the two but the fundamental difference is that Hive assumes that it owns the data for managed tables. That

cwiki.apache.org

 

728x90

'공부' 카테고리의 다른 글

[Sh] curl GET & POST  (0) 2020.05.31
[Hive] document  (0) 2020.05.31
[Python] regexp url  (0) 2020.05.31
[Python] Content-Type & MIME-Type  (0) 2020.05.31
[Python] execute timeout  (0) 2020.05.31
댓글