Xc's Blog

Hive学习笔记

1999/03/19 Share

MISC

  1. Hive不支持插入单条语句,只支持2种批量插入。从文件读取数据,或者从别的表读取数据

Hive 表的种类

  1. 内部表

    1
    2
    CREATE TABLE workers( id INT, name STRING)    
    ROW FORMAT DELIMITED FIELDS TERMINATED BY '\054';
  2. 分区表

    1
    2
    3
    create table partition_employee(id int, name string)   
    partitioned by(daytime string)
    row format delimited fields TERMINATED BY '\054';

    分区表可以用来加速查询,不同分区的数据会存储在hdfs不同的文件夹中
    分区支持多级分区

  3. 桶表

  4. 外部表

    数据并非由Hive存储(例如数据存储在Hive上)

Hive表分区

  • 为什么要分区

Hive表大多数以文件的形式存储在磁盘上,

CATALOG
  1. 1. MISC
  2. 2. Hive 表的种类
  3. 3. Hive表分区