Fork me on GitHub

ORCFILE格式存储到hive表

概述

ORC指的是Optimized Record Columnar,就是说相对于其他文件格式,它已更优化方式存储数据.ORC能将原始的大小缩减75%,从而提升数据处理速度。ORC比Text,Squence和RC文件格式有更好的性能,而且ORC是目前是hive唯一支持事物的文件格式。
ORCFILE格式的输出包是:

1
org.apache.hadoop.hive.ql.io.orc

注意:本段文字来自《Hadoop构建数据仓库实践》书籍6.2.1章节

案例

建立ORCFILE格式表

1
2
3
4
5
6
7
8
create table t_orcfile(   
c1 string,
c2 int,
c3 string,
c4 string)
row format delimited
fields terminated by '\t'
stored as orcfile;

向表中导入数据

注意:不能直接向ORCFILE表插入数据,需要从其他表向ORCFILE表插入数据。

1
insert overwrite table t_orcfile  select * from t_textfile

本文标题:ORCFILE格式存储到hive表

文章作者:tang

发布时间:2018年07月28日 - 07:07

最后更新:2018年07月28日 - 08:07

原始链接:https://tgluon.github.io/2018/07/28/ORCFILE格式存储到hive表/

许可协议: 署名-非商业性使用-禁止演绎 4.0 国际 转载请保留原文链接及作者。

-------------本文结束感谢您的阅读-------------