Fork me on GitHub

TEXTFILE格式存储到hive表

概述

TEXTFILE就是普通的文本型文件,是hadoop里面最常用的输入输出格式,也是hive默认文件格式,如果表定义为TEXFILE,则可以向该表中装载以逗号、tab、空格作为分隔符的数据,也可以导入json格式文件。
TEXTFILE格式的输出包是:

org.apache.hadoop.mapred.TextfileInputFormat
org.apache.hadoop.mapred.TextfileOutputFormat

注意:本段文字来自《Hadoop构建数据仓库实践》书籍6.2.1章节

案例

建立TEXTFILE格式表

1
2
3
4
5
6
7
8
create table t_textfile(   
c1 string,
c2 int,
c3 string,
c4 string)
row format delimited
fields terminated by '\t'
stored as textfile;

装载数据

1
load data local inpath '/home/hadoop/textfile/a.txt' into/overwrite t_textfile;

查询数据

1
select * from t_textfile

本文标题:TEXTFILE格式存储到hive表

文章作者:tang

发布时间:2018年07月28日 - 07:07

最后更新:2018年07月28日 - 08:07

原始链接:https://tgluon.github.io/2018/07/28/TEXTFILE格式存储到hive表/

许可协议: 署名-非商业性使用-禁止演绎 4.0 国际 转载请保留原文链接及作者。

-------------本文结束感谢您的阅读-------------