概述
TEXTFILE就是普通的文本型文件,是hadoop里面最常用的输入输出格式,也是hive默认文件格式,如果表定义为TEXFILE,则可以向该表中装载以逗号、tab、空格作为分隔符的数据,也可以导入json格式文件。
TEXTFILE格式的输出包是:
org.apache.hadoop.mapred.TextfileInputFormat
org.apache.hadoop.mapred.TextfileOutputFormat
注意:
本段文字来自《Hadoop构建数据仓库实践》书籍6.2.1章节
案例
建立TEXTFILE格式表
1 | create table t_textfile( |
装载数据
1 | load data local inpath '/home/hadoop/textfile/a.txt' into/overwrite t_textfile; |
查询数据
1 | select * from t_textfile |