博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Hive表数据导出
阅读量:7214 次
发布时间:2019-06-29

本文共 952 字,大约阅读时间需要 3 分钟。

方式一: hadoop命令导出

hadoop fs -get hdfs://hadoop000:8020/data/page_views2   pv2 

 

方式二:通过insert...directory导出 【spark暂不支持】

导出到本地:

INSERT OVERWRITE LOCAL directory '/home/spark/hivetmp/'ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' LINES TERMINATED BY '\n'select * from page_views;

导出到HDFS:

INSERT OVERWRITE directory '/hivetmp/'ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' LINES TERMINATED BY '\n'select * from page_views;

报错:cannot recognize input near 'ROW' 'FORMAT' 'DELIMITED' in select clause

INSERT OVERWRITE directory '/hivetmp/'select * from page_views;

注意: 导出到本地可以通过ROW FORMAT来设置分隔符,导出到HDFS是不能设置分隔符的

 

方式三: shell命令 + 管道(hive -f/-e | sed/grep/awk > file)

hive -e "select * from page_views limit 5"hive -S -e "select * from page_views limit 5" | grep B58W48U4WKZCJ5D1T3Z9ZY88RU7QA7B1hive -S -e "select * from page_views limit 5" | grep B58W48U4WKZCJ5D1T3Z9ZY88RU7QA7B1 > file

 

方式四: sqoop

详见sqoop章节:http://www.cnblogs.com/luogankun/category/601761.html

 

你可能感兴趣的文章
Xcode 4.5 生成Ad Hoc Profile
查看>>
Java异常分类及处理
查看>>
基于XMPP的即时通信系统的建立(二)— XMPP详解
查看>>
高性能Web服务器Nginx
查看>>
Jsoup爬取登录网站信息
查看>>
理解 PHP 依赖注入
查看>>
1257: [CQOI2007]余数之和sum
查看>>
1724: [Usaco2006 Nov]Fence Repair 切割木板
查看>>
3396: [Usaco2009 Jan]Total flow 水流
查看>>
iOS 锁
查看>>
tsar源码分析
查看>>
ORACLE WebLogic Server 安装部署
查看>>
JavaScript高级程序设计(第3版) 笔记
查看>>
form表单提交中文乱码的详细解析
查看>>
VC 串口通信类
查看>>
部署WP程序到自己的手机
查看>>
技术分享:ELK日志分析方案
查看>>
软件开发性能优化经验总结
查看>>
面试题编程题05-python 有一个无序数组,如何获取第K 大的数,说下思路,实现后的时间复杂度?...
查看>>
kendo grid序号显示
查看>>