hive mysql的查询结果怎么同步到mysql

风水堪舆学 | 网络营销 | 住宅风水 | 英文歌曲 | Adobe After Effects | 电脑配置 | 书籍改编电影 | 下载 | Legion | 网络推广 | 动画制作 | 赛事 | PLC | 小说创作 | 虚拟专用服务器 | 成语 | 家庭 | 单反相机 | 电视节目 | 投影机 | 面相 | 香港购物 | 配音 | 文具 | 二次元 | 影视 | 固态硬盘ssd | 虚拟机 | 跆拳道 | r（编程语言） | 秦时明月之天行九歌 | 使命召唤 | 网盘 | 地图 | 琅琊榜（电视剧） | 手机内存 | 角色扮演 | 华硕 | 百度输入法 | 盗墓笔记（小说） | 营销策划 | 化妆品 | Windows | ip地址 | 装修设计 | 齐内丁·齐达内 | 动画电影 | 中国中央电视台 | 罗兰 | 网站优化 | 斗鱼直播 | 冷知识 | 张帅 | 任天堂 | 摄影师 | 三菱商事 | 迅雷（软件） | 计算机病毒 | amd | 屏幕 | 微单相机 | 电学 | qq浏览器 | MacOS | 联赛 | snh48 | 芯片（集成电路） | 后宫·甄嬛传（书籍） | 植物辨识 | 运动 | 大一 | 美容 | 双色球 | 蓝牙音箱 | 楼盘 | 电脑电源 | 采暖 | 显卡驱动 | 体育赛事 | thinkpad | 离婚 | 武侠小说 | 索尼笔记本 | 中国足球协会超级联赛（csl） | youtube | 王力宏（人物） | 外星人 | 努比亚（手机品牌） | 海贼王 | 移动电源 | 完美世界（游戏） | 摩托车 | 编辑器 | 低音炮 | 收益 | 海关 | 徐波 | akb48 | 互联网创业 | 张璐 | 男性 | 性价比 | MacBook Air | 新疆维吾尔自治区 | 插座 | 外汇平台 | 华为Mate30 | 羽毛球技术 | 腾讯 QQ | 蓝屏 | 字幕 | 免费软件 | 电脑故障 | 女生 | 周星驰（人物） | 足球欧洲杯 | pdf | macbook | 直播 | 生活经历 | 骁龙处理器 | 主题曲 | 户外运动 | CPU | 娱乐圈 | 初恋 | 家居 | 流氓软件 | 名言 | 中国足球 | 近视眼 | acg | 一级方程式赛车（f1） | 小品 | 网站运营 | 英格兰足球超级联赛 | 一体机 | 人肉搜索 | 日本电影 | 系统软件 | 人生 | 流星花园 | 电钢琴 | 分辨率 | 迅雷 | 机械设计 | 古典音乐 | 液晶电视 | 睡眠 | 大片 | 资产 | Html/Css | ansys | 天蝎座 | 对联 | 大二 | 吉他学习 | 实习 | uc浏览器 | 计算机科学 | 新华社 | 脱毛 | 视力 | 乐视超级电视 | 大学生活 | 开关电源 | 平面设计 | 音乐版权 | iPhone 11 Pro | 面膜 | 鞠婧祎 | 胡歌（演员） | 郭富城 | 语言 | 赵丽颖（演员） | 意大利 | 电路设计 | 情侣 | NBA篮球 | 蔡徐坤 | 豆瓣电影 | 社交软件 | 微信开发 | 足球彩票 | 电工 | 手机摄像头 | 用户界面设计师 | 华语流行音乐 | 网卡 | 易烊千玺 | 笛子 | 日语学习 | 日语歌曲 | 歌手 | 张子枫 | 搏击项目 | 谭松韵 | 快捷键 | O2O | 移民 |

你的位置：网站首页 >> 频道首页 >>数据库 >>hive mysql的查询结果怎么同步到mysql

hive mysql的查询结果怎么同步到mysql

来源：蜘蛛抓取(WebSpider) 时间：2016-11-01 06:50 标签： mysql hive 实时同步

Hive（41）
mysql（16）
1. 下载sqoop
地址为：/cdh/3/下载相应版本，如sqoop-1.2.0-CDH3B4.tar.gz
2. 下载 hadoop
地址为：/cdh/3/，版本可以为hadoop-0.20.2-CDH3B4.tar.gz
3.解压 sqoop-1.2.0-CDH3B4.tar.gz ，hadoop-0.20.2-CDH3B4.tar.gz 到某目录如/home/hadoop/,解压后的目录为
A:/home/hadoop/ sqoop-1.2.0-CDH3B4.tar
B:/home/hadoop/ hadoop-0.20.2-CDH3B4
4.复制B里hadoop-core-0.20.2-CDH3B4.jar到sqoop(A)的lib下
5. sqoop导入mysql数据运行过程中依赖mysql-connector-java-*.jar，所以需要下载mysql-connector-java-*.jar到sqoop(A)的lib下
6.修改configure-sqoop
注释掉hbase zookeeper检查：
#if [ ! -d &${HBASE_HOME}& ]; then
# echo &Error: $HBASE_HOME does not exist!&
# echo 'Please set $HBASE_HOME to the root of your HBase installation.'
#if [ ! -d &${ZOOKEEPER_HOME}& ]; then
# echo &Error: $ZOOKEEPER_HOME does not exist!&
# echo 'Please set $ZOOKEEPER_HOME to the root of your ZooKeeper installation.'
设置表的访问权限：
mysql& GRANT ALL PRIVILEGES ON *.* TO 'hadoop_test'@'%' WITH GRANT OPTION,
&此命令的含义是把mysql下的hadoop_test的访问权限为任意IP,如果需要设置特定IP访问，则把%换成具体IP，如
mysql& GRANT ALL PRIVILEGES ON *.* TO 'hadoop_test'@'10.6.42.101' WITH GRANT
&列出mysql所有的表：
./sqoop list-tables --connect jdbc:mysql://10.6.42.101:3306/test --username hadoop_test --password 123456
&导入mysql表到hive：
./sqoop import --connect jdbc:mysql://10.6.42.101:3306/test --username hadoop_test --password 123456 --table mytest--hive-import
&导入需要表里有主建，还要注意不要使用127.0.0.1，因为map出去不一定在哪个节点执行。
如果曾经执行失败过，那再执行的时候，会有错误提示：
ERROR tool.ImportTool: Encountered IOException running import job: org.apache.hadoop.mapred.FileAlreadyExistsException: Output directory xxx already exists
执行 $HADOOP_HOME/bin/hadoop fs -rmr xxx 即可
多了一个表
sqoop做了一些mysqldump时的map reduce，所以速度会比单纯的dump后load快。
参考知识库
* 以上用户言论只代表其个人观点，不代表CSDN网站的观点或立场
访问：53974次
积分：2801
积分：2801
排名：第9578名
原创：209篇
转载：197篇
(1)(31)(18)(17)(36)(14)(3)(38)(11)(17)(35)(34)(18)(43)(67)(19)主题信息（必填）
主题描述（最多限制在50个字符）
申请人信息（必填）
申请信息已提交审核，请注意查收邮件，我们会尽快给您反馈。
如有疑问，请联系
关注云计算OpenStack、Docker、SaaS领域
在读大四学生一枚，学习过C++、java、C语言，windows编程、Linux编程，学过.....。目前主要学习C++、Qt编程。梦想做一位技术leader。乐于总结、乐于分享。目前从事Qt软件开发工作。
人之所以能，是相信能。与其花钱买更大的水缸，还不如花点时间挖口井。您的位置：
从MySQL到Hive，数据迁移就这么简单
使用Sqoop能够极大简化MySQL数据迁移至Hive之流程，并降低Hadoop处理分析任务时的难度。先决条件:安装并运行有Sqoop与Hive的Hadoop环境。为了加快处理速度，我们还将使用Cloudera Quickstart VM(要求至少4 GB内存)，不过大家也可以使用Hortonworks Data Platform(至少要求8 GB内存)。由于我的笔记本电脑只有8 GB内存，因此我在这里使用CLoudera VM镜像。如果大家需要使用Virtualbox运行Cloudera/HDP VM，则可以轻松使用其它多种Hadoop生态系统预装软件包(包括MySQL、Oozie、Hadoop、Hive、Zookeeper、Storm、Kafka以及Spark等等)。在MySQL中创建表在Cloudera VM中，打开命令界面并确保MySQL已经安装完毕。shell&&mysql&--version&mysql&&Ver&14.14&Distrib&5.1.66,&for&redhat-linux-gnu&(x86_64)&using&readline&5.示例当中自然要使用自己的数据库，因此使用以下命令在MySQL中创建一套数据库：mysql&&create&database&接下来：mysql&&use&&mysql&&create&table&customer(id&varchar(3),&name&varchar(20),&age&varchar(3),&salary&integer(10));&Query&OK,&0&rows&affected&(0.09&sec)&mysql&&desc&&+--------+-------------+------+-----+---------+-------+&|&Field&&|&Type&&&&&&&&|&Null&|&Key&|&Default&|&Extra&|&+--------+-------------+------+-----+---------+-------+&|&id&&&&&|&varchar(3)&&|&YES&&|&&&&&|&NULL&&&&|&&&&&&&|&|&name&&&|&varchar(20)&|&YES&&|&&&&&|&NULL&&&&|&&&&&&&|&|&age&&&&|&varchar(3)&&|&YES&&|&&&&&|&NULL&&&&|&&&&&&&|&|&salary&|&int(10)&&&&&|&YES&&|&&&&&|&NULL&&&&|&&&&&&&|&+--------+-------------+------+-----+---------+-------+ mysql&&select&*&from&&+------+--------+------+--------+&|&id&&&|&name&&&|&age&&|&salary&|&+------+--------+------+--------+&|&1&&&&|&John&&&|&30&&&|&&80000&|&|&2&&&&|&Kevin&&|&33&&&|&&84000&|&|&3&&&&|&Mark&&&|&28&&&|&&90000&|&|&4&&&&|&Jenna&&|&34&&&|&&93000&|&|&5&&&&|&Robert&|&32&&&|&100000&|&|&6&&&&|&Zoya&&&|&40&&&|&&60000&|&|&7&&&&|&Sam&&&&|&37&&&|&&75000&|&|&8&&&&|&George&|&31&&&|&&67000&|&|&9&&&&|&Peter&&|&23&&&|&&70000&|&|&19&&&|&Alex&&&|&26&&&|&&74000&|&+------+--------+------+-----开始Sqoop之旅如大家所见，其中customer表中并不包含主键。我在该表中并未添加多少记录。默认情况下，Sqoop能够识别出表中的主键列(如果有的话)，并将其作为划分列。该划分列的低值与高值检索自该数据库，而映射任务则指向符合区间要求的均匀部分。如果主键并未均匀分布在该区间当中，那么任务将出现不平衡状况。这时，大家应当明确选定一个与--split-by参数不同的列，例如--split-by id。由于我们希望将此表直接导入至Hive中，因此需要在Sqoop命令中添加–hive-import：sqoop&import&--connect&jdbc:mysql://localhost:3306/sqoop&&--username&root&&-P&&--split-by&id&&--columns&id,name&&--table&customer&&&--target-dir&/user/cloudera/ingest/raw/customers&&--fields-terminated-by&&,&&&--hive-import&&--create-hive-table&&--hive-table&sqoop_workspace.customers下面来看Sqoop命令各选项的具体作用：connect – 提供jdbc字符串username – 数据库用户名-P – 将在控制台中询问密码。大家也可以使用-passwaord，但并不推荐这种作法，因为其会显示在任务执行日志中并可能导致问题。解决办法之一在于将数据库密码存储在HDFS中的文件内，并将其向运行时交付。table – 告知计算机我们希望导入哪个MySQL表。在这里，表名称为customer。split-by – 指定划分列。在这里我们指定id列。target-dir – HDFS目标目录。fields-terminated-by – 我已经指定了逗号作为分隔值(默认情况下，导入HDFS的数据以逗号作为分隔值)。hive-import – 将表导入Hive(如果不加设置，则使用Hive的默认分隔符)。create-hive-table – 检查如果已经存在一个Hive表，任务设置是否会因此失败。hive-table – 指定.。本示例中为sqoop_workspace.customers，其中sqoop_workspace为数据库名称，而customers则为表名称。如下所示，Sqoop为一项map-reduce任务。请注意，这里我使用-P作为密码选项。除了这种方式，我们也可以使用-password实现参数化，并从文件中读取密码内容。sqoop&import&--connect&jdbc:mysql://localhost:3306/sqoop&--username&root&-P&--split-by&id&--columns&id,name&--table&customer&&--target-dir&/user/cloudera/ingest/raw/customers&--fields-terminated-by&&,&&--hive-import&--create-hive-table&--hive-table&sqoop_workspace.customers&Warning:&/usr/lib/sqoop/../accumulo&does&not&exist!&Accumulo&imports&will&fail.&Please&set&$ACCUMULO_HOME&to&the&root&of&your&Accumulo&installation.&16/03/01&12:59:44&INFO&sqoop.Sqoop:&Running&Sqoop&version:&1.4.6-cdh5.5.0&Enter&password:&16/03/01&12:59:54&INFO&manager.MySQLManager:&Preparing&to&use&a&MySQL&streaming&resultset.&16/03/01&12:59:54&INFO&tool.CodeGenTool:&Beginning&code&generation&16/03/01&12:59:55&INFO&manager.SqlManager:&Executing&SQL&statement:&SELECT&t.*&FROM&`customer`&AS&t&LIMIT&1&16/03/01&12:59:56&INFO&manager.SqlManager:&Executing&SQL&statement:&SELECT&t.*&FROM&`customer`&AS&t&LIMIT&1&16/03/01&12:59:56&INFO&pilationManager:&HADOOP_MAPRED_HOME&is&/usr/lib/hadoop-mapreduce&Note:&/tmp/sqoop-cloudera/compile/cbf5a67eade2/customer.java&uses&or&overrides&a&deprecated&API.&Note:&Recompile&with&-Xlint:deprecation&for&details.&16/03/01&13:00:01&INFO&pilationManager:&Writing&jar&file:&/tmp/sqoop-cloudera/compile/cbf5a67eade2/customer.jar&16/03/01&13:00:01&WARN&manager.MySQLManager:&It&looks&like&you&are&importing&from&mysql.&16/03/01&13:00:01&WARN&manager.MySQLManager:&This&transfer&can&be&faster!&Use&the&--direct&16/03/01&13:00:01&WARN&manager.MySQLManager:&option&to&exercise&a&MySQL-specific&fast&path.&16/03/01&13:00:01&INFO&manager.MySQLManager:&Setting&zero&DATETIME&behavior&to&convertToNull&(mysql)&16/03/01&13:00:01&INFO&mapreduce.ImportJobBase:&Beginning&import&of&customer&16/03/01&13:00:01&INFO&Configuration.deprecation:&mapred.job.tracker&is&deprecated.&Instead,&use&mapreduce.jobtracker.address&16/03/01&13:00:02&INFO&Configuration.deprecation:&mapred.jar&is&deprecated.&Instead,&use&mapreduce.job.jar&16/03/01&13:00:04&INFO&Configuration.deprecation:&mapred.map.tasks&is&deprecated.&Instead,&use&mapreduce.job.maps&16/03/01&13:00:05&INFO&client.RMProxy:&Connecting&to&ResourceManager&at&/0.0.0.0:/01&13:00:11&INFO&db.DBInputFormat:&Using&read&commited&transaction&isolation&16/03/01&13:00:11&INFO&db.DataDrivenDBInputFormat:&BoundingValsQuery:&SELECT&MIN(`id`),&MAX(`id`)&FROM&`customer`&16/03/01&13:00:11&WARN&db.TextSplitter:&Generating&splits&for&a&textual&index&column.&16/03/01&13:00:11&WARN&db.TextSplitter:&If&your&database&sorts&in&a&case-insensitive&order,&this&may&result&in&a&partial&import&or&duplicate&records.&16/03/01&13:00:11&WARN&db.TextSplitter:&You&are&strongly&encouraged&to&choose&an&integral&split&column.&16/03/01&13:00:11&INFO&mapreduce.JobSubmitter:&number&of&splits:4&16/03/01&13:00:12&INFO&mapreduce.JobSubmitter:&Submitting&tokens&for&job:&job_0_/01&13:00:13&INFO&impl.YarnClientImpl:&Submitted&application&application_0_/01&13:00:13&INFO&mapreduce.Job:&The&url&to&track&the&job:&http://quickstart.cloudera:8088/proxy/application_0_/01&13:00:13&INFO&mapreduce.Job:&Running&job:&job_0_/01&13:00:47&INFO&mapreduce.Job:&Job&job_0_0004&running&in&uber&mode&:&false&16/03/01&13:00:48&INFO&mapreduce.Job:&&map&0%&reduce&0%&16/03/01&13:01:43&INFO&mapreduce.Job:&&map&25%&reduce&0%&16/03/01&13:01:46&INFO&mapreduce.Job:&&map&50%&reduce&0%&16/03/01&13:01:48&INFO&mapreduce.Job:&&map&100%&reduce&0%&16/03/01&13:01:48&INFO&mapreduce.Job:&Job&job_0_0004&completed&successfully&16/03/01&13:01:48&INFO&mapreduce.Job:&Counters:&30&&&&&File&System&Counters&&&&&&&&&FILE:&Number&of&bytes&read=0&&&&&&&&&FILE:&Number&of&bytes&written=548096&&&&&&&&&FILE:&Number&of&read&operations=0&&&&&&&&&FILE:&Number&of&large&read&operations=0&&&&&&&&&FILE:&Number&of&write&operations=0&&&&&&&&&HDFS:&Number&of&bytes&read=409&&&&&&&&&HDFS:&Number&of&bytes&written=77&&&&&&&&&HDFS:&Number&of&read&operations=16&&&&&&&&&HDFS:&Number&of&large&read&operations=0&&&&&&&&&HDFS:&Number&of&write&operations=8&&&&&Job&Counters&&&&&&&&&&Launched&map&tasks=4&&&&&&&&&Other&local&map&tasks=5&&&&&&&&&Total&time&spent&by&all&maps&in&occupied&slots&(ms)=216810&&&&&&&&&Total&time&spent&by&all&reduces&in&occupied&slots&(ms)=0&&&&&&&&&Total&time&spent&by&all&map&tasks&(ms)=216810&&&&&&&&&Total&vcore-seconds&taken&by&all&map&tasks=216810&&&&&&&&&Total&megabyte-seconds&taken&by&all&map&tasks=&&&&&Map-Reduce&Framework&&&&&&&&&Map&input&records=10&&&&&&&&&Map&output&records=10&&&&&&&&&Input&split&bytes=409&&&&&&&&&Spilled&Records=0&&&&&&&&&Failed&Shuffles=0&&&&&&&&&Merged&Map&outputs=0&&&&&&&&&GC&time&elapsed&(ms)=2400&&&&&&&&&CPU&time&spent&(ms)=5200&&&&&&&&&Physical&memory&(bytes)&snapshot=&&&&&&&&&Virtual&memory&(bytes)&snapshot=&&&&&&&&&Total&committed&heap&usage&(bytes)=&&&&&File&Input&Format&Counters&&&&&&&&&&Bytes&Read=0&&&&&File&Output&Format&Counters&&&&&&&&&&Bytes&Written=77&16/03/01&13:01:48&INFO&mapreduce.ImportJobBase:&Transferred&77&bytes&in&104.1093&seconds&(0.7396&bytes/sec)&16/03/01&13:01:48&INFO&mapreduce.ImportJobBase:&Retrieved&10&records.&16/03/01&13:01:49&INFO&manager.SqlManager:&Executing&SQL&statement:&SELECT&t.*&FROM&`customer`&AS&t&LIMIT&1&16/03/01&13:01:49&INFO&hive.HiveImport:&Loading&uploaded&data&into&Hive&Logging&initialized&using&configuration&in&jar:file:/usr/jars/hive-common-1.1.0-cdh5.5.0.jar!/hive-log4j.properties&OK&Time&taken:&2.163&seconds&Loading&data&to&table&sqoop_workspace.customers&chgrp:&changing&ownership&of&'hdfs://quickstart.cloudera:8020/user/hive/warehouse/sqoop_workspace.db/customers/part-m-00000':&User&does&not&belong&to&supergroup&chgrp:&changing&ownership&of&'hdfs://quickstart.cloudera:8020/user/hive/warehouse/sqoop_workspace.db/customers/part-m-00001':&User&does&not&belong&to&supergroup&chgrp:&changing&ownership&of&'hdfs://quickstart.cloudera:8020/user/hive/warehouse/sqoop_workspace.db/customers/part-m-00002':&User&does&not&belong&to&supergroup&chgrp:&changing&ownership&of&'hdfs://quickstart.cloudera:8020/user/hive/warehouse/sqoop_workspace.db/customers/part-m-00003':&User&does&not&belong&to&supergroup&Table&sqoop_workspace.customers&stats:&[numFiles=4,&totalSize=77]&OK&Time&taken:&1.399&seconds最后，让我们验证Hive中的输出结果：hive&&show&&OK&default&sqoop_workspace&Time&taken:&0.034&seconds,&Fetched:&2&row(s)&hive&&use&sqoop_&OK&Time&taken:&0.063&seconds&hive&&show&&OK&customers&Time&taken:&0.036&seconds,&Fetched:&1&row(s)&hive&&show&create&table&&OK&CREATE&TABLE&`customers`(&&&`id`&string,&&&&`name`&string)&COMMENT&'Imported&by&sqoop&on&&13:01:49'&ROW&FORMAT&DELIMITED&&&&FIELDS&TERMINATED&BY&','&&&&LINES&TERMINATED&BY&'\n'&&STORED&AS&INPUTFORMAT&&&&'org.apache.hadoop.mapred.TextInputFormat'&&OUTPUTFORMAT&&&&'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'&LOCATION&&&'hdfs://quickstart.cloudera:8020/user/hive/warehouse/sqoop_workspace.db/customers'&TBLPROPERTIES&(&&&'COLUMN_STATS_ACCURATE'='true',&&&&'numFiles'='4',&&&&'totalSize'='77',&&&&'transient_lastDdlTime'='')&Time&taken:&0.26&seconds,&Fetched:&18&row(s)hive& select *OK1 John2 Kevin19 Alex3 Mark4 Jenna5 Robert6 Zoya7 Sam8 George9 PeterTime taken: 1.123 seconds, Fetched: 10 row(s).到此完成!从MySQL到Hive，数据迁移工作就是这么简单。（来源：，作者：核子可乐译）
作者的其他文章
关注作者的人微信号：callme_hr
扫码加一览职业生涯导师微信好友
深圳市一览网络股份有限公司（股票代码：833680）
版权所有 &

hive mysql的查询结果怎么同步到mysql

我要回帖

更多关于 mysql hive 实时同步的文章

随机推荐

hive mysql的查询结果怎么同步到mysql

我要回帖

更多关于 mysql hive 实时同步 的文章

随机推荐

更多关于 mysql hive 实时同步的文章