=从微软数据库文件中读取数据
=从┅个cube文件中读取数据
=从系统中获得文件并将其发送到下一步
=读取一个主文件夹获取所有的子文件
=使用XPath路径读取xml文件这个步骤也允许你解析以前字段定义的xml文件
=利用LDAP协议连接远程主机读取数据
=从属性文件中读入键值对
=从一个XBase类型的DBF文件中读取记录
=将记录存储到微软的数据庫表中
=将数据写入Cube文件中
=根据某个字段值的条件插入,删除更新数据库表
=将几个字段编码写入xml文件
=用另一个单词替换当前的所以得字苻串
=从透视表中还原数据到事实表(通过指定维度字段及其分类值,度量字段最终还原出事实表数据)
=去掉输入流中的重复行(在使用該节点前要先排序,否则只能删除连续的重复行)
=实现对特定字段总一个值到另一值得映射
=将输入流出现的结果字段进行扁平化处理(指定需处理的字段和扃平化后的新字段,将其它字段做为组合Key进行扃平化处理)
=通过检索键值对拆分行分配他们到新的字段中。(同Normaliser过程相反)
=对输入字段延迟一定时间后输出
=执行一个进程然后返回一个结果
=如果某个字符值为指定的值,就将它设置为null
=通过输入文件名對文件进行删除,拷贝转移操作
=如果输入流里没有字段将会输出空字段
=根据判断条件,转到特定的路径
=允许你输入一个字段用正则表达式就行验证
=验证某一个表在数据库中是否存在
=执行一个典型的数据集之间的合并
=用给定的关键字段对多个输入流进行排序
=根据设置规则对數据进行验证
=根据设置数目过滤记录
=找到指定的变量将他们放到有用的字段中
=这个步骤允许你读取先前的文件,或者上一个job工程的入口
=根据输入行设置环境变量
=设置文件名到转换结果以后的job工程入口可以运用这个信息
=通过API端口注册行记录到转换过程
=用在集群环境下实現服务器之间的数据传输
=用在集群环境,利用TCP/IP协议实现服务器之间数据传输
=导入压缩文件到输入流读取器
师傅领进门修行靠个人。
原因:有会话执行过DML操作,然后没commit提交再执行删除操作,就锁了
1、锁等待超时。是当前事务在等待其它事务释放锁资源造成的可以找出锁资源竞争的表和语句,优化你的创建索引等,如果还是不行可以适当减少并发线程数。
2、你的事务在等待给某個表加锁时超时了估计是表正被另的进程锁住一直没有释放。
InnoDB会自动的检测死锁进行回滚或者终止死锁的情况。
如题最近在做etl数据清洗,用到kettle这个工具现在想把MySQL中某个表的数据输出到hive中与之对应的表中去,请问如何实现
楼主解决了吗?我这几天也遇到这个问题
请问楼主解决了吗交流下心得呀,我写入hive的话感觉是插入格式有问题
樓主解决了吗我这边到load一步报错,存到hdfs的文件是由本机用户创建的存在文件权限问题,且rootadmin用户无法修改