python 将一个dataframe每一列数据除以最后一列数据得到新的python dataframee

方法二:采用drop方法,有下面三种等价的表达式:

注意:凡是会对原数组作出修改并返回一个新数组的,往往都有一个 inplace可选参数。如果手动设定为True(默认为False),那么原数组直接就被替换。也就是说,采用inplace=True之后,23情况所示)对应的内存值直接改变;而采用inplace=False之后,原数组名对应的内存值并不改变,需要将新的结果赋给一个新的数组或者覆盖原数组的内存位置(如1情况所示)。

如何创建包含c1的行的新数据帧。

时间:原作者:0个回答

有X个机组以15分钟为步长的长系列(年月日时分)出力的数据,想处理成每个机组的,以“年月日”为索引值,每行显示1天96个点出力的形式。

先利用df.head()把dataframe按96切割成Y份,然后将Y份的第x列(x号机组的出力)提取出来,放到list里,再利用concat将list合并为新的dataframe,将该dataframe的列名更改为长系列(年月日),再转置,就可以得到想要的格式。

1. 已知某元素索引位置,选取该元素


输入 df.loc['索引名称‘’,‘列名称’] 即可,例如


若没有index或列名称,则使用df.iloc[]在对应位置输入索引位置即可。



1)删除dataframe索引,重新赋予从0开始的索引;

4. 控制输出为年-月-日的格式

数据格式是以一分钟为步长的长系列负荷,从数据库读入excel后存在缺漏情况,即并不是每一天的数据都有1440个点。需要把数据处理成15分钟间隔,即1天有96个点。

Step1. 在excel中,新建一张sheet,第一列索引用excel自动填充,处理成目标范围以1分钟为步长的时间序列,作为index。然后使用vlookup在原始数据中比对index,这样缺漏行会自动返回#NAN值。【由于本身计算精度问题,可能出现两张表上同一个日期转为数值后存在百亿分之一的误差,可先采用rounddown()处理一下,取小数点后8位数字就可以了】

这一步也可以利用dataframe的merge来操作,没研究暂且不写。

在不知道列名的情况下,用索引位置选择列,用df[[列索引]];


我要回帖

更多关于 python dataframe 的文章

 

随机推荐