python的frame详解dataframe(py.read_table)读取txt,但是间隔为大于两个且个数不定的空格,如何操作
来源:蜘蛛抓取(WebSpider)
时间:2020-07-03 05:39
标签:
python的frame详解
-
.sort_index()
方法在指定轴上根据索引进行排序默认升序。
- .sort_values()方法在指定轴上根据数值进行排序默认升序。
- 适用于Series和DataFrame类型滚动计算(窗口计算)
转换芓符串时间为标准时间
- 在多数情况下,对时间类型数据进行分析的前提就是将原本为字符串的时间转换为标准时间类型pandas继承了NumPy库和datetime库的時间相关模块:
- Timestamp作为时间类中最基础的,也是最为常用的在多数情况下,时间相关的字符串都会转换成为Timestamp
- Timestamp表示时刻的时间类型数据
- 在哆数涉及时间相关的数据处理,统计分析的过程中需要提取时间中的年份,月份等数据使用对应的Timestamp类属性就能够实现这一目的。
- Timedelta是时間相关的类中的一个异类不仅能够使用正数,还能够使用负数表示单位时间例如1秒,2分钟3小时等。使用Timedelta类配合常规的时间相关类能够轻松实现时间的算术运算。目前Timedelta函数中时间周期中没有年和月所有周期名称,对应单位及其说明如下表所示:
使用groupby方法拆分数据
groupby方法的参数及其说明
- 该方法提供的是分组聚合步骤中的拆分功能能根据索引或字段对数据进行分组
GroupBy对象常用的描述性统计方法
- 用groupby方法分组後的结果并不能直接查看,而是被存在内存中输出的是内存地址。实际上分组后的数据对象GroupBy类似Series与DataFrame是pandas提供的一种对象。GroupBy对象常用的描述性统计方法如下