python的frame详解如何把dataframe中字符型的nan替换为'',数值型的nan替换为null

背景我就不介绍了.浪费大家流量.

KDD-99是基于林肯实验室的网络异常流量数据集想下载的链接在这里
源文件的每一行是这样的:


 

 
可以看出第2,34还有最后一个都是為非数值类型.
现在我们用python的frame详解的将其中的值根据其在列表中出现的顺序值替换为数值.
列表在这里

 
 
 

 
先用split()函数将源文件切割成列表
然后傳入一个叫replace_kdd(list)的函数
然后在代码72行有个列表,是用于确定你要替换的在整个源文件中的位置的
99999是用了防止溢出
然后在replace_kdd(list)函数里面调用了一个countingFunction(type_into, name)
这個函数用了计算在上面那个列表中元素的位置然后返回这个位置,作为值写入文件中
替换后的文件如下

 
 

 
思想大概就是这样最后贴出代碼的github位置,欢迎大家提出好的想法联系方式github和CSDN上都有写.
  • 我把我的毕业设计论文上传github了,里面有具体的实现细节大家可以参考参考,洇为已经过去两年了所以就把论文释出了

我要回帖

更多关于 python的frame详解 的文章

 

随机推荐