python怎么在1G内存下对900w词频统计python表(占用100MB文件)排序,内存不够求还能怎么完成?

根据txt文件内的英文单词统计词频我这个只能统计到单个词,求问怎么才能统计词组或者按行统计然后根据统计出的词频分别除以最大的词频得到各自的比例,保存到詞典里面刚学/usercenter?uid=c94b05e79dd13&teamType=1">哦_廿一

不能使用其他包是吧,只能自己编写方法读取

 
只要python统计词频能实现就行,没什么限制问下你这个是除以最大词頻那个词吗,我们这个有要求要除以最大的不是总的。还有这个能排序然后存进词典吗

"补充在你完善追问之后":可以实现你说的情况。等我下班回去再给你写下

“有些问题可能还需要问你,你可以加下我的联系方式我私信给你。”

百分比就是——每个词不是都有一個词频吗然后用这个词频分别除以词频最大的那个数,这个词频最大的数也是统计出来的那个比如图中最大的failure是4539,其他的就分别除以這个4539得到各自的一个百分比应该就是dict把,就我们之后要调用这个数据你私信发了吗,我好加一下

下载百度知道APP抢鲜体验

使用百度知噵APP,立即抢鲜体验你的手机镜头里或许有别人想知道的答案。

我要回帖

更多关于 词频统计python 的文章

 

随机推荐