有时,我们需要统计一篇英语小短文中每一个英文字母出现的次数,这个用手工统计显然不可能完成。即使配合电脑进行,也可能需要很多久。这时我们可以使用python编写一个小程序,很轻松的完成这个工作。下面看我一步步操作。
工具/原料
python3.7
方法/步骤
1
第一步,先读入指定文件的内容。由于这个文件比较小,可以直接读入。如果文件较大,可以逐行或分部分读入内存。
2
第二步,对读入的文本将标点等特殊符号、换行符、空格等替换为空。这一步比较重要,称为数据清洗,一般使用遍历+string.replace(old,new)来完成。
3
第三步,将全文统一转换成小写字母。这是为了便于统计,如果工作要求大小写字母分开统计,这一步可以不操作。
4
第四步,建立统计字典,对文本逐个遍历进行统计。使用字典get方法,已有的字母次数加上,没有字母写入字典。
5
第五步,按统计值进行排序。将字典键值对转化为列表,然后再对列表按值进行降序排列。
6
第六步,按排序结果加入文本后面。使用追加的方式读入文件,然后遍历列表,将字母及对应结果写入文件。
注意事项
1
这个小程序除了可以用来统计字母,也可以稍微改造一下用来统计单词出现的频度,这样对于分析作者写作特点,文章的中心思想很有帮助。
2
欢迎大家和我交流。
上一篇:后面背个盒子的硬派suv是哪辆车
下一篇:2014中考英语单选题满分六大法