Python统计单词出现的频率-编程知识网

编程知识网首页

资源下载

博客问答程序员的那些事

写博客注册

本站消息

出租广告位,需要合作请联系站长

今日名言-想象你自己对困难作出的反应，不是逃避或绕开它们，而是面对它们，同它们打交道，以一种进取的和明智的方式同它们奋斗。——马克斯威尔·马尔兹

今日名言-用谅解、宽恕的目光和心理看人、待人。人就会觉得葱笼的世界里，春意盎然，到处充满温暖。——蔡文甫

9

文章

11084

访问

+关注

分类

暂无分类

标签

日期归档

暂无数据

Python统计单词出现的频率

发布于2021-07-25 06:52 阅读(731) 评论(0) 点赞(15) 收藏(2)

以open函数打开“sample.txt”文件，统计里面出现过的单词频率。

首先通过“正则表达式”把非字母的符号全部变成空格，再用split（）方法把所有的单词以“空格”为分隔符分割，储存在words变量中（list类型）。声明一个dict类型的变量word_counts，以单词作为key值，单词出现的次数作为value值。然后用“in”来判断单词是否存在word_counts中，若存在，则单词对应的value值加一，如果不存在，就新增一个key值，并把对应的value值初始化为1。

此程序中为了避免大小写造成的对比问题，把所有的单词都变成小写统计。


# -*- encoding:utf-8 -*-
import re
fp = open("sample.txt","r")
article = fp.read()
new_article = re.sub(r'[^A-Za-z]', ' ', article)  #使用正则表达式把除了字母和空格以外的符号都去除
words = new_article.split( )
word_counts = {}
for word in words:
    if word.lower() in word_counts:
        word_counts[word.lower()] = word_counts[word.lower()] + 1
    else:
        word_counts[word.lower()] = 1
 
key_list = list(word_counts.keys())
key_list.sort()
for key in key_list:
    if word_counts[key] >= 1:
        print("{}:{}".format(key,word_counts[key]))

原文链接:https://blog.csdn.net/m0_55746228/article/details/119026521

所属网站分类: 技术文章 > 博客

作者：火腿快跑

链接：http://www.pythonpdf.com/blog/article/455/3834de586479f5d86b58/

来源：编程知识网

任何形式的转载都请注明出处,如有侵权一经发现必将追究其法律责任

15 0

收藏该文

昵称:

评论内容：(最多支持255个字符)

程序员的那些事(new)

数据仓库hive概念与数据仓库分层、概念模型、逻辑模型、物理模型

Qt TCP/UDP通讯封装

2021-07-01常见的Dos命令

干了八年java开发，被比自己小7岁的主管羞辱，这一刻好像真的意识到了什么是中年危机

[建议收藏] 妹子惊叹: 原来测试执行的流程竟是这样的？！

C语言实现双人猜数游戏

程序人生3

程序员（媛）不懂汉服？岂能让别人小看，咱先靠肉眼大数据识别万张穿搭照

筛选系统架构设计师考试上午综合知识易错常考真题，及详细解答

【SaaS云会议系统开发】项目实训——2021.07.06

电子书(new)

Python3.2.3官方文档（中文版）pdf下载

Head First Python（中文版）pdf下载

FlaskWeb开发：基于Python的Web应用开发实战 pdf下载

Beginning Python Games Development(2nd) pdf下载

Python Cookbook第三版中文PDF下载高清完整扫描原版

django book 2.0中文 PDF下载高清完整扫描原版

python编码规范PDF下载高清完整

笨办法学python pdf下载

Java与模式 pdf下载

深入剖析Tomcat pdf下载

脚本(new)

用python画国旗

python文件解压脚本

python分类文件脚本下载

实时跟踪人物运动轨迹

PYTHON画樱花树

100行的加强型字符串 python实用脚本下载

一些有趣的java小程序

菱形的图形生成器，2到100以内的质数-java实用小程序

java代码游戏编写

9个有趣的java代码

博客(new)

linux screen

计算日期到天数的转化（华为机试python）

Windows平台搭建Swig环境示例，并且解决python无法返回double类型的问题

Python调用C语言实现数独计算逻辑提速100倍以上

python 类中列表使用append出现实例重复的问题

python 对象引用、可变性和垃圾回收

关于不同版本torch保存训练参数的问题及其他（SPIN）

Python&Qt——yolov5手势识别隔空操纵车载音乐播放器

Hanlp工具安装问题解决(windows)

python +opencv 进行移动端UI自动化

视频教程(new)

Python网络爬虫实战爬虫视频教程下载

2020年抗疫之作java基础进阶13天

系统学习让你轻松定义java类加载器-java视频教程下载

真小白福音，完全从0带你掌握计算机与编程基础

撩课-Python大数据+人工智能1 python视频教程下载

撩课-Python大数据+人工智能2 python视频教程下载

java零基础入门到精通（2019版）

2020JAVA基础-深入系统的学习数据结构与算法

图灵学院 Python全系列教程全栈工程师 python视频教程下载

9天快速掌握java基础，更适合小白学习的Java基础,java视频教程下载

项目实战(new)

实战项目之拉勾网

前端实战项目之幸福西饼

实战项目之头条

实战项目之网易云

Vue实战项目之喵喵电影

小程序全栈开发之喵喵交友

2020前端React项目实战

2020版uni-app项目实战

打造仿小米电商网站

NodeJS+Express+MongoDB实战项目

问答(new)

在 Django forms.ChoiceField 上设置选定的值

如何读取Model实例的数据库表名？

在 Django 1.7 中运行单元测试时禁用迁移

使用 django-allauth 时如何自定义用户配置文件

Django admin：如何在模型中显示标记为 editable=False' 的字段？

Django：使用整数设置外键？

如何在 Django 中对文件上传进行单元测试

在 Django 中导航

如何为基本身份验证发送正确的授权标头

导入错误：无法从“django.utils”导入名称“6”

游戏(new)

java游戏-蛙人

经典骰子游戏,java游戏源码下载

一些java小游戏

python小游戏五子棋之人机对战源码下载

python小游戏贪吃蛇源码下载

java小游戏-抓住这只球

二十一点，java小游戏源码下载

java小游戏集合下载

java五子棋游戏源码下载

java贪吃蛇游戏

其他资源(new)

Maven+JSP+SSM+Mysql实现的音乐网站

HTML5中国象棋游戏

地图拼图游戏

网页版台球小游戏

HTML5街头霸王游戏源码

jQuery五子棋游戏

驴子跳跳网页游戏源码

小球撞击游戏源码

HTML5制作的2048游戏

jQuery益智拼图游戏