首页 > 编程语言 >学会python——文本分词(python实例一)

学会python——文本分词(python实例一)

时间:2024-06-11 18:33:36浏览次数:19  
标签:__ txt python 实例 vdic 文本 分词

目录

1、认识Python

2、环境与工具

2.1 python环境

2.2 pycharm编译

3、对文本进行分词

3.1 代码构思

3.2 代码示例

3.3 运行结果

4、总结


1、认识Python

Python 是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。

Python 的设计具有很强的可读性,相比其他语言经常使用英文关键字或标点符号,它具有比其他语言更有特色的语法结构。

2、环境与工具

2.1 python环境

在Windows上使用命令行窗口查看所安装的python版本

python 

2.2 pycharm编译

在这里可以直接使用社区版的pycharm进行代码编译。

3、对文本进行分词

3.1 代码构思

使用re模块的split()函数对字符串进行分隔

3.2 代码示例

import re
from collections import Counter

# 定义函数,用于查找文本字符串中的每一个单词,并计算出现次数
def get_char(txt):
    # 拆分方式,过滤掉空字符串
    vlist = re.findall(r'\b\w+\b', txt.lower())
    # 使用Counter来统计词频
    vdic_fre = Counter(vlist)
    # 按照频率排序
    vdic_sort = vdic_fre.most_common()
    return vdic_sort

if __name__ == '__main__':
    # 读取文本文件
    with open('test.txt', 'r', encoding='utf-8') as f:
        vtext = f.read()
    # 调用排序函数
    vstr = get_char(vtext)
    print('列出文本中的单词:\n')
    print(vstr)

3.3 运行结果

还需要在代码的目录下新建一个文件:test.txt

输入内容并保存,然后运行程序

4、总结

使用该函数可用作对文本内容进行整理,按照设定的分词方式进行文本分词。

标签:__,txt,python,实例,vdic,文本,分词
From: https://blog.csdn.net/LNN0212/article/details/139594974

相关文章

  • python-识别图片中的文字
    1、下载:https://digi.bib.uni-mannheim.de/tesseract/我们之所以要应用Tesseract,是因为他是一个开源的OCR(光学字符识别)引擎,它可以从各种图像中提取文本信息。它具有以下作用:-从扫描或拍摄的图像中提取文本:Tesseract可以从这些非结构化的图像中识别和提取文本,这些图像可以......
  • .NET Framework 旧系统新增SSO单点登录实例
    最近公司的很多项目都要改单点登录了,不过大部分都还没敲定,目前立刻要做的就只有一个比较老的项目先改一个试试手,主要目标就是最短最快实现功能首先因为要保留原登录方式,所以页面上的改动就是在原来登录页面下加一个SSO登录入口用超链接写的入口,页面改造后如下图:其中超链接的......
  • 贪吃蛇小游戏Python Pygame实现
    运行结果 游戏规则1.↑↓←→来控制蛇的移动方向2.蛇吃到自己身体的任意一部分游戏结束,自动退出窗口3. 蛇的速度会随游戏时间增长越来越快,与吃食物的多少(分数)无关4.蛇可以穿过边界到达另一边5.场上食物同时只会存在一个,颜色随机,但每个颜色的所得分......
  • vue初使用实例之笔记本
    <!DOCTYPEhtml><html><head><metacharset="utf-8"><metahttp-equiv="X-UA-Compatible"content="IE=edge"><title></title><metaname="des......
  • Python 字符串
    Python字符串Python中的字符串是一种常见且重要的数据类型,用于存储文本信息。字符串是不可变的,即一旦创建,就不能更改其内容。但我们可以创建新的字符串作为修改的结果。以下是关于Python字符串的一些基本操作和功能的介绍。数据类型转字符串在Python中,你可以使用str()......
  • 爬取京东商品图片的Python实现方法
    引言在数据驱动的商业环境中,网络爬虫技术已成为获取信息的重要手段。京东作为中国领先的电商平台,拥有海量的商品信息和图片资源。本文将详细介绍如何使用Python编写爬虫程序,爬取京东商品的图片,并提供完整的代码实现过程。爬虫基础在开始编写爬虫之前,需要了解一些基本的网......
  • Python 调整PDF页面尺寸大小
    在处理PDF文件时,我们可能会遇到这样的情况:原始PDF文档不符合我们的阅读习惯,或者需要适配不同显示设备等。这时,我们就需要及时调整PDF文档中的页面尺寸,以满足不同应用场景的需求。利用Python语言的高效性和灵活性,再结合Spire.PDFforPython库的强大功能,我们可以通过Python代码轻......
  • Redis:原理、概念、用法与实例解析
    Redis:原理、概念、用法与实例解析在当今风起云涌的技术领域中,Redis犹如一颗璀璨的明星,闪耀着独特的光芒。它作为一种备受瞩目的数据存储和缓存解决方案,以其卓越的性能、丰富多样的功能以及简单易用的特性,成为了众多开发者的心头好。在这篇博客中,我们将全方位、深层次地探......
  • python怎么保留小数
    保留两位小数,并做四舍五入处理方法一:使用字符串格式化a = 12.345print("%.2f" % a)# 12.35方法二:使用round内置函数a = 12.345a1 = round(a, 2)print(a1)# 12.35方法三:使用decimal模块from decimal import Decimala = 12.345Decimal(a).......
  • python怎么画曲线图
    如何使用python画曲线图?下面是基本步骤:前提首先,为了实际使用Matplotlib,我们需要安装它。安装如果你安装了更高版本的Python,你应该能够打开cmd.exe或终端,然后执行:pip install matplotlib注意:如果上面的较短命令不工作,你可能需要执行C:/Python34/Scripts/pipinsta......