首页 > 编程语言 >Python工具箱系列(五十一)

Python工具箱系列(五十一)

时间:2024-03-29 17:13:17浏览次数:38  
标签:string 五十一 Python image 词云 import new 工具箱 txt

九宫格与词云

对图片进行九宫格切割,并且放到微信朋友圈曾经风靡一时。对于python来说,这个也非常简单。

from PIL import Image
import math


def ninerectanglegrid(inputfilename):
    """
    实现九宫格切割

    Args:
        inputfilename (string): 输入文件名称
    """
    cols = 3
    rows = 3

    # 原图
    im = Image.open(inputfilename)

    # 计算缩放比例
    width, height = im.size

    # 选取原图片长、宽中较大值作为新图片的九宫格半径
    new_image_length = width if width > height else height
    
    # 产生一张白底新图,并且是正方形
    new_image = Image.new(im.mode, (new_image_length, new_image_length), color='white')
    
    # 将原图粘贴在新图上,位置为居中
    if width > height:
        new_image.paste(im, (0, int((new_image_length - height) / 2)))
    else:
        new_image.paste(im, (int((new_image_length - width) / 2), 0))

    targetwidth = math.ceil(new_image_length/cols)
    targetheight = math.ceil(new_image_length/rows)

    # cut
    for row in range(rows):
        for col in range(cols):
            box = (targetwidth*col,targetheight*row,targetwidth*(col+1),targetheight*(row+1))
            out = new_image.crop(box)
            out.save(f'{row*cols+col}.png')


ninerectanglegrid(r'd:\test\girl.png')

运行后会将源图片直接切割成为9个图片文件。将它们上传到微信后,就可以组成九宫格图片了,其效果如下图所示。

 

从效果图中可以看出,如果切割点在头部附近会有一些失真的感觉。所以九宫格这种形式还是适合于二次元图片。

词云

在数据可视化方面,词云一直是一种视觉冲击力很强的方式。对输入的一段文字进行语义分割,得到不同频度的词汇,然后以正比于词频的字体大小无规则的集中显示高频词,简洁直观高效。如果仅仅是偶然一用,使用在线的词云生成工具即可。网上搜索词云在线生成工具,会得到很多结果,包括国内外的网站平台都有。对比了搜索较为靠前的几款在线工具,但或多或少都存在一些使用上瑕疵,有的是网页加载慢,有的是要注册后方可使用,有的是字体支持较差,还有的是要付费使用。尤其是各类注册,更是让人担心个人信息安全的问题。所以,坐而论道,不如起而行之,自己制作词云。主要工具有以下:

•wordcloud

•PyEcharts

•stylecloud

以下代码演示了词云生成。

import os

import jieba
import numpy as np
from PIL import Image
from wordcloud import WordCloud

# 写入用户定义的词,主要是人名/地名等专用的词
userdict_list = ['洛迦诺','莱茵兰','苏台德','特申','卢西尼亚']

def jieba_processing_txt(text,stopwordsfilename):
    """
    使用jieba进行更好的分词

    Args:
        text (string): 要处理的文本

    Returns:
        string: 分好的词
    """
    for word in userdict_list:
        jieba.add_word(word)

    mywordlist = []
    seg_list = jieba.cut(text, cut_all=False)
    liststr = "/ ".join(seg_list)

    with open(stopwords_path, encoding='utf-8') as f_stop:
        f_stop_text = f_stop.read()
        f_stop_seg_list = f_stop_text.splitlines()

    for myword in liststr.split('/'):
        if not (myword.strip() in f_stop_seg_list) and len(myword.strip()) > 1:
            mywordlist.append(myword)
    return ' '.join(mywordlist)


def create_wordcloud(inputfilelist=None,backimg=None,fontname=None,stopwordsfilename=None):
    """
    生成词云

    Args:
        inputfile (string, optional): 要处理的文档
        backimg (string, optional): 背景图
        fontname (string, optional): 字体文件
        stopwordsfilename (string, optional): 停词表
        outputfilename (string, optional): 要输出的词云图片
    """
    for index,inputfile in enumerate(inputfilelist):
        text = open(inputfile,encoding='utf-8').read()
        keywords = jieba_processing_txt(text,stopwordsfilename)
        
        shape_mask = np.array(Image.open(backimg))
        wc = WordCloud(background_color="white",
                    max_words=2000,
                    font_path=fontname,  # 设置字体格式,如不设置显示不了中文
                    mask=shape_mask
                    )

        wc.generate(keywords)
        wc.to_file(f'd:\\test\\wordcloud-{index}.png')

startdir = r'd:\test'

back_image = f'{startdir}\\black.jpg'
textfilename1 = f'{startdir}\\alice.txt'
textfilename2 = f'{startdir}\\历史的抉择.txt'
cn_font = f'{startdir}\\SourceHanSerifK-Light.otf'
stopwords_path = f'{startdir}\\stopwords_cn_en.txt'

inputlist = [textfilename1,textfilename2]
create_wordcloud(inputlist,back_image,cn_font,stopwords_path)

词云的效果如下图所示。

 

其中:

•black.jpg提供背景,随意替换

•alice.txt是英文小说,随意替换

•历史的抉择.txt是一个中文的政论文,随意替换

•SourceHanSerifK-Light.otf是一个中文字体文件,可以随意替换为自己喜欢的字体文件

•stopwords_cn_en.txt是一个包含了中英文的停词表,用于分词,在网上可以查到​​​​

标签:string,五十一,Python,image,词云,import,new,工具箱,txt
From: https://www.cnblogs.com/shanxihualu/p/18104225

相关文章

  • Visual Studio Code & Python教程1简介
    1简介VisualStudioCode是一款开源代码编辑器,可免费使用,完全支持Python编程语言的开发。它具有一些有用的功能,例如与世界各地的其他程序员进行实时协作。本章旨在介绍VSCode,帮助您了解其开发过程及其不同组件。我们将讨论为什么它可能是最受欢迎的代码编辑器,了解它的功能,并讨......
  • python根据达芬奇场景分析保存的edl文件,智能裁切输出4K视频画面(不带声音)-自动找到MP
    使用前先将mp4对应的EDL文件命名为相同的名字,如:春天.mp4,春天.edl只处理持续时间大于5帧的画面importcv2importosimporttimeimportdatetimeimportshutilfrommoviepy.editorimportVideoFileClip#读取切分文件defreadQiFenWenJian(filename):withopen(......
  • 【python】深入探讨flask是如何预防CSRF攻击的
    ✨✨欢迎大家来到景天科技苑✨✨......
  • python项目练习——8.图像处理应用程序
    项目功能分析:这个项目可以让用户上传图片,并对图片进行基本的处理,比如调整大小、应用滤镜、添加水印等。这个项目涉及到图像处理、文件上传、用户界面设计等方面的技术。代码示例:fromflaskimportFlask,render_template,requestfromPILimportImage#初始化Flask......
  • python 列表、元组、字典、集合的区别
    目录列表(List)元组(Tuple)字典(Dictionary)集合(Set)列表(List)有序:列表中的元素是有序的,可以通过索引访问。可变:你可以修改列表,比如添加、删除或改变元素。可重复:列表可以包含重复的元素。语法:使用方括号 [] 定义,元素用逗号分隔。应用场景:当你有一个元素......
  • 肖sir__ python自动化之selenium9.1
    python+seleniumselenium是一个第三方库,python有很多库;1、什么是ui自动化?通过模拟手工操作用户ui页面的方式,用代码去实现自动化操作和验证的行为。2、ui自动化的有点?(1)解决重复性的功能测试和验证(2)减少测试人员在回归测试时用例漏测和验证点的漏测(3)减少冒烟测试,回归测试的......
  • Python学习的十个阶段:学完即可神功大成,看看你在哪个阶段
    今天给大家整理了Python学习的十个阶段内容,看看你现在正处于哪个阶段,想学习的朋友也可以根据这个阶段规划学习。阶段一:Python基础【初入江湖】Linux基础目标:1、熟练使用Linux系统进行开发活动2、掌握Linux下编辑器的使用内容:Python开发环境搭建和学习方法介绍认识......
  • Python装饰器实战:实现优雅的重试机制
    重试机制在编程中是比较常见的场景,主要被用于处理那些可能由于临时性故障或网络波动等原因而失败的操作。本文介绍如何通过Python装饰器来实现重试机制,从而能够在尽量少修改现有代码的基础上,给其中某些函数加上重试机制。1.概要关于Python的装饰器,只是一个语法糖,原理也比较简......
  • python获取视频时长并移动到对应时长的文件夹下
    importosimportshutilfrommoviepy.editorimportVideoFileClip#获取所有文件defgetAllFiles(fire_dir):filepath_list=[]forroot,folder_names,file_namesinos.walk(fire_dir):forfile_nameinfile_names:file_path=root+os......
  • 2023年全国青少年信息素养大赛 第9届Python编程挑战赛北京赛区(小学组)复赛试题解析
    2023年全国青少年信息素养大赛第9届Python编程挑战赛北京赛区(小学组)复赛试题解析T1.求余数题目描述:输入一个正整数,输出这个整数除以5的余数。输入描述:输入一行一个正整数输出描述:输出这个整数除以5的余数样例1:输入:12输出:2#示例代码n=int(input())print(n%5)......