首页 > 编程语言 >QPython实例01-获取所有短信并生成词云

QPython实例01-获取所有短信并生成词云

时间:2023-01-29 22:13:07浏览次数:73  
标签:QPython 01 filepath html 词云 keywords counts csv

一、QPython安装配置

1.1. QPython介绍

QPython是一个可以在安卓设备运行python的脚本引擎。版本有QPython 3L和QPython 3C,3L为官方版本,可以在应用市场搜索下载。3C版本为"乘着船"大佬的修改版本。由于3L版本有许多权限限制及很多包不能安装,文章中使用3C版本完成。

1.2. 下载地址

百度搜索"QPython 3C开源版",进入gitee,找到链接即可下载,如下图:
Screenshot_2023-01-29-14-53-48-450_mark

百度网盘下载:https://pan.baidu.com/s/1zT1NGtYTe55m6bSRWlePRg
提取码:zxcv

帮助文档:https://www.bilibili.com/read/cv13322251

二、获取短信内容并生成词云

  • 获取短信内容
    获取短信将使用SL4A 的api,关于SL4A的介绍及文档,打开第一点gitee中相关链接,如下图:
    Screenshot_2023-01-29-19-35-29-899_mark
    话不多说,直接上代码:

  • 获取所有短信并存入csv

import androidhelper
import csv

droid=androidhelper.Android()
# 获取短信具体内容并存入csv
def saveSMSToFile(save_path):
    # 获取所有收取的短信。False为获取所有短信,True为获取未读短信;inbox为收件箱,outbox为发件箱
    sms_data=droid.smsGetMessages(False, 'inbox').result
    '''
    id:每条短信的原始id
    address:对方手机号
    date:短信息的时间戳
    body:短信具体内容
    read:已读未读,1为已读,0是未读。
    status不知道是啥
    type,发信息还是收信息,1为收,2为发
    '''
    headers=['_id', 'address', 'date', 'body', 'read', 'status', 'type']
    
    with open(save_path,'w') as f:

        f_scv = csv.DictWriter(f, headers)

        f_scv.writeheader()

        f_scv.writerows(sms_data)

    return save_path
  • 利用jieba分词及pyecharts生成词云

# 停用词,生成词云会过滤,根据实际情况修改
FILTER_WORDS = ['你', '我','他','我们', '他们', ',','验证码',':', '的','账号', 'cn', 'https', '0.00', '点击', '退订', '尊敬','客户', 'TD', '登录','http', '12582', '61.56', '0.42','u.10010', 'http', 'com']


#获取关键词数量,用于词云展示时的数量,num可以修改,词云展示生成时的数量 
def getKeyWordsCounts(filepath, num=30):  
    with open(filepath,'r') as f:  
        f_csv=csv.reader(f)  
        headers=next(f_csv)  
        content=",".join([row[3] for row in f_csv])  
        #print(content)  
        seg_list=list(jieba.cut(content))  
        # print(seg_list)  
         
    keywords_counts = pd.Series(seg_list)  
    keywords_counts = keywords_counts[keywords_counts.str.len()>1]  
    keywords_counts = keywords_counts[~keywords_counts.str.contains('|'.join(FILTER_WORDS))]  
    keywords_counts = keywords_counts.value_counts()[:num]  
    return keywords_counts


# 构建生成词云的元组  
def getWords(keywords_counts):  
    words=[]  
    for i, v in keywords_counts.items():  
        words.append((i,v))  
    return words


# 渲染html  
def render_html(html_filepath,words):  
    c = (  
        WordCloud()  
        .add(  
            "",  
            words,  
            word_size_range=[20, 100],  
            textstyle_opts=opts.TextStyleOpts(font_family="cursive"),  
        )  
        .set_global_opts(title_opts=opts.TitleOpts(title=os.path.splitext(html_filepath)[0]))  
        .render(html_filepath)  
)


# 生成词云  
def genWordCloud(csv_filepath,html_filepath, num=30): csv_filepath=saveSMSToFile(csv_filepath)  
    keywords_counts=getKeyWordsCounts(csv_filepath, num=30)  
    words=getWords(keywords_counts)  
    render_html(html_filepath, words)

  • 传入文件地址及html地址
csv_filepath='/storage/emulated/0/0/sms.csv'  
html_filepath='/storage/emulated/0/0/短信词云分析.html'  
genWordCloud(csv_filepath, html_filepath)  
  
# 使用qpython自带的浏览器访问  
jsla('viewHtml', html_filepath)

最终实现效果如下图:
Screenshot_2023-01-29-20-53-24-898_indi

完整版代码,点击底部阅读原文,回复【Qpython词云】

三、总结

文章采用Sl4A和QPython完成了短信词云生成。SL4A提供了丰富的api,如通过QPython结合scikit-learn监测并过滤删除垃圾短信等,这些都由大家自己去探索。

阅读原文

本文由公众号【产品经理不是经理】同步发布,欢迎关注

标签:QPython,01,filepath,html,词云,keywords,counts,csv
From: https://www.cnblogs.com/bushrose/p/17073949.html

相关文章

  • 题解:【CODE FESTIVAL 2016 Grand Final】90 and 270
    题目链接经典增量构造题。不妨从是否存在构造开始考虑:根据多边形内角和的公式容易得出给定的度数和必须等于\((n-2)\times180^{\circ}\),才有解。换一个角度思考,又因......
  • 01快速安装docker
    1.为什么会有docker问题引入在开发过程中,我们经常会遇到代码环境问题,如代码可以在我的电脑上面运行,但是在别人电脑上就不行,而且随着环境的增加,代码环境报错的情况会出现......
  • P1014 [NOIP1999 普及组] Cantor 表
    题目链接:https://www.luogu.com.cn/problem/P1014有理数可枚举In1873Cantorprovedtherationalnumberscountable,i.e.theymaybeplacedinone-onecorrespon......
  • k8s01 - 使用 kubeadm部署Kubernetes 1.26
    目录1准备1.1系统配置1.2配置服务器支持开启ipvs的前提条件1.3部署容器运行时Containerd2.使用kubeadm部署Kubernetes2.1安装kubeadm和kubelet2.2使用kubeadminit初......
  • 1013 Battle Over Cities
    1013BattleOverCities题目描述题意理解题意很简单,给出一张图,问如果去掉其中一个节点以及与这条节点相连的边,需要再添加几条边才能使图重新连通。解题的关键在于找......
  • 图形学101 2
    光栅化 几何 光线追踪 模拟动画 线性代数向量向量AB=B-A向量是有方向有大小的矢量单位向量为大小为1的方向向量,通过向量本身除以它的模长大小点乘A*B=A摸*B......
  • 代码随想录算法训练营第15天 | 二叉树的层序遍历226. 翻转二叉树 101.对称二叉树
    102.二叉树的层序遍历文章:代码随想录(programmercarl.com)视频:讲透二叉树的层序遍历|广度优先搜索|LeetCode:102.二叉树的层序遍历_哔哩哔哩_bilibili思路:层序遍......
  • [AGC011E] Increasing Numbers
    非常神秘。考虑一个上升数一定可以拆分成不超过九个形如\(111...(\texttt{k个1})={10^k-1\over9}\)的数之和,我们考虑用九个数\(\{a_1,a_2,...,a_9\}\)来表示一个上升......
  • 01-nginx基础
    1.基础知识1.1基本配置main#全局配置events{#nginx工作模式配置}http{......
  • 【230130-1】在平面上,一个凸n边形的内角和小于1999,则n的最大值是?
    ......