首页 > 其他分享 >开源ocr 识别手机截图定位

开源ocr 识别手机截图定位

时间:2024-03-15 13:44:56浏览次数:21  
标签:截图 sum pos 开源 points centroid import ocr image

# coding: utf-8#
import uiautomator2 as u2
import time
from tqdm import tqdm
from loguru import logger
from cnocr import CnOcr


def calculate_centroid(points):
    if len(points) == 0:
        return None

    num_points = len(points)
    sum_x = sum(point[0] for point in points)
    sum_y = sum(point[1] for point in points)

    centroid_x = sum_x / num_points
    centroid_y = sum_y / num_points
    print(pos_format(centroid_x,centroid_y))
    return (centroid_x, centroid_y)


# Example usage
def pos_format(x,y):
    pos_w = "{:.4f}".format(x/width)
    pos_y = "{:.4f}".format(y/hight)
    return (pos_w,pos_y)


if __name__ == '__main__':
    d = u2.connect("5f83933a")
    image = d.screenshot()
    image.save("home.jpg")
    width = image.width
    hight  = image.height
    img_fp = 'home.jpg'
    ocr = CnOcr()  # 所有参数都使用默认值
    out = ocr.ocr(image)
    for line in out:
        print(f"{calculate_centroid(line['position'])} --- {line['text']} --- {line['score']}")
    print(out)

  

标签:截图,sum,pos,开源,points,centroid,import,ocr,image
From: https://www.cnblogs.com/cuinima/p/18075226

相关文章

  • 一点奇怪的想法——paddleocr复现使用
    三个命令行安装paddleocrcondacreate-npaddle02python=3.8activetepaddle02pipinstallpaddlepaddle-ihttps://mirror.baidu.com/pypi/simplepipinstallpaddleocr-ihttps://mirror.baidu.com/pypi/simple大部分的应该是可以跑的测试代码#第一个简单测试的......
  • 截图软件Snipaste在截图文本无法输入C
    远程桌面使用截图软件Snipaste,在输入文本时C键无效,猜测是优先级问题导致解决方法:打开配置文件在[Snip]下粘贴:do_not_omit_synthesized_c=trueCtrl+S保存,然后退出Snipaste,重新打开即可正常输入参照资料:https://blog.csdn.net/floenrce/article/details/136599......
  • 使用ScottPlot开源库在WinForms中快速实现大型数据集的交互式图表显示
    思维导航前言ScottPlot类库介绍ScottPlot类库支持平台和框架ScottPlot类库源代码新建WinForms项目安装ScottPlot.WinForms包折线图实现柱状图实现饼图实现散点图实现项目演示入口项目源码地址优秀项目和框架精选DotNetGuide技术社区交流群前言在.NET应用开......
  • OCR-free相关论文梳理
    引言通用文档理解,是OCR任务的终极目标。现阶段的OCR各种垂类任务都是通用文档理解任务的子集。这感觉就像我们一下子做不到通用文档理解,退而求其次,先做各种垂类任务。现阶段,Transformer技术的发展,让通用文档理解任务变得不再是那么遥不可及,伴随而来的是出现了很多OCR-free的工作......
  • 真炸裂,发现一款基于springboot超级好用的开源服务器框架
    兄弟们,真不骗你们,这个框架用起来是真的爽,简直是服务器开发人员的福音!集成该项目后,不用我们程序员再去处理api安全、加签、验签、参数校验、加解密、数据脱敏、异常处理、国际化、接口文档、错误码、缓存、分布式锁、应用、渠道管理等等功能。而且为了帮助客户端开发的同学更简......
  • Langchain-Chatchat开源库使用的随笔记(一)
    转自:https://zhuanlan.zhihu.com/p/6760612691Chatchat项目结构整个结构是server 启动API,然后项目内自行调用API。API详情可见:http://xxx:7861/docs ,整个代码架构还是蛮适合深入学习 在这里插入图片描述 2Chatchat一些代码学习2.112个分块函数统一使用截止2023......
  • PaddleOCR手写文字识别模型训练(摘抄所得,非原创)
    1.安装环境#首先git官方的PaddleOCR项目,安装需要的依赖gitclonehttps://github.com/PaddlePaddle/PaddleOCR.gitcdPaddleOCRpipinstall-rrequirements.txt2.数据准备本项目使用公开的手写文本识别数据集,包含ChineseOCR,中科院自动化研究所-手写中文数据集CASIA-......
  • OpenCV4.9.0开源计算机视觉库安装概述
    上一篇:OpenCV环境变量参考下一篇:​​​​​​​OpenCV4.9.0配置选项参考引言:OpenCV是一款开源的计算机视觉库,可用于实时的图像处理、图形识别、机器学习等领域。它具有跨平台、高速、易用等特点,并广泛应用于各种领域,如医学、安防、自动驾驶、AR/VR等。本文将简要介绍如何基......
  • ThingsBoard 开源物联网平台
    文章目录1.ThingsBoard介绍2.ThingsBoard架构2.1.单体架构2.2.微服务架构3.物联网网关4.边缘计算ThingsBoard#ThingsBoardhttps://iothub.org.cn/docs/iot/https://iothub.org.cn/docs/iot/thingsboard-ce/1.ThingsBoard介绍ThingsBoard是一个开源物联......
  • 一个开源的分布式在线教育系统
    大家好,我是Java陈序员。今天给大家介绍一个开源的分布式在线教育系统,支持课程在线播放、课程购买等功能。关注微信公众号:【Java陈序员】,获取开源项目分享、AI副业分享、超200本经典计算机电子书籍等。项目介绍roncoo-education——一个分布式在线教育系统。目前主要功能......