首页 > 其他分享 >简化文本处理流程,通用文字识别助力提升信息采集效率

简化文本处理流程,通用文字识别助力提升信息采集效率

时间:2024-08-15 10:05:44浏览次数:11  
标签:文字 textRecognition 助力 imageSource 文本处理 let error 简化 识别

随着信息技术的发展、移动设备使用的普及和全球化的商业需求,非结构化数据转换为结构化数据的需求日益增长,数字化成为信息存储和管理的主流趋势。在此背景下,OCR技术应运而生,该技术可以将图像中文本信息转化为计算机等设备可以使用的字符信息,成为现代信息处理的关键技术。

OCR技术丰富了移动设备的文本处理能力,自动化文档处理,减少手动输入,为用户提供了多样化的便捷服务,大幅提升效率,成为App中不可或缺的功能。用户可以通过简单的扫描将文档转换为电子文本,拍照获取及时外语翻译,自动提取证件信息以简化验证流程等。

HarmonyOS SDK 基础视觉服务(Core Vision Kit)提供了通用文字识别能力,该能力支持特定角度范围内的文本倾斜、拍摄角度倾斜、复杂光照条件以及复杂文本背景等场景的文字识别。目前支持中、英等10+语种的识别。

适用场景

适用于票据、卡证、表格、报刊、书籍等的图像文字识别。

支持文档翻拍和街景翻拍的文字检测与识别。

可集成至其他应用,扩展文字检测、识别功能,并基于识别结果提供翻译、搜索服务。

开发步骤

1.在使用通用文字识别时,将实现文字识别的相关的类添加至工程。

import { textRecognition } from '@kit.CoreVisionKit';

2.通过图库获取图片资源,将图片转换为PixelMap

private async selectImage() {
  let uri = await this.openPhoto();
  if (uri === undefined) {
    hilog.error(0x0000, 'OCRDemo', "Failed to get uri.");
    return;
  }
  this.loadImage(uri);
}

private openPhoto(): Promise<string> {
  return new Promise<string>((resolve, reject) => {
    let photoPicker = new picker.PhotoViewPicker();
    photoPicker.select({
      MIMEType: picker.PhotoViewMIMETypes.IMAGE_TYPE,
      maxSelectNumber: 1
    }).then((res: picker.PhotoSelectResult) => {
      resolve(res.photoUris[0]);
    }).catch((err: BusinessError) => {
      hilog.error(0x0000, 'OCRDemo', `Failed to get photo image uri. code:${err.code},message:${err.message}`);
      resolve('');
    })
  })
}

private loadImage(name: string) {
  setTimeout(async () => {
    let imageSource: image.ImageSource | undefined = undefined;
    let fileSource = await fileIo.open(name, fileIo.OpenMode.READ_ONLY);
    imageSource = image.createImageSource(fileSource.fd);
    this.chooseImage = await imageSource.createPixelMap();
  }, 100)
}

3.实例化VisionInfo对象,并传入待检测图片的PixelMap。

VisionInfo为待OCR检测识别的入参项,目前仅支持PixelMap类型的视觉信息。

let visionInfo: textRecognition.VisionInfo = {
  pixelMap: this.chooseImage
};

4.配置通用文本识别的配置项TextRecognitionConfiguration,用于配置是否支持朝向检测。

let textConfiguration: textRecognition.TextRecognitionConfiguration = {
  isDirectionDetectionSupported: false
};

5.调用textRecognition的recognizeText接口,对识别到的结果进行处理。

当调用成功时,返回结果码0;调用失败时,将返回对应错误码。

recognizeText接口提供了三种调用形式,当前以其中一种作为示例,其他方式可参考API文档

textRecognition.recognizeText(visionInfo, textConfiguration, (error: BusinessError, data: textRecognition.TextRecognitionResult) => {
  if (error.code !== 0) {
    hilog.error(0x0000, 'OCRDemo', `Failed to recognize text. Code: ${error.code}, message: ${error.message}`);
    return;
  }
  // 识别成功,获取对应的结果
  let recognitionString = JSON.stringify(data);
  hilog.info(0x0000, 'OCRDemo', `Succeeded in recognizing text:${recognitionString}`);

  // 将结果更新到Text中显示
  this.dataValues = data.value;

  if(this.chooseImage && this.imageSource) {
    this.chooseImage.release();
    this.imageSource.release();
  }
});

了解更多详情>>

访问基础视觉服务联盟官网

获取通用文字识别服务开发指导文档

标签:文字,textRecognition,助力,imageSource,文本处理,let,error,简化,识别
From: https://www.cnblogs.com/HarmonyOSSDK/p/18360322

相关文章

  • 矩阵系统如何助力连锁店效益倍增
    矩阵系统如何助力连锁店效益倍增对于连锁店来说,如何快速扩大品牌影响力并使发布的视频带来更大效益是至关重要的。而我们的矩阵系统可以全面管理和解决这些问题。1、多平台内容同步:连锁店通过矩阵系统实现内容在各大短视频平台的即时同步,确保品牌信息迅速传播至广泛的受......
  • AI狗语翻译器:揭秘跨物种沟通新科技,助力人宠心灵相通
    AI狗语翻译器、谷歌发布语音AI:traini的团队下了大功夫,他们邀请了宠物行为学专家,一起翻译狗狗的各种表情、行为和叫声,建立了一套宠物语义系统。可以确认AI狗语翻译器的开发团队确实下了大功夫,并且他们邀请了宠物行为学专家,一起翻译狗狗的各种表情、行为和叫声,建立了一套宠物......
  • YOLOv8改进系列,YOLOv8替换主干网络为MobileNetV2(轻量化架构+助力涨点)
    原论文摘要MobileNetV2架构在多个任务和基准测试中提高了移动模型的最先进性能,并在不同的模型规模中表现出色。我们还介绍了在一种我们称之为SSDLite的新框架中应用这些移动模型进行目标检测的高效方法。MobileNetV2理论详解可以参考链接:论文地址本文在YOLOv8中的主干......
  • GPS时钟服务器(NTP授时服务器)助力厂站自控系统
    GPS时钟服务器(NTP授时服务器)助力厂站自控系统GPS时钟服务器(NTP授时服务器)助力厂站自控系统京准电子科技官微——ahjzsz厂站自动化系统的正常运行离不开时间的准确计量,而且需要高精度的时间,否则就会因为时间不确定性引发许多......
  • iPhone很多空相簿怎么删除:简化你的照片库
    随着我们使用iPhone拍摄越来越多的照片和视频,管理这些内容的需求也随之增加。创建相簿是组织照片的一种便捷方式,但随着时间的推移,可能会产生许多未使用或空的相簿。这些空相簿不仅占用了照片应用的界面空间,也让照片库显得更加混乱。iPhone很多空相簿怎么删除?本文将指导您如何在......
  • 变“金点子”为“好应用”,合合信息智能文档处理技术助力大学生探索AI创新边界
    谈“糖”色变、追求养生、低卡生活……这些热门词汇频频在社交媒体上掀起讨论热潮。有这样一批年轻人不但捕捉到了这些词汇背后真实的用户需求,并且正在利用AI技术寻找解决之道。近日,“中国大学生服务外包创新创业大赛”(以下简称“服创大赛”)决赛在江南大学圆满落幕。作为服务......
  • 助力人效提升!火山引擎数智平台助推头部新能源车企业务增长
    更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群。 近年来,国内新能源汽车产业保持高速增长,形成了规模化市场。根据中国汽车工业协会的公开数据,去年国内新能源汽车产量达958.7万辆,销量达949.5万辆,同比分别增长35.8%和37.9%。而今年,仅截至5......
  • LLM大模型部署实战指南:Ollama简化流程,OpenLLM灵活部署,LocalAI本地优化,Dify赋能应用开
    LLM大模型部署实战指南:Ollama简化流程,OpenLLM灵活部署,LocalAI本地优化,Dify赋能应用开发1.Ollama部署的本地模型(......
  • TextIn文档树引擎,助力RAG知识库问答检索召回能力提升
    ​TextIn团队的文档解析测评工具MarkdownTester在Github发布后,我们陆续与大家探讨了目前业内对PDF解析工作的评判标准与我们各项测评指标的设计原理,包括段落、表格、公式、阅读顺序等维度。今天,我们将介绍另一项重要指标,也是业内面对的一项普遍性难点:标题识别,以及它如何......
  • 右键菜单简化大师:一键管理,提升你的Windows操作效率
    如果你是一位经常使用电脑的用户,你一定会发现,你的右键菜单越来越臃肿,越来越乱。你可能会看到一些你从来不用,甚至不知道是什么的菜单项,这些菜单项不仅占用了你的屏幕空间,还影响了你的操作效率。有没有一种方法,可以让你自由地管理你的右键菜单,添加,删除,修改,启用,禁用你想要的菜单项......