CuterCorley CuterCorley
3年前
Python小应用 百度接口实现图片文字识别,并打包成安装包软件
本文给大家分享的主题是用百度的接口实现图片的文字识别。1.环境和配置要求整体是用Python实现,所需要使用的第三方库包括aip、PIL、keyboard、pyinstaller,如未安装,可在CMD中使用pipinstallBaiduAIP/pillow/keyboard/pyinstaller指令安装。百度接口打开https://
Irene181 Irene181
3年前
拒绝反爬虫!教你搞定爬虫验证码
导读:目前,许多网站采取各种各样的措施来反爬虫,其中一个措施便是使用验证码。随着技术的发展,验证码的花样越来越多。验证码最初是几个数字组合的简单的图形验证码,后来加入了英文字母和混淆曲线。有的网站还可能看到中文字符的验证码,这使得识别越发困难。使用验证码可以防止应用或者网站被恶意注册、攻击,对于网站、APP而言,大量的无效注册、重复注册甚至是恶意攻击很令
Wesley13 Wesley13
3年前
1 万 Star !这个 OCR 神器能轻松识别 80 多种语言!
【导语】:EasyOCR是一个用Python编写的OCR库,用于识别图像中的文字并输出为文本,支持80多种语言。简介EasyOCR是python中一个不错的OCR库,在GitHub已有10.3Kstar。目前支持80多种语言,包括中文、日文、韩文和泰文等。!(https://oscimg.oschina.n
Stella981 Stella981
3年前
OCR识别的Android端实现
1.OCR简介OCR(OpticalCharacterRecognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;2.Tesseract简介Tesseract是RaySmith于1985到1995年
Stella981 Stella981
3年前
PaddlePaddle预训练模型大合集,还有官方使用说明书
PaddlePaddle在不断增加官方支持的模型的同时,也在关注预训练模型的丰富度。在过去的版本中,我们已经发布了目标检测FasterRCNN、MobileNetSSD、PyramidBox和场景文字识别CRNNCTC、OCRAttention共计5个预训练模型。近期,在图像分类领域我们一口气发布了四个系列共十个预训练模型,丰富扩充了预训练模
Stella981 Stella981
3年前
Python Xpath 提取html整个元素(标签与内容)
提取html某标签中文字时,文字中含有:“<sub2</subO<sub5</sub”,导致提取的文字不符合预期。解决方法:codingutf8fromlxmlimportetreefromHTMLParserimportHTMLParserhtmlu'''<h
Stella981 Stella981
3年前
IOS使用AVFoundation在视频上添加字幕以及控制字幕时间
IOS在视频上添加字幕效果的基本思路是:1.使用自定义的CATextLayer文字图层或者CAShapeLayer文字图层,添加到视频的Layer上创建用户自定义的字幕效果。这两者的区别是:CATextLayer支持设置简单的文字效果,包括文字的内容、字体、字号大小、对其方式、文字颜色、背景颜色等基本的属性;CAShapeLayer
四儿 四儿
1年前
方言语音数据在方言语音识别中的关键作用
方言语音识别是一项重要的技术,它能够将方言语音转化为文字或指令,从而实现对方言用户的理解和响应。而方言语音数据在方言语音识别中起到了关键作用,为系统的准确性、鲁棒性和自然度提供支持。本文将探讨方言语音数据在方言语音识别中的重要作用。方言特征的捕捉:方言语音
不是海碗 不是海碗
1年前
通用文字识别OCR 之实现自动化办公
随着技术的发展,通用文字识别(OCR)已经成为现代办公环境中不可或缺的工具之一。OCR技术可以将印刷或手写文本转换为可编辑或可搜索的数字文本,极大地提高了办公效率并实现了自动化办公。本文将深入探讨OCR技术在实现自动化办公方面的应用,包括文档处理、数据提取、自动化填表等方面的实例。
绣鸾 绣鸾
1年前
OmniReader Pro for Mac(多格式文件阅读器)
是一款文字识别和阅读软件,它可以将印刷体和手写体的文字转换为数字文本,并将其朗读出来。该软件适用于视力受损、阅读困难、语言障碍等用户,可以帮助他们更加轻松地获取信息和阅读文本。OmniReaderPro具有简洁直观的用户界面,支持多种文件格式的导入和导出,