使用百度AI的文字识别库,做出的调用示例,其中filePath是图片的路径,可以自行传入一张带有文字的图片,进行识别。
下载baidu-aip
这个库,可以直接使用pip下载:pip install baidu-aip
,也可以在PyCharm等开发工具中下载。
# -*- coding: UTF-8 -*-from aip import AipOcr
import json# 定义常量
APP_ID = '9851066'
API_KEY = 'LUGBatgyRGoerR9FZbV4SQYk'
SECRET_KEY = 'fB2MNz1c2UHLTximFlC4laXPg7CVfyjV'# 初始化AipFace对象
aipOcr = AipOcr(APP_ID, API_KEY, SECRET_KEY)# 读取图片
filePath = "WechatIMG1.jpeg"
def get_file_content(filePath):with open(filePath, 'rb') as fp:ad()# 定义参数变量
options = {'detect_direction': 'true','language_type': 'CHN_ENG',
}# 调用通用文字识别接口
result = aipOcr.basicGeneral(get_file_content(filePath), options)
print(json.dumps(result).decode("unicode-escape"))
输出结果:
{"log_id": 1424393327, "direction": 0, "words_result_num": 2, "words_result": [{"words": "不就果钱么!"}, {"words": "所技"}]}
我的这次识别有几个错误,与图片不清晰有关,下面是我识别的图片。
通用文字识别 返回数据参数详情
字段 | 必选 | 类型 | 说明 |
---|---|---|---|
direction | 否 | number | 图像方向,当detect_direction=true时存在。 - -1:未定义, - 0:正向, - 1: 逆时针90度, - 2:逆时针180度, - 3:逆时针270度 |
log_id | 是 | number | 唯一的log id,用于问题定位 |
words_result_num | 是 | number | 识别结果数,表示words_result的元素个数 |
words_result | 是 | array | 定位和识别结果数组 |
+words | 否 | string | 识别结果字符串 |
本文发布于:2024-02-05 00:39:31,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/170720085361355.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |