Мало знаний, большой вызов! Эта статья участвует в "Необходимые знания для программистов«Творческая деятельность.
Сегодня я познакомлю вас с интересной вещью, распознаванием текста OCR. Я не знаю, хотите ли вы узнать картинку, а затем прочитать текст. Например, проверочный код, если нужно заполнить автоматически, нужна эта функция. Есть много других ситуаций, в которых требуется эта функция.
Мы можем войти в Baidu Cloud и посмотреть документацию по интерфейсу внутри. Функция интерфейса по-прежнему имеет богатые сценарии применения.
# encoding:utf-8
import requests
import base64
'''
通用文字识别
'''
request_url = "https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic"
# 二进制方式打开图片文件
f = open('[本地文件]', 'rb')
img = base64.b64encode(f.read())
params = {"image":img}
access_token = '[调用鉴权接口获取的token]'
request_url = request_url + "?access_token=" + access_token
headers = {'content-type': 'application/x-www-form-urlencoded'}
response = requests.post(request_url, data=params, headers=headers)
if response:
print (response.json())
Все приведенные здесь коды сделаны для вас, и вы можете использовать их напрямую, это есть в официальной документации. Затем мы смотрим на access_token, который необходимо заполнить. Access_token в этом случае требуется для вызова запроса на возврат.
# encoding:utf-8
import requests
# client_id 为官网获取的AK, client_secret 为官网获取的SK
host = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=【官网获取的AK】&client_secret=【官网获取的SK】'
response = requests.get(host)
if response:
print(response.json())
Сначала соберите приложение, а затем проверьте ваш client_id=[AK, полученный с официального сайта]&client_secret=[SK, полученный с официального сайта]. Просто заполните эти две вещи. Тогда response.json() будет содержать необходимый access_token.
Давайте проверим это.
После последнего прогона результаты легко идентифицировать.
Не стесняйтесь обсуждать со мной программу, а также отвечать на вопросы.Обратите внимание на общедоступный номер: Поэтический код, подружиться.