提取日期中的日,提取图片中文字
提取日期中的日:
可以使用Python中的datetime模块来进行日期操作。具体步骤为:首先将日期字符串转换为datetime对象,然后使用datetime对象的day属性来获取日。示例代码如下:
“`
import datetime
date_str=”2022-10-12″
date_obj=datetime.datetime.strptime(date_str, ‘%Y-%m-%d’)
day=date_obj.day
print(day) # 输出12
“`
其中,`strptime`函数用于将日期字符串转换为datetime对象,`%Y-%m-%d`指的是日期的格式,即年-月-日。
可以使用Python的tesseract库来进行图片文字识别。具体步骤为:对于给定的图片,首先将其转换为灰度图像,然后进行二值化处理,接着使用tesseract库进行文字识别。示例代码如下:
“`
import cv2
import pytesseract
# 读取图片
img=cv2.imread(‘test.jpg’)
# 将图片转换为灰度图像
gray=cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 对图片进行二值化处理
threshold=127
binary=cv2.threshold(gray, threshold, 255, cv2.THRESH_BINARY)[1]
# 对二值化后的图片进行文字识别
config=(‘
-l eng –oem 1 –psm 3′)
text=pytesseract.image_to_string(binary, config=config)
print(text)
“`
其中,`pytesseract`库是基于Google开源的OCR引擎Tesseract的一个Python封装,`image_to_string`函数用于进行文字识别。在使用时,可以通过调整`threshold`参数来改变二值化的阈值,从而获得更好的识别效果。同时,还可以通过不同的配置参数来调整Tesseract引擎的识别效果。
如若转载,请注明出处:https://www.jukee8.cn/35101.html