Hûn çawa dikarin bi karanîna Google Vision API-ê bigihîjin nivîsa ku ji wêneyek hatî derxistin?

by Akademiya EITCA / Çarşem, 27 Kanûn 2023 / Weşandin Îstîxbaratê ya sûnî, EITC/AI/GVAPI Google Vision API, Di daneyên dîtbarî de famkirina nivîsê, Tespîtkirin û derxistina nivîsarê ji destnivîsê, Nirxandina îmtîhanê

Ji bo ku hûn bi karanîna API-ya Google Vision-ê bigihîjin nivîsa ku ji wêneyek hatî derxistin, hûn dikarin rêzek gavan bişopînin ku tê de karanîna kapasîteyên Naskirina Karaktera Optîkî (OCR) ya API-yê vedihewîne. Teknolojiya OCR ya di Google Vision API-ê de vedîtin û derxistina nivîsê ji wêneyan, tevî destnivîsê, dike. Ev fonksiyon bi taybetî di serîlêdanên ku hewceyê analîzkirin û têgihîştina agahdariya nivîsê ya ku di daneyên dîtbar de hene bikêr e.

Pêşîn, hûn hewce ne ku hawîrdora pêwîst saz bikin ku bi Google Vision API re bixebitin. Ev tê de çêkirina projeyek di Google Cloud Console de, çalakkirina Vision API-yê, û wergirtina pêbaweriyên pejirandina pêwîst ên wekî mifteyek API an mifteya hesabê karûbarê pêk tîne.

Dema ku hawîrdora we hate saz kirin, hûn dikarin rêbaza `asyncBatchAnnotateFiles` a Vision API-ê bikar bînin da ku OCR-ê li ser pelek wêneyê pêk bînin. Ev rêbaz dihêle hûn navnîşek pelên wêneyê ji bo pêvajoyê derbas bikin û encaman asynchronously bistînin. Wekî din, hûn dikarin rêbaza `asyncBatchAnnotateImages` bikar bînin ku rasterast navnîşek wêneyan bişopînin.

Ji bo derxistina nivîsê ji wêneyekê, hûn hewce ne ku mînakek ji objekta `AnnotateImageRequest` biafirînin û taybetmendiyên xwestinê diyar bikin. Di vê rewşê de, hûn ê taybetmendiya `TEXT_DETECTION` destnîşan bikin ku nîşan bide ku hûn dixwazin nivîsê ji wêneyê derxin. Her weha hûn dikarin pîvanên din ên wekî nîşana ziman diyar bikin da ku rastbûna OCR çêtir bikin.

Dûv re, hûn hewce ne ku pelê wêneyê di nav rêzek kodkirî-base64 de kod bikin û bi karanîna daneya wêneya kodkirî mînakek tişta `Wêne` biafirînin. Divê ev tişta `Wêne` li tişta `AnnotateImageRequest` ya berê hatî çêkirin bê zêdekirin.

Piştî sazkirina daxwazê, hûn dikarin wê bi karanîna rêbaza `batchAnnotateImages` an jî `batchAnnotateFiles` bişînin API-a Vision, li gorî nêzîkatiya xweya bijartî. API dê wêneyê pêvajoyê bike û bersivek ku tê de nivîsa ku hatî derxistin vedigerîne.

Ji bo ku hûn xwe bigihînin nivîsa ku ji bersivê hatî derxistin, hûn dikarin li ser qada `textAnnotations` ya objekta `AnnotateImageResponse` dubare bikin. Ev qad lîsteyek ji tiştên `EntityAnnotation` dihewîne, ku her yek di wêneyê de hêmanek nivîsê ya naskirî temsîl dike. Qada `danasînê` ya her tişta `EntityAnnotation` nivîsa ku hatiye derxistin dihewîne.

Li vir mînakek koda kodê ya li Python-ê ye ku destnîşan dike ka meriv çawa bi karanîna API-ya Google Vision bigihîje nivîsa ku ji wêneyek hatî derxistin:

python
from google.cloud import vision

def extract_text_from_image(image_path):
    client = vision.ImageAnnotatorClient()

    with open(image_path, 'rb') as image_file:
        content = image_file.read()

    image = vision.Image(content=content)

    request = vision.AnnotateImageRequest(
        image=image,
        features=[{'type': vision.Feature.Type.TEXT_DETECTION}]
    )

    response = client.batch_annotate_images(requests=[request])

    for annotation in response.responses[0].text_annotations:
        extracted_text = annotation.description
        print(extracted_text)

# Usage
extract_text_from_image('path_to_image.jpg')

Di vê nimûneyê de, fonksiyona `exttract_text_from_image` riya pelê wêneyê wekî têketinê digire û pirtûkxaneya muwekîlê Google Cloud Vision bikar tîne da ku daxwazek ji Vision API re bişîne. Paşê nivîsa ku hatiye derxistin tê çapkirin.

Ji bo ku hûn bi karanîna API-ya Google Vision-ê bigihîjin nivîsa ku ji wêneyek hatî derxistin, hûn hewce ne ku hawîrdorê saz bikin, bi taybetmendiyên xwestinê nesneyek `AnnotateImageRequest` biafirînin, pelê wêneyê şîfre bikin, daxwazê ji API-yê re bişînin, û nivîsa ku jê hatî derxistin bistînin. ji bersivê. Kapasîteyên OCR-ê yên Vision API-ê vedîtin û derxistina nivîsê ji wêneyan, tevî destnivîsê, dike.

Pirs û bersivên din ên vê dawiyê di derbarê Tespîtkirin û derxistina nivîsarê ji destnivîsê:

Pirs û bersivên bêtir:

Tagged under: Îstîxbaratê ya sûnî, Google Cloud Vision API, Pêvajoya Wêne, OCR, Naskirina Karaktera Optîkî, Derxistina Nivîsan

Akademiya EITCA

Hûn çawa dikarin bi karanîna Google Vision API-ê bigihîjin nivîsa ku ji wêneyek hatî derxistin?

Pirs û bersivên din ên vê dawiyê di derbarê Tespîtkirin û derxistina nivîsarê ji destnivîsê:

Pirs û bersivên bêtir:

Akademiya EITCA beşek ji çarçoveya Sertîfîkaya IT ya Ewropî ye

Qebûlbûna ji bo Akademiya EITCA 80% Piştgiriya Piştgiriya EITCI DSJC

Akademiya EITCA

GI BELA XWEYN XWEY BYN XWEY BYN XWEY USN XWE DIKIRIN BELA XWE

FORGOT agahdariyên te?

BERSÎVEK TENÊ

Hûn çawa dikarin bi karanîna Google Vision API-ê bigihîjin nivîsa ku ji wêneyek hatî derxistin?

Pirs û bersivên din ên vê dawiyê di derbarê Tespîtkirin û derxistina nivîsarê ji destnivîsê:

Pirs û bersivên bêtir:

Qebûlbûna ji bo Akademiya EITCA 80% Piştgiriya Piştgiriya EITCI DSJC