Ji bo ku hûn bi karanîna API-ya Google Vision-ê bigihîjin nivîsa ku ji wêneyek hatî derxistin, hûn dikarin rêzek gavan bişopînin ku tê de karanîna kapasîteyên Naskirina Karaktera Optîkî (OCR) ya API-yê vedihewîne. Teknolojiya OCR ya di Google Vision API-ê de vedîtin û derxistina nivîsê ji wêneyan, tevî destnivîsê, dike. Ev fonksiyon bi taybetî di serîlêdanên ku hewceyê analîzkirin û têgihîştina agahdariya nivîsê ya ku di daneyên dîtbar de hene bikêr e.
Pêşîn, hûn hewce ne ku hawîrdora pêwîst saz bikin ku bi Google Vision API re bixebitin. Ev tê de çêkirina projeyek di Google Cloud Console de, çalakkirina Vision API-yê, û wergirtina pêbaweriyên pejirandina pêwîst ên wekî mifteyek API an mifteya hesabê karûbarê pêk tîne.
Dema ku hawîrdora we hate saz kirin, hûn dikarin rêbaza `asyncBatchAnnotateFiles` a Vision API-ê bikar bînin da ku OCR-ê li ser pelek wêneyê pêk bînin. Ev rêbaz dihêle hûn navnîşek pelên wêneyê ji bo pêvajoyê derbas bikin û encaman asynchronously bistînin. Wekî din, hûn dikarin rêbaza `asyncBatchAnnotateImages` bikar bînin ku rasterast navnîşek wêneyan bişopînin.
Ji bo derxistina nivîsê ji wêneyekê, hûn hewce ne ku mînakek ji objekta `AnnotateImageRequest` biafirînin û taybetmendiyên xwestinê diyar bikin. Di vê rewşê de, hûn ê taybetmendiya `TEXT_DETECTION` destnîşan bikin ku nîşan bide ku hûn dixwazin nivîsê ji wêneyê derxin. Her weha hûn dikarin pîvanên din ên wekî nîşana ziman diyar bikin da ku rastbûna OCR çêtir bikin.
Dûv re, hûn hewce ne ku pelê wêneyê di nav rêzek kodkirî-base64 de kod bikin û bi karanîna daneya wêneya kodkirî mînakek tişta `Wêne` biafirînin. Divê ev tişta `Wêne` li tişta `AnnotateImageRequest` ya berê hatî çêkirin bê zêdekirin.
Piştî sazkirina daxwazê, hûn dikarin wê bi karanîna rêbaza `batchAnnotateImages` an jî `batchAnnotateFiles` bişînin API-a Vision, li gorî nêzîkatiya xweya bijartî. API dê wêneyê pêvajoyê bike û bersivek ku tê de nivîsa ku hatî derxistin vedigerîne.
Ji bo ku hûn xwe bigihînin nivîsa ku ji bersivê hatî derxistin, hûn dikarin li ser qada `textAnnotations` ya objekta `AnnotateImageResponse` dubare bikin. Ev qad lîsteyek ji tiştên `EntityAnnotation` dihewîne, ku her yek di wêneyê de hêmanek nivîsê ya naskirî temsîl dike. Qada `danasînê` ya her tişta `EntityAnnotation` nivîsa ku hatiye derxistin dihewîne.
Li vir mînakek koda kodê ya li Python-ê ye ku destnîşan dike ka meriv çawa bi karanîna API-ya Google Vision bigihîje nivîsa ku ji wêneyek hatî derxistin:
python from google.cloud import vision def extract_text_from_image(image_path): client = vision.ImageAnnotatorClient() with open(image_path, 'rb') as image_file: content = image_file.read() image = vision.Image(content=content) request = vision.AnnotateImageRequest( image=image, features=[{'type': vision.Feature.Type.TEXT_DETECTION}] ) response = client.batch_annotate_images(requests=[request]) for annotation in response.responses[0].text_annotations: extracted_text = annotation.description print(extracted_text) # Usage extract_text_from_image('path_to_image.jpg')
Di vê nimûneyê de, fonksiyona `exttract_text_from_image` riya pelê wêneyê wekî têketinê digire û pirtûkxaneya muwekîlê Google Cloud Vision bikar tîne da ku daxwazek ji Vision API re bişîne. Paşê nivîsa ku hatiye derxistin tê çapkirin.
Ji bo ku hûn bi karanîna API-ya Google Vision-ê bigihîjin nivîsa ku ji wêneyek hatî derxistin, hûn hewce ne ku hawîrdorê saz bikin, bi taybetmendiyên xwestinê nesneyek `AnnotateImageRequest` biafirînin, pelê wêneyê şîfre bikin, daxwazê ji API-yê re bişînin, û nivîsa ku jê hatî derxistin bistînin. ji bersivê. Kapasîteyên OCR-ê yên Vision API-ê vedîtin û derxistina nivîsê ji wêneyan, tevî destnivîsê, dike.
Pirs û bersivên din ên vê dawiyê di derbarê Tespîtkirin û derxistina nivîsarê ji destnivîsê:
- Dema ku bi karanîna Google Vision API-ê ji belgeyên tevlihev têne derxistin, çi sînor dibe ku derkeve?
- Girîngiya astên pêbaweriyê di şîrovekirina nivîsê ya Google Vision API de çi ye?
- Meriv çawa dikare Google Vision API bi rasthatî nas bike û nivîsê ji notên destan derxe?
- Di vedîtin û derxistina nivîsê de ji wêneyên destnivîsan de dijwarî çi ne?
- Ma Google Vision dikare destnivîsê nas bike?