Ji bo ku di çarçoveya taybetmendiya pêşkeftî ya têgihîştina wêneyan a Google Vision API-yê de ji bo tespîtkirina nîşanan de agahdariya nîşangir ji objekta bersivê ya şîrovekirinê derxînin, pêdivî ye ku em qad û rêbazên têkildar ên ku ji hêla API ve hatine peyda kirin bikar bînin. Tişta bersiva annotation avahiyek JSON e ku taybetmendî û nirxên cihêreng ên têkildarî encamên analîza wêneyê vedihewîne.
Pêşîn, pêdivî ye ku em pê ewle bibin ku wêne ji hêla API-ê ve bi serfirazî hatî hilberandin û ku tiştê bersivê agahdariya pêwîst dihewîne. Ev dikare bi kontrolkirina qada "statû" ya tiştê bersivê were kirin. Ger statû "OK" be, ew destnîşan dike ku analîza wêneyê serketî bû û em dikarin bi derxistina agahdariya nîşangir bidomînin.
Agahdariya nîşanê dikare ji qada "landmarkAnnotations" ya objekta bersivê were gihîştin. Ev qad komek şîroveyan e, ku her şîroveyek di wêneyê de nîşanek diyarkirî nîşan dide. Her annotasyonek nîşanek gelek taybetmendî dihewîne, di nav de cîh, ravekirin û xal.
Taybetmendiya "cih" koordînatên qutiya sînorî ya nîşana kifşkirî peyda dike. Van hevrêzan pozîsyon û mezinahiya nîşana di hundurê wêneyê de diyar dikin. Bi analîzkirina van koordînatan, em dikarin cîhê rastîn ê nîşanê diyar bikin.
Taybetmendiya "danasînê" ravekirinek tekstî ya nîşangehê peyda dike. Ev ravekirin dikare were bikar anîn da ku nîşanê nas bike û çarçoveyek din ji bikarhêner re peyda bike. Mînakî, heke API di wêneyekê de Birca Eiffelê bibîne, dibe ku taybetmendiya danasînê nivîsa "Birca Eiffelê" hebe.
Taybetmendiya "score" pîvana pêbaweriya API-ê di tesbîtkirina nîgarê de destnîşan dike. Ev pûan nirxek di navbera 0 û 1-ê de ye, ku xalek bilind astek pêbaweriyek bilindtir destnîşan dike. Bi analîzkirina vê puanê, em dikarin pêbaweriya nîşana diyarkirî binirxînin.
Ji bo derxistina agahdariya nîşanê ji objeya bersivê ya şîrovekirinê, em dikarin di nav rêza "landmarkAnnotations" de dubare bikin û ji bo her şîrovekirinê xwe bigihînin taybetmendiyên têkildar. Dûv re em dikarin vê agahiyê wekî ku ji bo analîz an pêşandana bêtir hewce bike hilînin an pêvajo bikin.
Li vir mînakek kodek kodê ya li Python-ê ye ku destnîşan dike ka meriv çawa bi karanîna pirtûkxaneya muwekîlê Google Cloud Vision API-ê agahdariya nîşanî ji objekta bersiva annotation derdixe:
python from google.cloud import vision def extract_landmark_info(response): if response.status == 'OK': for annotation in response.landmark_annotations: location = annotation.location description = annotation.description score = annotation.score # Process the landmark information as needed print(f"Landmark: {description}") print(f"Location: {location}") print(f"Score: {score}n") else: print('Image analysis failed.') # Assuming you have already authenticated and created a client client = vision.ImageAnnotatorClient() # Assuming you have an image file 'image.jpg' to analyze with open('image.jpg', 'rb') as image_file: content = image_file.read() image = vision.Image(content=content) response = client.landmark_detection(image=image) extract_landmark_info(response)
Di vê nimûneyê de, fonksiyona `extract_landmark_info` objeya bersiva annotationê wekî têketinê digire û di nav rêza `landmark_annotations` de dubare dike. Dûv re ew ji bo her annotasyonek, di nav de ravekirin, cîh, û xalê de agahdariya nîşanî derdixe û çap dike.
Bi şopandina vê nêzîkatiyê, em dikarin bi bandor agahdariya nîşanê ji objekta bersiva annotasyonê ya ku ji hêla taybetmendiya têgihîştina wêneyên pêşkeftî ya Google Vision API ve hatî peyda kirin ji bo tespîtkirina nîşanan derxînin.
Pirs û bersivên din ên vê dawiyê di derbarê Fêmkirina wêneyên pêşkeftî:
- Di Google Vision API-ê de hin kategoriyên pêşwext ji bo naskirina tiştan çi ne?
- Nêzîkatiya pêşniyarkirî ya ji bo karanîna taybetmendiya tespîtkirina lêgerîna ewledar bi hev re digel teknîkên din ên nermalav çi ye?
- Em çawa dikarin bigihîjin nirxên îhtîmalê yên ji bo her kategoriyê di annotasyona lêgerîna ewledar de?
- Em çawa dikarin bi karanîna Google Vision API-ya di Python de annotasyona lêgerîna ewle bistînin?
- Pênc kategorî di taybetmendiya tespîtkirina lêgerîna ewledar de çi ne?
- Taybetmendiya lêgerîna ewledar a Google Vision API çawa naveroka eşkere di nav wêneyan de destnîşan dike?
- Em çawa dikarin bi dîtbarî tiştên ku di wêneyekê de hatine kifş kirin bi karanîna pirtûkxaneya balîfê nas bikin û ronî bikin?
- Em çawa dikarin bi karanîna çarçoweya daneya pandas agahdariya tiştê hatî derxistin bi rengek tabloyek organîze bikin?
- Em çawa dikarin hemî annotasyonên tiştan ji bersiva API-ê derxînin?
- Kîjan pirtûkxane û zimanê bernamekirinê têne bikar anîn da ku fonksiyona Google Vision API nîşan bidin?
Di têgihîştina wêneyên pêşkeftî de bêtir pirs û bersivan bibînin