Lai iegūtu orientieru informāciju no anotācijas atbildes objekta Google Vision API uzlabotās attēlu izpratnes funkcijas kontekstā orientieru noteikšanai, mums ir jāizmanto attiecīgie API nodrošinātie lauki un metodes. Anotācijas atbildes objekts ir JSON struktūra, kurā ir dažādi rekvizīti un vērtības, kas saistītas ar attēla analīzes rezultātiem.
Pirmkārt, mums ir jāpārliecinās, vai API ir veiksmīgi apstrādājis attēlu un vai atbildes objekts satur nepieciešamo informāciju. To var izdarīt, pārbaudot atbildes objekta "statusa" lauku. Ja statuss ir “OK”, tas norāda, ka attēla analīze bija veiksmīga, un mēs varam turpināt orientierinformācijas izvilkšanu.
Orientieru informācijai var piekļūt no atbildes objekta lauka "landmarkAnnotations". Šis lauks ir anotāciju masīvs, kur katra anotācija attēlo attēlā noteikto orientieri. Katrā orientiera anotācijā ir ietverti vairāki rekvizīti, tostarp atrašanās vieta, apraksts un rezultāts.
Rekvizīts "atrašanās vieta" nodrošina atklātā orientiera robežlodziņa koordinātas. Šīs koordinātas norāda orientiera atrašanās vietu un izmēru attēlā. Analizējot šīs koordinātas, mēs varam noteikt precīzu orientiera atrašanās vietu.
Rekvizīts “apraksts” nodrošina orientiera tekstuālu aprakstu. Šo aprakstu var izmantot, lai identificētu orientieri un sniegtu lietotājam papildu kontekstu. Piemēram, ja API attēlā nosaka Eifeļa torni, apraksta rekvizīts var ietvert tekstu "Eifeļa tornis".
Rekvizīts “score” apzīmē API uzticamības rādītāju orientiera noteikšanā. Šis rādītājs ir vērtība no 0 līdz 1, kur augstāks rādītājs norāda uz augstāku ticamības līmeni. Analizējot šo punktu skaitu, mēs varam novērtēt atklātā orientiera uzticamību.
Lai iegūtu orientiera informāciju no anotācijas atbildes objekta, mēs varam atkārtot masīvu "landmarkAnnotations" un piekļūt katras anotācijas attiecīgajiem rekvizītiem. Pēc tam mēs varam uzglabāt vai apstrādāt šo informāciju, ja nepieciešams turpmākai analīzei vai attēlošanai.
Šeit ir Python koda fragmenta piemērs, kas parāda, kā no anotācijas atbildes objekta iegūt orientiera informāciju, izmantojot Google Cloud Vision API klienta bibliotēku.
python from google.cloud import vision def extract_landmark_info(response): if response.status == 'OK': for annotation in response.landmark_annotations: location = annotation.location description = annotation.description score = annotation.score # Process the landmark information as needed print(f"Landmark: {description}") print(f"Location: {location}") print(f"Score: {score}n") else: print('Image analysis failed.') # Assuming you have already authenticated and created a client client = vision.ImageAnnotatorClient() # Assuming you have an image file 'image.jpg' to analyze with open('image.jpg', 'rb') as image_file: content = image_file.read() image = vision.Image(content=content) response = client.landmark_detection(image=image) extract_landmark_info(response)
Šajā piemērā funkcija "extract_landmark_info" izmanto anotācijas atbildes objektu kā ievadi un atkārtojas caur masīvu "landmark_annotations". Pēc tam tas izvelk un izdrukā katras anotācijas orientieru informāciju, tostarp aprakstu, atrašanās vietu un punktu skaitu.
Izmantojot šo pieeju, mēs varam efektīvi iegūt orientieru informāciju no anotācijas atbildes objekta, ko nodrošina Google Vision API uzlabotā attēlu izpratnes funkcija orientieru noteikšanai.
Citi jaunākie jautājumi un atbildes par Uzlabota attēlu izpratne:
- Kādas ir iepriekš noteiktas kategorijas objektu atpazīšanai Google Vision API?
- Kāda ir ieteicamā pieeja drošas meklēšanas noteikšanas funkcijas izmantošanai kopā ar citām regulēšanas metodēm?
- Kā mēs varam piekļūt katras kategorijas iespējamības vērtībām un parādīt tās drošās meklēšanas anotācijā?
- Kā mēs varam iegūt drošas meklēšanas anotāciju, izmantojot Google Vision API programmā Python?
- Kādas ir piecas kategorijas, kas iekļautas drošas meklēšanas noteikšanas funkcijā?
- Kā Google Vision API drošās meklēšanas funkcija attēlos nosaka necenzētu saturu?
- Kā mēs varam vizuāli identificēt un izcelt atklātos objektus attēlā, izmantojot spilvenu bibliotēku?
- Kā mēs varam sakārtot iegūto objektu informāciju tabulas formātā, izmantojot pandas datu rāmi?
- Kā mēs varam iegūt visas objekta anotācijas no API atbildes?
- Kādas bibliotēkas un programmēšanas valoda tiek izmantota, lai demonstrētu Google Vision API funkcionalitāti?
Skatiet vairāk jautājumu un atbilžu sadaļā Izvērstā attēlu izpratne