Lai izvilktu visas objektu anotācijas no API atbildes mākslīgā intelekta jomā — Google Vision API — uzlabota attēlu izpratne — objektu noteikšana, varat izmantot API nodrošināto atbildes formātu, kurā ir ietverts atklāto objektu saraksts un tiem atbilstošie objekti. robežšķirtnes un pārliecības rādītāji. Parsējot šo atbildi, varat iegūt vajadzīgās objekta anotācijas.
API atbilde parasti sastāv no JSON objekta, kurā ir dažādi lauki, tostarp lauks "localizedObjectAnnotations", kurā ir konstatētie objekti. Katrā objekta anotācijā ir iekļauta tāda informācija kā objekta nosaukums, tā ierobežojošā lodziņa koordinātas un uzticamības rādītājs, kas norāda API uzticamību noteikšanai.
Lai izvilktu objekta anotācijas, varat veikt šādas darbības:
1. Parsējiet API atbildi. Vispirms parsējiet no API saņemto JSON atbildi. To var izdarīt, izmantojot JSON parsēšanas bibliotēku vai iebūvētās funkcijas, ko nodrošina jūsu programmēšanas valoda.
2. Piekļūstiet laukam "localizedObjectAnnotations". Kad atbilde ir parsēta, piekļūstiet laukam "localizedObjectAnnotations", kurā ir konstatētie objekti. Šis lauks parasti ir objektu anotāciju masīvs.
3. Atkārtojiet, izmantojot objekta anotācijas: atkārtojiet katru masīva objekta anotāciju. Katra anotācija attēlo attēlā konstatēto objektu.
4. Attiecīgās informācijas izvilkšana: no katras objekta anotācijas izvelciet attiecīgo informāciju, piemēram, objekta nosaukumu, robežlodziņu koordinātas un uzticamības rādītāju. Šai informācijai var piekļūt kā atsevišķi lauki katrā objekta anotācijā.
5. Saglabājiet vai apstrādājiet iegūto informāciju: atkarībā no jūsu prasībām varat saglabāt iegūto informāciju datu struktūrā vai apstrādāt to tālāk analīzei vai citiem mērķiem. Piemēram, iespējams, vēlēsities saglabāt objektu nosaukumus un to atbilstošās robežlodziņas koordinātas datu bāzē vai izmantot tos turpmākiem attēlu izpratnes uzdevumiem.
Šeit ir vienkāršots piemērs, lai ilustrētu ieguves procesu:
python import json # Assume 'response' contains the API response in JSON format response =
{
"localizedObjectAnnotations": [
{
"mid": "/m/01g317",
"vārds": "kaķis",
"rezultāts": 0.89271355,
"boundingPoly": {
"normalizedVertices": [
{"x": 0.1234, "y": 0.5678},
{"x": 0.5678, "y": 0.1234}
] }
},
{
"mid": "/m/04rky",
"vārds": "suns",
"rezultāts": 0.8132468,
"boundingPoly": {
"normalizedVertices": [
{"x": 0.4321, "y": 0.8765},
{"x": 0.8765, "y": 0.4321}
] }
}
] }
# Parse the API response response_data = json.loads(response) # Access the object annotations annotations = response_data['localizedObjectAnnotations'] # Iterate through the object annotations for annotation in annotations: # Extract relevant information object_name = annotation['name'] bounding_box = annotation['boundingPoly']['normalizedVertices'] confidence = annotation['score'] # Process or store the extracted information print(f"Object: {object_name}, Bounding Box: {bounding_box}, Confidence: {confidence}") # Output: # Object: cat, Bounding Box: [{'x': 0.1234, 'y': 0.5678}, {'x': 0.5678, 'y': 0.1234}], Confidence: 0.89271355 # Object: dog, Bounding Box: [{'x': 0.4321, 'y': 0.8765}, {'x': 0.8765, 'y': 0.4321}], Confidence: 0.8132468
Šajā piemērā mēs pieņemam JSON atbildi, kurā ir divi atklāti objekti: kaķis un suns. Kods parsē atbildi, piekļūst laukam "localizedObjectAnnotations", atkārtojas katra objekta anotācijā un izvelk objekta nosaukumu, ierobežojošās lodziņa koordinātas un uzticamības rādītāju. Visbeidzot, iegūtā informācija tiek izdrukāta, bet jūs varat modificēt kodu, lai tas atbilstu jūsu īpašajām vajadzībām.
Veicot šīs darbības, jūs varat efektīvi iegūt visas objektu anotācijas no API atbildes mākslīgā intelekta jomā — Google Vision API — uzlabota attēlu izpratne — objektu noteikšana.
Citi jaunākie jautājumi un atbildes par Uzlabota attēlu izpratne:
- Kādas ir iepriekš noteiktas kategorijas objektu atpazīšanai Google Vision API?
- Kāda ir ieteicamā pieeja drošas meklēšanas noteikšanas funkcijas izmantošanai kopā ar citām regulēšanas metodēm?
- Kā mēs varam piekļūt katras kategorijas iespējamības vērtībām un parādīt tās drošās meklēšanas anotācijā?
- Kā mēs varam iegūt drošas meklēšanas anotāciju, izmantojot Google Vision API programmā Python?
- Kādas ir piecas kategorijas, kas iekļautas drošas meklēšanas noteikšanas funkcijā?
- Kā Google Vision API drošās meklēšanas funkcija attēlos nosaka necenzētu saturu?
- Kā mēs varam vizuāli identificēt un izcelt atklātos objektus attēlā, izmantojot spilvenu bibliotēku?
- Kā mēs varam sakārtot iegūto objektu informāciju tabulas formātā, izmantojot pandas datu rāmi?
- Kādas bibliotēkas un programmēšanas valoda tiek izmantota, lai demonstrētu Google Vision API funkcionalitāti?
- Kā Google Vision API veic objektu noteikšanu un lokalizāciju attēlos?
Skatiet vairāk jautājumu un atbilžu sadaļā Izvērstā attēlu izpratne