Kā var piekļūt no attēla izvilktajam tekstam, izmantojot Google Vision API?

by EITCA akadēmija / Trešdiena, 27 decembris 2023 / Publicēta Mākslīgais intelekts, EITC/AI/GVAPI Google Vision API, Izpratne par tekstu vizuālajos datos, Teksta noteikšana un izvilkšana no rokraksta, Eksāmenu apskats

Lai piekļūtu attēla izvilktajam tekstam, izmantojot Google Vision API, varat veikt vairākas darbības, kas ietver API optiskās rakstzīmju atpazīšanas (OCR) iespēju izmantošanu. Google Vision API OCR tehnoloģija ļauj noteikt un izvilkt tekstu no attēliem, tostarp rokrakstu. Šī funkcionalitāte ir īpaši noderīga lietojumprogrammās, kurām nepieciešama vizuālajos datos esošās teksta informācijas analīze un izpratne.

Pirmkārt, jums ir jāiestata nepieciešamā vide darbam ar Google Vision API. Tas ietver projekta izveidi Google Cloud Console, Vision API iespējošanu un nepieciešamo autentifikācijas akreditācijas datu, piemēram, API atslēgas vai pakalpojuma konta atslēgas, iegūšanu.

Kad vide ir iestatīta, varat izmantot Vision API metodi "asyncBatchAnnotateFiles", lai attēla failam veiktu OCR. Šī metode ļauj nosūtīt attēlu failu sarakstu apstrādei un asinhroni saņemt rezultātus. Varat arī izmantot metodi "asyncBatchAnnotateImages", lai tieši apstrādātu attēlu sarakstu.

Lai no attēla izvilktu tekstu, ir jāizveido objekta `AnnotateImageRequest' gadījums un jānorāda vēlamie līdzekļi. Šādā gadījumā ir jāiestata funkcija TEXT_DETECTION, lai norādītu, ka vēlaties izvilkt tekstu no attēla. Varat arī norādīt papildu parametrus, piemēram, valodas padomu, lai uzlabotu OCR precizitāti.

Pēc tam attēla fails ir jāiekodē base64 kodētā virknē un jāizveido objekta "Attēls" gadījums, izmantojot kodētos attēla datus. Šis objekts “Attēls” ir jāpievieno iepriekš izveidotajam objektam “AnnotateImageRequest”.

Pēc pieprasījuma iestatīšanas varat to nosūtīt uz Vision API, izmantojot metodi “batchAnnotateImages” vai “batchAnnotateFiles” atkarībā no izvēlētās pieejas. API apstrādās attēlu un atgriezīs atbildi ar izvilkto tekstu.

Lai piekļūtu no atbildes izvilktajam tekstam, varat atkārtot objekta AnnotateImageResponse lauku textAnnotations. Šajā laukā ir ietverts EntityAnnotation objektu saraksts, un katrs no tiem attēlo attēlā konstatēto teksta elementu. Katra objekta EntityAnnotation laukā "apraksts" ir ietverts izvilktais teksts.

Šeit ir Python koda fragmenta piemērs, kas parāda, kā piekļūt no attēla izvilktajam tekstam, izmantojot Google Vision API:

python
from google.cloud import vision

def extract_text_from_image(image_path):
    client = vision.ImageAnnotatorClient()

    with open(image_path, 'rb') as image_file:
        content = image_file.read()

    image = vision.Image(content=content)

    request = vision.AnnotateImageRequest(
        image=image,
        features=[{'type': vision.Feature.Type.TEXT_DETECTION}]
    )

    response = client.batch_annotate_images(requests=[request])

    for annotation in response.responses[0].text_annotations:
        extracted_text = annotation.description
        print(extracted_text)

# Usage
extract_text_from_image('path_to_image.jpg')

Šajā piemērā funkcija "extract_text_from_image" izmanto ceļu uz attēla failu kā ievadi un izmanto Google Cloud Vision klienta bibliotēku, lai nosūtītu pieprasījumu Vision API. Pēc tam izvilktais teksts tiek izdrukāts.

Lai piekļūtu attēla izvilktajam tekstam, izmantojot Google Vision API, jums ir jāiestata vide, jāizveido objekts AnnotateImageRequest ar vēlamajām funkcijām, jāiekodē attēla fails, jānosūta pieprasījums uz API un jāizgūst izvilktais teksts. no atbildes. Vision API OCR iespējas ļauj noteikt un izvilkt tekstu no attēliem, tostarp rokrakstu.

Citi jaunākie jautājumi un atbildes par Teksta noteikšana un izvilkšana no rokraksta:

Vairāk jautājumu un atbilžu:

Lauks: Mākslīgais intelekts
programma: EITC/AI/GVAPI Google Vision API (dodieties uz sertifikācijas programmu)
Nodarbība: Izpratne par tekstu vizuālajos datos (dodieties uz saistīto nodarbību)
Tēma: Teksta noteikšana un izvilkšana no rokraksta (dodieties uz saistīto tēmu)
Eksāmenu apskats

Tagged saskaņā ar: Mākslīgais intelekts, Google Cloud Vision API, Attēlu apstrāde, OCR, Optical Character Recognition, Teksta izvilkšana

EITCA akadēmija

Kā var piekļūt no attēla izvilktajam tekstam, izmantojot Google Vision API?

Citi jaunākie jautājumi un atbildes par Teksta noteikšana un izvilkšana no rokraksta:

Vairāk jautājumu un atbilžu:

EITCA akadēmija ir daļa no Eiropas IT sertifikācijas sistēmas

Tiesības saņemt EITCA akadēmiju 80% EITCI DSJC subsīdiju atbalsts

EITCA akadēmija

IEVĒLIETIES JŪSU KONTĀ, LAI SAVU LIETOTĀJU VAI E-PASTA ADRESĒ

FORGOT JŪSU ZIŅAS?

IZVEIDOT KONTU

Kā var piekļūt no attēla izvilktajam tekstam, izmantojot Google Vision API?

Citi jaunākie jautājumi un atbildes par Teksta noteikšana un izvilkšana no rokraksta:

Vairāk jautājumu un atbilžu:

Tiesības saņemt EITCA akadēmiju 80% EITCI DSJC subsīdiju atbalsts