Over Google Document AI
Waar je gescande PDFs in rijen veranderen.
Google Document AI is de managed document-parsing-service van Google Cloud en zit tussen een documentbestand en een machine-learning-model dat het leest. De output is een Document-object: de volledige tekst uit de OCR-stap, een layout op paginaniveau en een lijst entiteiten met een confidence-score, een mention-tekst, een genormaliseerde waarde en een bounding box op de pagina. Elke processor geeft diezelfde shape terug, en dat is net wat het bruikbaar maakt als warehousetabel in plaats van één custom parser per documenttype.
Het product komt met pre-trained processors voor de documenten die de meeste bedrijven sowieso al verwerken: Enterprise Document OCR om tekst in meer dan tweehonderd talen te digitaliseren, Form Parser voor key-value-paren en tabellen, Layout Parser voor RAG-chunking, en een reeks gespecialiseerde parsers voor facturen, onkostenbonnetjes, bankuittreksels, loonfiches, W2's, energiefacturen, Amerikaanse paspoorten en Amerikaanse rijbewijzen. Wanneer geen daarvan past, kan een team via Document AI Workbench een Custom Extractor of Custom Classifier trainen op zijn eigen gelabelde documenten, en knipt Custom Splitter multi-document-PDFs in de juiste stukken. Documenten worden één voor één verwerkt via het process-endpoint of in bulk via het batch process-endpoint, en voor velden met een lage confidence kan een Human-in-the-Loop-reviewstap ertussen geplaatst worden.