Der umfassende Leitfaden zur Suparse Document Extraction API

Q: Wie ist die API versioniert?

Die öffentliche REST-API nutzt URL-Versionierung unter /api/v1/ . Die aktuelle API-Referenz enthält die aktuellen Request- und Response-Schemas.

Michal Raczy

• 11. September 2025• 4 Min. Lesezeit

api

entwickler

datenextraktion

automatisierung

Der umfassende Leitfaden zur Suparse Document Extraction API

Dieser Leitfaden zeigt, was die Suparse Document Extraction API Ihrem Team bietet: einen zuverlässigen Weg, PDFs und Dokumentbilder in strukturierte Daten umzuwandeln, ohne eigene OCR-, Parsing-, Validierungs- und Export-Pipelines aufzubauen. Implementierungsdetails, SDK-Nutzung und Endpunkt-Referenz finden Sie in den Suparse Docs.

Die Suparse REST API für Datenextraktion verstehen

Die Verarbeitung bei Suparse erfolgt asynchron, da Finanzdokumente Zeit zur Klassifizierung, Trennung, Extraktion, Validierung und zum Export benötigen. Die API basiert auf einem sicheren Direct-to-Storage-Upload, sodass große Dateien nicht über Ihre Anwendungsserver geleitet werden müssen.

Kurz gesagt: Ihre Anwendung sendet ein Dokument an Suparse, Suparse klassifiziert und extrahiert den Inhalt, und Ihr Workflow erhält saubere strukturierte Daten für die nachgelagerte Automatisierung. Das Python SDK, das JavaScript SDK, die CLI und die REST API folgen demselben Lebenszyklus. Alle Details zu Upload, Polling und Export sind in den Suparse Docs dokumentiert.

Optimiert für die Automatisierung von Finanzdokumenten

Unsere Finanzdokument-API ist auf Rechnungen, Belege, Kontoauszüge, Bestellungen und benutzerdefinierte Dokumenttypen ausgelegt. Sie ist besonders dann relevant, wenn Teams mehr benötigen als reinen OCR-Text: normalisierte Felder, Einzelpositionen, Transaktionszeilen, Seitenbereiche, Validierungsregeln und Exporte, die direkt in Buchhaltungs- oder operative Workflows eingespeist werden können.

Typische Anwendungsfälle:

Automatische Rechnungserfassung in der Kreditorenbuchhaltung
Beleg- und Spesenautomatisierung
Transaktionsextraktion aus Kontoauszügen
Verarbeitung von Bestellungen und Angeboten
Trennung mehrseitiger PDFs mit mehreren Dokumenten
Benutzerdefiniertes Dokument-Parsing für interne Workflows

Für Teams, die die Ergebnisse vor der Integration testen möchten, bietet Suparse auch Web-Workflows wie den Rechnungs-OCR-Konverter und den Kontoauszug-PDF-zu-Excel-Konverter.

Vorlagen ohne Vendor-Lock-in

Vorlagen definieren, welche Daten extrahiert werden sollen. Sie können Suparse die automatische Erkennung des Dokumenttyps überlassen, eine bestimmte Vorlage für wiederkehrende Workflows verwenden oder die automatische Trennung für mehrseitige PDFs aktivieren, die mehrere Dokumente enthalten.

Das bedeutet: Sie benötigen keinen separaten Endpunkt oder Integrationspfad für jeden Dokumenttyp. Dieselbe Plattform kann heute eine Rechnung, morgen einen Kontoauszug und bei Bedarf ein benutzerdefiniertes Lieferantenformular verarbeiten.

Für einzigartige Layouts erstellen Sie eine benutzerdefinierte Vorlage in der Suparse UI oder erfahren Sie mehr über benutzerdefiniertes Dokument-Parsing.

Unterstützte Upload-MIME-Typen sind application/pdf, image/jpeg, image/png, image/heic und image/heif. Die aktuelle maximale Dateigröße beträgt 20 MB.

Integrationsmöglichkeiten

Suparse unterstützt vier praktische Integrationswege:

Python SDK: Ideal für Backend-Services, Datenpipelines, lokale Stapelverarbeitung, Notebooks und Automatisierungsskripte.
JavaScript und TypeScript SDK: Ideal für Next.js, React, Node.js-Services, Edge-Runtimes und browserbasierte Upload-Workflows.
CLI: Ideal für die Nutzung mit Claude Code, Claude Cowork, Codex und anderen LLM-Lösungen, um reproduzierbare Dokumentenextraktion nach Ihrem gewünschten Schema zu erhalten.
REST API: Ideal, wenn Sie Low-Level-Kontrolle benötigen oder aus einer Sprache ohne offizielles SDK integrieren.

Die SDKs übernehmen Upload, Polling, Ergebnisabruf, Retries, Ratenbegrenzungen und Stapelverarbeitung. Die CLI eignet sich für schnelle Tests, lokale Ordner und operative Skripte. REST bleibt verfügbar, wenn Ihr Team direkte Protokollkontrolle bevorzugt.

Installationsbefehle, Codebeispiele und die API-Referenz finden Sie in den Suparse Docs.

Was Sie zurückerhalten

Die Ausgabe ist strukturiertes JSON, das für nachgelagerte Automatisierung konzipiert ist. Je nach Vorlage und Dokumenttyp kann sie dokumentweite Felder, Tabellen, Einzelpositionen, Transaktionen, Seitenbereiche, Vorlagen-IDs und verbrauchte Credits umfassen.

Wenn Sie Dateien statt JSON benötigen, kann Suparse verarbeitete Daten als JSON, CSV, Excel, QuickBooks CSV oder Google Sheets exportieren. Damit ist derselbe Extraktionsworkflow sowohl für Produktintegrationen als auch für Business-Teams nutzbar, die weiterhin tabellenbasierte Prüfungen benötigen.

Warum Teams Suparse statt einer Eigenentwicklung einsetzen

Dokumentenextraktion wirkt einfach, bis man inkonsistente PDFs, Scans, gedrehte Bilder, Einzelpositionen, mehrseitige Dokumente, Validierungsregeln, Retries, Exporte und Datenschutzanforderungen unterstützen muss. Suparse bündelt all diese Bausteine in einer Plattform, damit Ihr Team sich auf den Workflow rund um die Daten konzentrieren kann.

Das bietet Ihnen:

Einen sicheren Upload- und Verarbeitungslebenszyklus
Automatische Erkennung gängiger Dokumenttypen
Benutzerdefinierte Vorlagen für spezielle Layouts
Mehrdokument-Trennung für gebündelte PDFs
Validierungsorientierte Extraktionsschemas
SDKs, CLI und REST-Zugriff
Cleanup-Optionen für datenschutzkritische Workflows
Tabellenkalkulations- und buchhaltungsfreundliche Exporte

Leistung, Sicherheit und transparente Preisgestaltung

Die Integration einer Drittanbieter-API sollte keine opake Preisgestaltung, fragile Codebeispiele, verwirrende Authentifizierung oder wochenlange Implementierungsarbeit bedeuten. Suparse ist für Teams konzipiert, die zuverlässige Dokumentenautomatisierung benötigen, ohne die operative Last des Betriebs einer eigenen Extraktionsplattform zu übernehmen.

Sie erhalten ein sicheres Upload-Modell, asynchrone Verarbeitung für größere Workloads, seitenbasierte Abrechnung und SDKs für gängige Integrationsumgebungen. Starten Sie mit 50 kostenlosen Seiten, prüfen Sie die Dokumentation und nutzen Sie die Preisstufen, um Kosten zu schätzen, bevor Sie Workflows mit hohem Datenaufkommen skalieren.

Bereit für die Integration? Kostenloser API-Key.

Von der Registrierung zur ersten JSON-Antwort in unter 5 Minuten. 50 kostenlose Seiten, ohne Kreditkarte.

Kostenlosen API-Key sichern und 50 Seiten gratis testen

FAQ für Entwickler: Technische Fragen beantwortet

Welche Ratenbegrenzungen gelten für die API?

Die SDKs enthalten Retry- und Polling-Hilfen für den normalen Produktivbetrieb. Bei hohem Datenaufkommen oder Enterprise-Anforderungen kontaktieren Sie uns, damit wir die Limits auf Ihre Workload zuschneiden können.

Wie funktioniert die Authentifizierung?

Suparse unterstützt API-Key-Authentifizierung für REST-, SDK- und CLI-Integrationen. Bearer-Authentifizierung wird ebenfalls für authentifizierte Anwendungsflüsse unterstützt. Details finden Sie unter /docs/.

Welche Dateiformate werden über die API unterstützt?

Die Extraktions-API akzeptiert PDF, JPEG, PNG, HEIC und HEIF. Die aktuelle Upload-Grenze liegt bei 20 MB pro Datei.

Woran erkenne ich, dass mein Dokument fertig verarbeitet wurde?

Suparse verarbeitet Dokumente asynchron und stellt den Task-Status bis zum Abschluss der Extraktion bereit. Die SDKs übernehmen diesen Lebenszyklus automatisch; die REST-Details sind in /docs/ dokumentiert.

Wie ist die API versioniert?

Die öffentliche REST-API nutzt URL-Versionierung unter /api/v1/. Die aktuelle API-Referenz enthält die aktuellen Request- und Response-Schemas.

Kann ich mehrere Dokumente in einem einzigen API-Aufruf verarbeiten (Stapelverarbeitung)?

Jede Datei hat ihre eigene Upload-URL und ihren eigenen Task. Die Python- und JavaScript-SDKs unterstützen jedoch Stapelverarbeitung und parallele Verarbeitung. Der Export-Endpunkt kann ebenfalls Ergebnisse für mehrere verarbeitete Dokument-IDs zurückgeben.

Wie werden verschiedene Sprachen und Währungen behandelt?

Suparse kann strukturierte Daten aus vielen Dokumentsprachen extrahieren und gängige Finanzfelder über Vorlagen und Validierungsregeln normalisieren.

Michal Raczy

Michal is the founder of Suparse.com. He has over 15 years of experience in delivering projects in data analysis, automation, and document processing. Michal solves complex automation and AI implementation challenges for both SMEs and large corporations, with a particular focus on document processing. Contact at michal@suparse.com.