Alles, was Sie brauchen, um nutzbare Daten aus Dokumenten zu gewinnen
Suparse ist ein vollständiger Workspace, mit dem Sie Extraktionsmodelle erstellen, Daten gemeinsam prüfen und den Informationsfluss von PDFs in Ihre Systeme automatisieren.
- Daten aus jedem Dokumenttyp mit dem KI-Schema-Generator extrahieren
- Mehr als 99 % Extraktionsgenauigkeit
- Automatische Trennung von PDF-Dateien mit mehreren Dokumenten
- Human-in-the-Loop (HITL)-Oberfläche für jeden Prüfschritt
- Konfigurierbare Validierungsprüfungen - Summen, Pflichtfelder
- Einheitlicher Export nach Excel / Google Sheets / CSV / JSON

Erstellen Sie keine einzelnen Parser mehr. Nutzen Sie eine Plattform.
1. Definieren: flexible Erstellung und Bearbeitung von Extraktionsschemas
Viele IDP-Tools zwingen Sie in starre Vorlagen. Suparse bietet drei Wege, um festzulegen, welche Daten extrahiert werden sollen.
Vortrainierte Modelle
- Keine Einrichtung: Starten Sie sofort mit unserer Bibliothek optimierter Modelle für Rechnungen, Bestellungen, Luftfrachtbriefe, Kontoauszüge und mehr.
- Standardisierte Ausgabe: Sie erhalten sofort normalisierte JSON-Schemas, ohne Felder manuell zuzuordnen.
Hybride Anpassung
- Standardmodelle erweitern: Nehmen Sie ein vortrainiertes Modell, zum Beispiel Rechnung, und ergänzen Sie spezifische Felder wie 'Projektcode' oder 'Kostenstelle'.
- Individuelle Validierung: Ergänzen Sie eigene Geschäftsregeln zusätzlich zu den Standardfeldern der Extraktion.
KI-Schema-Generator
- Jeder Dokumenttyp: Laden Sie ein Beispieldokument für ein eigenes Format hoch. Unsere KI analysiert das visuelle Layout und erstellt ein passendes Extraktionsschema.
- Automatische Beschriftung: Die KI schlägt Feldnamen und Feldtypen automatisch vor und spart so Stunden bei der Einrichtung.
2. Verarbeiten: unterschiedliche Dokumenttypen aus einer einzelnen PDF-Datei
Verschwenden Sie keine Zeit damit, Dokumente vor dem Upload zu trennen. Unsere Intelligent-Document-Processing-Engine erkennt einzelne Dokumente automatisch.
Intelligente Trennung
- Stapel-Uploads: Laden Sie eine einzelne PDF hoch, die 50 unterschiedliche Rechnungen, Belege oder Verträge enthält.
- Automatische Aufteilung: Unsere KI analysiert die inhaltliche Kontinuität und trennt große Dateien automatisch in einzelne Dokumente.
Automatische Klassifizierung
- Intelligente Erkennung: Nach der Trennung erkennt das System genau, worum es sich bei jedem Dokument handelt, zum Beispiel 'Rechnung', 'Kontoauszug' oder 'Vertrag'.
- Dynamische Zuordnung: Das passende Extraktionsschema wird automatisch auf jedes Dokument angewendet.
Manuelle Kontrolle
- Visuelle Prüfung: Sie behalten die Kontrolle. Prüfen Sie vorgeschlagene Trennungen und Klassifizierungen in unserer Drag-and-drop-Oberfläche.
- Einfache Anpassungen: Seiten zusammenführen, Dokumente erneut trennen oder Dokumenttypen mit einem Klick neu zuweisen, wenn die KI korrigiert werden muss.
3. Extrahieren: KI- und OCR-Funktionen
Unsere Engine kombiniert klassische OCR mit Large Language Models (LLMs), um die Komplexität realer Geschäftsdokumente zu verarbeiten.
Strukturen und Tabellen
- Fortschrittliche Tabellenerkennung: Unser Algorithmus rekonstruiert Tabellenstrukturen Zeile für Zeile, auch bei mehrseitigen Tabellen und komplexen Rasterlayouts.
- Key-Value-Zuordnung: Beschriftungen wie 'Fälliger Gesamtbetrag:' werden ihren Werten zuverlässig zugeordnet, auch wenn sich das Layout verschiebt.
Globale Erkennung
- Mehrsprachiger Kern: Native Unterstützung für mehr als 100 Sprachen, einschließlich Chinesisch, Arabisch, Kyrillisch und Japanisch, ohne manuelle Auswahl.
- Handschrift: Digitalisiert handschriftliche Notizen, Freigaben und Unterschriften neben gedrucktem Text mit hoher Präzision.
Eingabeverarbeitung
- Universelle Dateiunterstützung: Verarbeiten Sie PDFs, ob nativ oder gescannt, sowie PNGs und JPEGs aus beliebigen Quellen.
- Bildoptimierung: Das System korrigiert automatisch Schräglagen, entfernt Bildrauschen und verbessert Bilder mit niedriger Qualität vor der Verarbeitung.
4. Prüfen: Human-in-the-Loop-Kontrolle
KI ist leistungsfähig, aber Genauigkeit ist entscheidend. Suparse stellt Werkzeuge bereit, mit denen Ihre Daten korrekt sind, bevor sie die Plattform verlassen.
Verifizierungsoberfläche
- Ansicht nebeneinander: Ihr Team prüft extrahierte Daten in einer intuitiven Oberfläche direkt gegen das Originaldokument.
- Direkte Bearbeitung: Korrigieren Sie Fehler einfach, indem Sie Werte in der Dokumentvorschau anpassen.
Automatisierte Logik
- Konfigurierbare Regeln: Legen Sie Validierungsregeln fest, zum Beispiel 'Gesamtbetrag muss der Summe der Einzelpositionen entsprechen', damit Dokumente mit Rechenfehlern automatisch markiert werden.
- Klare Validierungsrückmeldung: Sie sehen sofort, ob Validierungsprobleme vorliegen, und können Details direkt in der Benutzeroberfläche prüfen.
Zusammenarbeit im Team
- Rollenverwaltung: Laden Sie Kolleginnen und Kollegen in Ihren Workspace ein.
- Audit-Logs: Verfolgen Sie mit vollständiger Änderungshistorie, wer welches Dokument wann geprüft hat.
5. Integrieren: Betrieb und Export
Übertragen Sie validierte Daten dorthin, wo sie benötigt werden - ob nach Excel, Google Sheets oder in eine ERP API.
Einheitlicher Excel- / Google-Sheets-Export
- Konsolidierte Berichte: Wählen Sie 100 unterschiedliche PDFs eines Dokumenttyps aus und exportieren Sie sie für direkte Analysen in eine einzige konsolidierte Excel- oder Google-Sheets-Datei.
- Google-Sheets-Integration: Verbinden Sie Ihr Google Workspace Konto und exportieren Sie extrahierte Daten direkt nach Google Sheets. Ideal für Zusammenarbeit in Echtzeit und automatisierte Workflows.
- Stapelexport separater Dateien: Benötigen Sie jedes Dokument als separate Excel-, CSV- oder Google-Sheets-Datei? Exportieren Sie alle Dateien gemeinsam als ZIP-Archiv.
Developer API
- REST API: Vollständiger programmatischer Zugriff zum Hochladen von Dokumenten, Prüfen des Status und Abrufen von Extraktionsergebnissen in JSON, Excel und CSV.
- Konfiguration beim Upload: Wählen Sie beim Hochladen von Dokumenten für die Extraktion automatische Trennung und Zuordnung oder übergeben Sie Argumente explizit.
Sicherheit und Datenschutz
- Kein Training: Wir verwenden Ihre Kundendaten NICHT, um öffentliche KI-Modelle zu trainieren. Ihre Daten bleiben isoliert.
- Aufbewahrungsrichtlinie: Sie steuern den Datenlebenszyklus. Löschen Sie Dokumente, wenn Sie sie nicht mehr benötigen.
Testen Sie die Suparse Plattform selbst
Laden Sie ein Testdokument hoch und sehen Sie, wie KI in Sekunden ein Schema erstellt.
Kostenlos testen (50 Seiten)Häufige Fragen
Was ist der Unterschied zwischen vortrainierten Modellen, hybrider Anpassung und KI-Schema-Generator?
Unser Ansatz lässt Sie die passende Methode für Ihren Bedarf wählen. Vortrainierte Modelle sind sofort einsatzbereit für gängige Dokumente wie Rechnungen, Belege, Kontoauszüge, Bestellungen und mehr - ohne Konfiguration. Mit hybrider Anpassung erweitern Sie vortrainierte Modelle um eigene Felder, zum Beispiel 'Projektcode' oder 'Kostenstelle', und behalten gleichzeitig die Standardbasis der Extraktion. Der KI-Schema-Generator ist für vollständig individuelle Dokumenttypen gedacht: Sie laden ein Beispiel hoch, und unsere KI analysiert das Layout, um automatisch ein eigenes Extraktionsschema zu erstellen. Alle drei Methoden liefern Daten in derselben hohen Qualität.
Kann Suparse wirklich PDFs mit mehreren unterschiedlichen Dokumenten verarbeiten?
Ja, das ist eine der zentralen Stärken unserer Plattform. Die Funktion Intelligente Trennung analysiert Seitengrenzen und inhaltliche Kontinuität, um PDFs mit mehreren Dokumenten automatisch in einzelne Dokumente aufzuteilen. Laden Sie zum Beispiel eine einzelne PDF mit 50 gemischten Rechnungen und Belegen hoch. Unser System erkennt, wo jedes Dokument endet, trennt die Datei und klassifiziert jedes Dokument automatisch, damit das passende Extraktionsschema angewendet wird. Über die visuelle Verifizierungsoberfläche behalten Sie die volle Kontrolle und können bei Bedarf zusammenführen, trennen oder neu klassifizieren.
Wie funktioniert der Human-in-the-Loop-Prüfworkflow?
Unsere Verifizierungsoberfläche ist auf Effizienz und Genauigkeit ausgelegt. Nach der Extraktion sehen Sie eine Ansicht nebeneinander mit dem Originaldokument auf der einen und den extrahierten Daten auf der anderen Seite. Extraktionsfehler korrigieren Sie direkt in der Oberfläche per direkter Bearbeitung, ohne erneute Verarbeitung. Unsere automatisierten Validierungsregeln markieren mögliche Probleme wie Rechenfehler, zum Beispiel 'Gesamtbetrag muss der Summe der Einzelpositionen entsprechen', oder fehlende Pflichtfelder. Funktionen für Teamarbeit umfassen Rollenverwaltung, Audit-Logs mit Angaben dazu, wer was wann geprüft hat, und Aufgabenzuweisungen für verteilte Prüfworkflows.
Welche Export- und Integrationsoptionen gibt es?
Suparse bietet mehrere Wege, um Daten dorthin zu übertragen, wo sie benötigt werden. Der einheitliche Excel-/CSV-/Google-Sheets-Export konsolidiert mehrere Dokumente in einer einzigen Tabelle: Wählen Sie 100 Rechnungen aus und exportieren Sie sie als eine Datei für direkte Analysen. Mit unserer Google-Sheets-Integration verbinden Sie Ihr Google Workspace Konto und exportieren extrahierte Daten direkt nach Google Sheets, einschließlich Zusammenarbeit in Echtzeit und automatisierter Workflows. Sie können außerdem separate Dateien im Stapel als ZIP-Archiv exportieren. Unsere REST API bietet vollständigen programmatischen Zugriff: Dokumente hochladen, Status prüfen und Extraktionsergebnisse in JSON, Excel, CSV oder Google Sheets abrufen. Die API unterstützt außerdem automatische Trennung, Hinweise zur Schema-Zuordnung und Konfiguration beim Upload.
Welche Sprachen und Dokumenttypen unterstützt Suparse?
Unsere Plattform unterstützt mehr als 100 Sprachen, darunter Chinesisch, Arabisch, Kyrillisch, Japanisch und alle europäischen Sprachen - ohne manuelle Sprachauswahl. Wir unterstützen mehr als 10 Dokumenttypen mit vortrainierten Modellen: Rechnungen, Belege, Kontoauszüge, Bankschecks, Steuerformulare, Energieabrechnungen, Bestellungen, Angebote, Luftfrachtbriefe, Konnossemente, Lieferscheine, Lebensläufe und individuelle Dokumente über den KI-Schema-Generator. Eingabeformate sind PDFs, nativ oder gescannt, sowie PNG-/JPEG-Bilder aus beliebigen Quellen.
Wie geht Suparse mit Sicherheit und Datenschutz um?
Sicherheit ist ein Grundprinzip unserer Plattform. Wir nutzen Ende-zu-Ende-Verschlüsselung für alle Daten bei der Übertragung und im Ruhezustand. Wir trainieren unsere KI-Modelle niemals mit Kundendaten. Sie behalten die volle Kontrolle über den Datenlebenszyklus und können Daten sofort löschen. Für Kunden mit zusätzlichen Anforderungen bieten wir ein DPA (Data Processing Agreement) an.
Kann ich Suparse testen, bevor ich mich für einen kostenpflichtigen Tarif entscheide?
Ja. Sie können mit 50 kostenlosen Seiten starten - ohne Kreditkarte. Damit erhalten Sie vollständigen Zugriff, um alle Funktionen zu testen: vortrainierte Modelle, KI-Schema-Generator, Stapelverarbeitung und einheitlicher Export. Laden Sie Ihre tatsächlichen Dokumente hoch und prüfen Sie, wie die Plattform Ihren konkreten Anwendungsfall verarbeitet. Der kostenlose Einstieg deckt den gesamten Workflow vom Upload bis zum Export ab, damit Sie Genauigkeit und Eignung vor einem Upgrade bewerten können.
Was ist ein Human-in-the-Loop-Workflow und warum ist er wichtig?
Human-in-the-Loop (HITL) bedeutet, dass KI den aufwendigen Teil übernimmt, während Ihr Team 100 % Datenrichtigkeit sicherstellt. Unsere KI extrahiert Daten mit hoher Präzision, aber geschäftskritische Entscheidungen benötigen fehlerfreie Daten. Der HITL-Workflow bietet eine Verifizierungsoberfläche nebeneinander, um extrahierte Daten mit Originaldokumenten abzugleichen, direkte Bearbeitung für sofortige Fehlerkorrekturen, automatisierte Validierung zur Markierung von Abweichungen wie Rechenfehlern oder fehlenden Feldern sowie Audit-Trails für Compliance-Nachweise. Diese Kombination verbindet Automatisierungsgeschwindigkeit mit menschlicher Prüfsicherheit - wichtig für Finanzdokumente, Compliance-Berichte und Entscheidungen mit hohem Risiko.
Kann ich vortrainierte Modelle um eigene Felder für spezifische Geschäftsanforderungen erweitern?
Ja, genau dafür ist hybride Anpassung gedacht. Nehmen Sie ein vortrainiertes Modell, zum Beispiel Rechnung oder Kontoauszug, und ergänzen Sie eigene Felder: Projektcodes, Kostenstellen, Sachkontonummern, Abteilungscodes oder andere Metadaten, die zu Ihrem Workflow gehören. Zusätzlich können Sie individuelle Validierungsregeln auf die Standardextraktion anwenden. So erhalten Sie Geschwindigkeit und Zuverlässigkeit vortrainierter Modelle mit der Flexibilität für Ihre konkreten Anforderungen. Eigene Felder und Regeln werden in Ihrem Schema gespeichert und automatisch auf künftige Extraktionen angewendet.
Wie kann ich Belege in Google Sheets umwandeln?
Mit Suparse verbinden Sie Google Sheets einfach direkt, verarbeiten die benötigten Dokumenttypen und exportieren alle Ergebnisse gesammelt über die Suparse Google Sheets Integration. Laden Sie Ihre Belege hoch, als Einzeldateien oder als Stapel-PDF, lassen Sie unsere KI zentrale Daten wie Händlernamen, Datumsangaben, Beträge und Einzelpositionen extrahieren und exportieren Sie sie direkt in eine Google-Sheets-Tabelle. Die Daten erscheinen sofort in Ihrem Sheet und sind bereit für Spesenverfolgung, Erstattungsprozesse oder die Integration mit anderen Google Workspace Tools. Das ist besonders geeignet für Teams, die Google Sheets für Finanzübersichten und Zusammenarbeit nutzen.
Wie funktioniert die Google-Sheets-Integration?
Unsere Google-Sheets-Integration ist nahtlos und sicher. Sie verbinden Ihr Google Workspace Konto mit wenigen Klicks. Für die sichere Authentifizierung nutzen wir OAuth 2.0, ohne Ihre Zugangsdaten zu speichern. Nach der Verbindung können Sie Extraktionsergebnisse direkt in jede Google-Sheets-Tabelle exportieren, auf die Sie Zugriff haben. Sie können eine neue Tabelle erstellen oder Daten an eine bestehende Tabelle anhängen. Die Integration unterstützt alle Dokumenttypen und erhält Ihre individuellen Feldzuordnungen. Sie können sogar automatische Exporte in bestimmte Tabellen je Dokumenttyp einrichten, um organisierte Datenströme in Echtzeit für Ihr Team bereitzustellen.