ABBYY FlexiCapture (oder das System) extrahiert Daten aus Dokumenten, die in Dokumentströmen eingehen. Deshalb messen wir die Leistung anhand der pro Zeiteinheit verarbeiteten Volumina.
Um das System auszulegen, definieren Sie die Zielleistung mithilfe von Leistungskennzahlen.
Die erforderliche Verarbeitungszeit wird durch interne Verfahren, Service-Level-Agreements und die Anforderungen der Geschäftsprozesse eines Kundenunternehmens festgelegt.
Die Verarbeitungsvolumina basieren auf früheren Daten und Trends der Geschäftsentwicklung oder auf dem Geschäftsplan eines Unternehmens. Gelegentliche oder saisonale Volumensprünge können durch erfolgreiche Werbekampagnen oder das Ende des Geschäftsjahres usw. auftreten.
Diese Parameter bestimmen die Systemlast:
Durchschnittliche Batch-Größe in Seiten
Farbmodus von Dokumentbildern: Farbe, Graustufen, Schwarz-Weiß
Seiten pro Tag (d. h. 24 Stunden), Durchschnitt/Spitzenwert
Seiten pro Stunde, Durchschnitt/Spitzenwert
Durchschnittliche Dokumentgröße in Seiten
Anzahl der Scan-Operatoren
Anzahl der Verifizierungsoperatoren
Speicherzeit von Dokumenten
Durchschnittliche Batchgröße
Ein Batch bezeichnet eine Gruppe zusammengehöriger Dokumente, die gemeinsam verarbeitet werden.
Z. B.: Ein Kunde reicht ein Dutzend Dokumente zur Verarbeitung ein – alle in derselben Anfrage, weil Abgleiche und die Geschäftslogik eine getrennte Verarbeitung nicht zulassen.
Farbmodus von Dokumentbildern
Dokumentbilder gibt es in den unterschiedlichsten Formen und Größen, zum Beispiel als:
- gescannte Kopien in Farbe, Graustufen oder Schwarz-Weiß;
- Fotos in unterschiedlichen Auflösungen;
- E-Mail-Anhänge – etwa Vektor-PDF-Dateien usw.
Der Farbmodus von Dokumentbildern hängt von Folgendem ab:
- Der Möglichkeit, Eingabedaten zu steuern und zu verändern.
Beispiel: Wenn FlexiCapture-Clients zum Scannen verwendet werden, kann ein Unternehmen für alle eingehenden Dokumente denselben Scanmodus (Farbmodus) festlegen.
- Anforderungen an die Langzeitspeicherung.
Beispiel: Gemäß Unternehmensrichtlinien dürfen alle Dokumente 5 Jahre lang nur als Graustufenbilder gespeichert werden. In diesem Fall können FlexiCapture-Clients Farbbilder bereits beim Scannen in Graustufenbilder umwandeln.
Obwohl Unternehmen häufig verpflichtet sind, eingehende Dokumente in ihren ursprünglichen Formaten zu speichern, können sie in der Regel abschätzen, welche Formate zu erwarten sind, und einige Beispielbilder bereitstellen. Das kostspieligste Szenario liegt vor, wenn alle Dokumentbilder farbig sind (Kosten für Netzwerkübertragung und Dateispeicherung).
Seiten pro Tag & Seiten pro Stunde
Die durchschnittliche und die Spitzenleistung werden als durchschnittliche bzw. maximale Anzahl an Farb-, Graustufen- oder Schwarz-Weiß-Seiten definiert, die in einem bestimmten Zeitraum verarbeitet werden, den ein Unternehmen als sinnvoll erachtet (1 Stunde, 24 Stunden usw.).
- Geben Sie genaue Zeitintervalle an: „24 Stunden“ ist besser als „1 Tag“, da dies missverstanden werden kann, nämlich als 1 Arbeitstag, also nur 8–12 Stunden.
- Wählen Sie Werte, die für Sie aussagekräftig sind, damit Sie leicht erkennen können, ob das System Ihren Anforderungen und Erwartungen entspricht.
Z. B.: Ein besserer Richtwert für einen Kunden ist die Schätzung „1000 Seiten in 24 Stunden“ und nicht „0,01 Seiten pro Sekunde“.
Wir verwenden Seiten statt Dokumenten, um das Verarbeitungsvolumen zu schätzen, da Dokumente in ihrer Größe stark variieren. Gleichzeitig lässt sich die durchschnittliche Größe von Dokumenten eines Typs in Seiten in der Regel leicht abschätzen. Z. B. kann eine Rechnung 1 Seite oder auch weit über 100 Seiten umfassen, typischerweise hat sie aber im Durchschnitt 3 Seiten.
Schließlich müssen wir Werte in Byte und Bit pro Sekunde ermitteln, die üblicherweise zur Berechnung der Hardwareleistung verwendet werden. Dazu verwenden wir typische Größen einer A4-Seite in verschiedenen Farbmodi:
- A4 Schwarz-Weiß – 100 KB
- A4 Graustufen – 3 MB
- A4 Farbe – 10 MB
Für eine genauere Schätzung ist eine Stichprobe tatsächlicher Dokumente erforderlich.
Wenn typische Größen für eine Seite in verschiedenen Farbmodi sowie die durchschnittliche und maximale Anzahl von Seiten pro Tag oder Stunde vorliegen, können Sie den durchschnittlichen und den maximalen Eingabedurchsatz in Byte pro Sekunde schätzen.
Dies ist tatsächlich die Anzahl der Benutzer, die gleichzeitig auf das System zugreifen, während die Dokumentenverarbeitung läuft. Es gibt 2 Arten von Benutzern:
- Scan-Operatoren scannen, prüfen und bearbeiten Dokumentbilder und übergeben sie dann an den Application Server.
- Verifizierungsoperatoren überprüfen und korrigieren extrahierte Daten, laden Bilder vom Application Server herunter und senden die korrigierten Daten an den Application Server.
Speicherzeit von Dokumenten
Sie hat großen Einfluss auf die Systemkonfiguration und die Hardwarekosten, weil längere Speicherzeiten einen größeren FileStorage erfordern.
Die Speicherzeit von Dokumenten im System ist ein wichtiger Parameter; sie sollte nicht mit der Speicherzeit von Dokumenten innerhalb der Organisation verwechselt werden.
Die durchschnittliche Speicherzeit von Dokumenten im System entspricht häufig der durchschnittlichen Verarbeitungszeit. Wenn mehrere Verarbeitungsstufen mit manuellen Schritten beteiligt sind, kann sie mitunter Wochen betragen.
Es gibt jedoch Fälle, in denen die durchschnittliche Speicherzeit von Dokumenten im System tatsächlich der durchschnittlichen Verarbeitungszeit plus der Zeit für die Speicherung von Bildern und Daten in der Verarbeitungsstufe Processed entspricht. Das liegt daran, dass FlexiCapture ein Dokument nach dem Export in das ERP-System des Unternehmens als verarbeitet betrachtet, auch wenn seine Verarbeitung innerhalb der Organisation noch nicht abgeschlossen ist. Das bedeutet, dass dieses Dokument erneut an eine der anfänglichen Verarbeitungsstufen im System gesendet werden kann.
Aus diesem Grund werden Dokumente mit dem Status Processed (d. h. Dokumentbilder und erfasste Daten) in FlexiCapture gespeichert, bis:
- sie alle Geschäftsprozesse durchlaufen haben; und
- in den Unternehmensarchiven abgelegt sind.
FlexiCapture ist im eigentlichen Sinne kein Archivierungssystem. Eine typische Speicherzeit für ein Dokument im System beträgt 2 Wochen.