Die Semantische Transformation von Dokumenten | Die Contract Community der SBC Systems GmbH

Die stille Achillesferse moderner Organisationen

In Behörden, Unternehmen und öffentlichen Einrichtungen hängt nahezu jeder relevante Geschäftsprozess an einer einzigen Grundvoraussetzung:
der zuverlässigen, vollständigen und semantisch korrekten Übernahme von Meta‑Daten und Inhalten aus schriftlichen Dokumenten.

Ob digital oder auf Papier – Dokumente sind nach wie vor die Träger der wichtigsten Informationen im operativen Alltag. Doch ihre präzise Erfassung, Interpretation und Überführung in digitale semantische Strukturen ist heute eines der größten arbeitsintensiven Probleme moderner Organisationen.

Während die technische Digitalisierung – also das bloße „Scannen“ oder OCR‑Lesen – weitgehend gelöst ist, liegt das eigentliche Problem eine Ebene tiefer:
Die Bedeutung eines Dokuments muss verstanden werden.
Und das gelingt in der Praxis nur selten.

Das Ergebnis:

⚠️Hohe Kosten durch Datenerfassung

⚠️Verzögerte Prozesse
⚠️ menschliche Fehler
⚠️ fehlende Datenqualität
⚠️ Kostenexplosion durch Nacharbeit
⚠️ falsche Entscheidungen auf Basis unvollständiger Informationen

Die meisten Organisationen wissen, dass dieses Problem existiert, doch sein Ausmaß bleibt oft unsichtbar – bis etwas schiefgeht.

Warum Daten‑Übernahme so kritisch ist

Korrekte und vollständige Daten steuern heute…

wie schnell ein Vorgang bearbeitet werden kann
ob Fristen eingehalten werden
ob ein Prozess korrekt startet
ob ein Fall automatisiert oder manuell abgewickelt wird
ob ein Vertrag, ein Anspruch oder eine Verpflichtung überhaupt erkannt wird

In allen Branchen entscheidet die Qualität der Daten über rechtliche Sicherheit, Effizienz, Compliance und wirtschaftliche Leistungsfähigkeit.

Alltagsbeispiele, die jeder kennt – und die das Problem drastisch zeigen

1. Elektronischer Rechtsverkehr

Durch die Einführung der Elektronischer Rechtsverkehr Verordnung (ERVV) hat der Eingang elektronischer Dokumente bei den Justizbehörden stark zugenommen. In der Regel ist eine umfangreiche manuelle Nachbereitung des elektronischen Posteingangs erforderlich, wodurch die mit der Digitalisierung erhofften Vorteile nahezu verloren gehen. Urteile, Schriftsätze, Beweisdokumente, Anträge – alles muss erfasst, zugeordnet und in Systeme eingepflegt werden.
Ein falsch interpretierter Satz oder ein fehlendes Schlagwort kann dazu führen, dass:

Fristen falsch gesetzt werden
Verfahren liegen bleiben
Rechtsmittel nicht rechtzeitig berücksichtigt werden
Dokumente in der falschen Akte landen

Ein einziges fehlendes Datum kann eine komplette Prozesskette zum Stillstand bringen.

2. Elektronische Ablagesysteme in Unternehmen

Ablageordner voller PDF‑Dokumente sind wertlos, wenn niemand weiß:

Was im Dokument steht
Welche Vertragsdaten gelten
Welche Fristen einzuhalten sind
Welche Risiko‑ oder Compliance‑Klauseln enthalten sind

Fehlt die semantische Erfassung, bleibt die gesamte digitale Ablage ein schwarzes Loch.

3. Belegverwaltung & Belegverarbeitung

Rechnungen, Lieferscheine, Bestellungen:

Zahlen werden verwechselt
Beträge falsch erfasst
Lieferbedingungen ignoriert
Zahlungsziele nicht erkannt

Ein einziger falsch erfasster Betrag kann zu:

Mahnkosten
Skontoverlust
doppelten Zahlungen
Verzögerungen im Monatsabschluss

führen.

4. Lieferscheine und Rechnungen im operativen Alltag

Ein fehlendes Kennzeichen wie „Teillieferung“, „Rückstand“ oder „Mengenabweichung“ führt sofort zu:

falschen Beständen
unnötigen Nachbestellungen
blockierten Waren in der Produktion
Eskalationen mit Lieferanten

Die Ursache ist fast immer dieselbe:
Meta‑Daten wurden nicht erkannt oder falsch erfasst.

5. Vertragsverwaltung & Prozesssteuerung

Moderne Verträge enthalten:

Verpflichtungen
Preise
Indizes
Fristen
Risiken
Leistungsbeschreibungen
Haftungsklauseln

Doch diese Inhalte landen viel zu oft nur als PDF auf einem Fileserver – nicht in strukturierten, maschinenlesbaren Datensätzen.

Die Folgen sind gravierend:

automatische Fristen laufen nicht
Eskalationen greifen nicht
Risikoanalysen sind lückenhaft
Compliance‑Vorgaben werden verletzt
Vertragsstrafen werden ausgelöst
Nachverhandlungen werden zu spät eingeleitet

Verträge sind wertlos, wenn ihr Inhalt im operativen Alltag nicht gefunden, verstanden und genutzt wird.

Das eigentliche Problem: Semantische Interpretation – nicht OCR

Organisationen haben die Digitalisierung der Dokumente längst abgeschlossen.
Was fehlt, ist die Fähigkeit, Inhalte korrekt zu interpretieren:

Was bedeutet der Satz?
Welcher Geschäftsvorfall ist gemeint?
Welche Frist wird ausgelöst?
Welche Risiken stecken darin?
Welche Daten müssen ins System übernommen werden?

Diese semantische Interpretation ist:

manuell
langsam
teuer
fehleranfällig
nicht skalierbar

Und selbst wenn Menschen sorgfältig arbeiten, ist keine 100% Vollständigkeit garantiert.

Der Preis der Unvollständigkeit

Fehlt nur ein einziges wichtiges Detail, entstehen:

kostenintensive Rückfragen
manuelle Nacharbeiten
Rechts- und Compliance‑Risiken
Prozessabbrüche
fehlerhafte Entscheidungen
Verletzung von Service Level Agreements
Verlust von Transparenz und Steuerbarkeit

Ein Unternehmen kann Millionen in IT investieren –
wenn die übernommenen Meta‑Daten schlecht sind, bleibt alles Stückwerk.

Ohne saubere Meta‑Daten gibt es keine echte Digitalisierung.
Ohne semantische Interpretation gibt es keine Automatisierung.

Warum jetzt gehandelt werden muss

Unternehmen stehen heute vor drei Entwicklungen, die das Problem verschärfen:

Die Datenmenge explodiert

Jedes Jahr wächst die Zahl der Dokumente, Mails, Verträge und Reports.

Prozesse werden komplexer

Legal, Compliance, ESG, Datenschutz, Supply‑Chain – überall steigen die Anforderungen.

KI funktioniert nur mit sauberen Daten

Ohne strukturierte, semantisch verstandene Meta‑Daten bleibt KI blind.

Wer heute keine Lösung einführt, kann morgen nicht mehr mithalten.

Warum der Wunsch nach einer Lösung unausweichlich wird

Unternehmen leiden jeden Tag unter ineffizienter, unvollständiger oder fehlerhafter Meta‑Daten‑Erfassung.

Und jeder Verantwortliche spürt zunehmend:

Wir verlieren Zeit.
Wir verlieren Geld.
Wir verlieren Qualität.
Wir verlieren Kontrolle.
Wir verlieren Tempo gegenüber Wettbewerbern.

Die Frage lautet also nicht mehr: „Brauchen wir eine Lösung?“
sondern: „Wie lange können wir ohne Lösung noch bestehen?“

Der Faktor Mensch

Die Schwachstell der Datenerfassung aus Dokumenten ist der Mensch. Ihn muss man entscheidend entlasten durch die Automatisierung des Erfassungsprozesses, ohne jedoch auf seine Kompetenzen zu verzichten.

Die Aufgabe lautet also: Wie wird der Prozess der Datenerfassung

10‑mal schneller?
100 % fehlerfrei?
100 % vollständig?
passgenau für das Zielsystem?

Die Lösung lautet: LSI LEGANTA® Semantic Intelligence.

Wie LSI LEGANTA® Semantic Intelligence die Datentransformation vereinfacht

LSI ist nicht einfach ein Tool.
LSI ist ein semantisches Betriebssystem, das sprachliche Inhalte so versteht, verarbeitet und strukturiert, wie ein erfahrener Experte – nur schneller, präziser und skalierbar.

1. Wie LSI die Datenerfassung 10‑mal schneller macht

Vollautomatische Extraktion von Inhalten

LSI erkennt Strukturen, Fakten, Beziehungen, Fristen, Bedingungen, Beträge, Rollen und Ereignisse in Echtzeit, noch bevor ein Mensch das Dokument zu Ende gelesen hat.

Batch‑Verarbeitung ganzer Dokumentenkorpora

Ordner mit hunderten Mails, Rechnungen oder Verträgen werden nicht mehr manuell geprüft – LSI verarbeitet sie automatisch.

Eliminierung von Such- und Zuordnungsaufwand

Durch die automatische Integration in das Geschäftsmodell wird der menschliche Aufwand für:

das Suchen im Dokument
- das Lesen und Interpreirdtieren
- das Identifizieren relevanter Stellen
- das Übertragen in Systeme

praktisch auf Null reduziert.

Beschleunigte Freigabe- und Prüfprozesse

Durch klare, strukturierte Daten entfällt das „manuelle Prüfen“ – Menschen sehen nur noch Ausnahmen und Abweichungen.

2. Wie LSI die Datenerfassung 100 % fehlerfrei macht

Semantische Interpretation statt Schlagwort‑Suche

LSI versteht Bedeutung, nicht nur Text. „Lieferverzug“, „verspätete Lieferung“ und „nicht fristgerecht geliefert“ werden als dasselbe Ereignis erkannt.

Automatische Validierung & Regelprüfung

Alle extrahierten Daten werden sofort geprüft:

stimmen Datumslogiken?
- sind Beträge plausibel?
- passen Fristen zu Vertragsbedingungen?
- ist die Pflicht/Anspruch‑Beziehung konsistent?

Fehler werden nicht nur gefunden, sondern aktiv verhindert.

Kontextuelle Fehlerkorrektur

LSI erkennt: „5.000,00“ vs. „5.00000“ vs. „500,00“
selbst wenn Tippfehler oder Formatfehler im Dokument stehen.

Keine Müdigkeit, kein Versagen unter Stress

Der menschliche Faktor – Überlastung, Konzentrationsfehler, Zeitdruck – entfällt vollständig.

3. Wie LSI 100 % Vollständigkeit garantiert

Vollständige semantische Abdeckung jedes Dokuments

LSI liest jedes Wort, jede Zahl, jede Klausel, jedes Ereignis, erkennt Muster und ordnet alle Elemente in das Zielsystem ein.

Erkennung relevanter Informationen auch dann, wenn sie versteckt sind

LSI findet:

Fristen ohne explizites Fristwort
- Risiken, die indirekt formuliert sind
- Preisformeln, die über mehrere Absätze verteilt sind
- Abhängigkeiten zwischen Ereignissen und Pflichten

Vollständige Ereignis‑, Rollen‑ und Klauseltransformation

LSI verwandelt unstrukturierte Texte in:

Rollen
- Ereignisse
- Pflichten
- Bedingungen
- Parameter
- Risiken
- Fristen
- Anweisungen

Nichts bleibt im Dokument zurück.

Revisionssichere Dokumentation

LSI speichert:

alle extrahierten Inhalte
- alle Regeln
- alle Herleitungen
- alle Quellenstellen

→ Vollständigkeit ist jederzeit überprüfbar.

4. Wie LSI die Daten passgenau ins Zielsystem überführt

Nahtlose Mappings auf beliebige Zielmodelle

Ob ERP, DMS, CRM, E‑Rechnungsportal oder Vertragsplattform –
LSI schreibt Datenstruktur und Semantik direkt kompatibel ins Zielmodell.

Transformation in Prozess‑, Risiko‑ oder Vertragsdaten

LSI erzeugt exakt die Formate, die Zielsysteme brauchen:

API‑Payloads
- JSON‑Strukturen
- Tabellenformate
- Attributfelder
- Ontologie‑Knoten
- Ereignis‑IDs
- Workflow‑Trigger

Automatische Verlinkung & Rückverfolgbarkeit

Für jedes Datum weiß das Zielsystem:

aus welchem Satz es kommt
- welche Quelle maßgeblich war
- welche Bedingung gilt
- welche Rechte und Pflichten abhängen

Kurz: Das ist perfekte Auditfähigkeit.

🎯 Saubere Daten für KI

KI kann nur so gut arbeiten wie ihre Datengrundlage.
LSI liefert saubere, semantisch eindeutige, maschinenlesbare Daten – die ideale Trainings- und Entscheidungsbasis.

Die Wirkung von LSI in der Zusammenfassung

Kriterium	Vor LSI	Mit LSI
Geschwindigkeit	langsam, manuell, Engpass Mensch	10× schneller, automatisiert
Fehlerquote	hoch, menschlich bedingt	nahezu 0 %, regel- und kontextbasiert
Vollständigkeit	unsicher, subjektiv	100 %, semantisch abgedeckt
Passgenauigkeit fürs Zielsystem	mühsam, transformieren per Hand	automatisch, modellgetreu
Kosten	hoch (Personal, Korrekturen, Verzögerungen)	massive Einsparungen
Risiko	hoch (falsche Metadaten = falsche Entscheidungen)	minimiert
Automatisierung	kaum möglich	vollumfänglich möglich

LSI schafft, was bisher nicht möglich war

Alle zuvor beschriebenen Probleme – manuelle Erfassung, Fehler, Lücken, Prozessabbrüche, Kosten, Ineffizienz – werden durch LSI aufgelöst.
LSI macht aus Dokumenten strukturierte, vollständige, vertrauenswürdige Geschäftsinformationen, die Systeme sofort verstehen und verarbeiten können.

Warum das Zielsystem entscheidend ist

Ein Dokument – besonders ein Vertrag – enthält nicht eine einzige Bedeutung, sondern Dutzende semantischer Perspektiven, abhängig davon, welches System die Informationen später nutzen soll.

Ein und derselbe Satz kann je nach Zielsystem etwas völlig anderes auslösen:

für die Justiz ein prozessrelevantes Ereignis
für Contract Intelligence eine Pflicht–Rechtsfolge–Kette
für SAP eine Buchung, Frist oder Indexänderung

Das bedeutet:
Dokumente müssen unterschiedlich interpretiert werden – abhängig vom Zielsystem.

Und genau hier scheitert jede klassische OCR, jedes regelbasierte System und fast jede Standard‑KI:

Sie verstehen den Geltungsraum einer Information nicht.
Sie wissen nicht, welcher Teil des Dokuments für welches System relevant ist.
Sie können Inhalte nicht in die Zieldatenstruktur transformieren.

Die Folge: Daten kommen falsch, lückenhaft oder unbrauchbar im Zielsystem an.

LSI durchbricht genau diese Grenze.

Wie LSI Dokumente exakt auf das Zielsystem transformiert

LSI trennt strikt zwischen:

Sprache verstehen (Semantik)
Daten erzeugen (Extraktion)
Bedeutung systemgerecht abbilden (Transformation auf das Zielmodell)

Dadurch kann ein einziges Dokument in mehreren vollkommen verschiedenen Strukturen gleichzeitig abgebildet werden.

Beispiel: Ein einziger Miet‑ oder Leasingvertrag

Wir nehmen ein normales Vertragsdokument — ca. 20–40 Seiten — mit:

Vertragsparteien
Miet-/Leasinggegenstand
Laufzeit / Beginn / Ende
Optionen
Indexierung
Kündigungsfristen
Nebenkosten
Rechte & Pflichten
Leistungsstörungen
Haftung
Vertragsstrafen
Übergabedokumentation

Und zeigen jetzt, wie LSI die Inhalte zielgenau in drei Systeme transformiert.

1. Transformation für den elektronischen Rechtsverkehr (ERV)

(gerichtliche Einreichung, Mahnwesen, Beweismittel, Verfahrensdokumentation)

LSI extrahiert und strukturiert alle prozessrelevanten Informationen, z. B.:

Vertragsparteien → Beteiligte i.S.d. ZPO
Fristen → Rechtsmittelfristen, Fälligkeiten, Nachweisfristen
Kündigungsregeln → Fristauslöser, Ereignisabhängigkeiten
Leistungsstörungen → Anspruchsgrundlagen, Beweisrelevanz
Vertragsstrafen → Schadenersatz- / Nebenforderungen

Transformation ins ERV‑Zielsystem:

Textinhalt	ERV-Datenfeld
„Vertrag beginnt am 01.03.2026“	Ereignis: Beginn eines Dauerschuldverhältnisses
„Indexierung gemäß VPI jährlich“	Abrechnungsmodus / wiederkehrende Verpflichtung
„Kündigungsfrist 6 Monate“	Fristtyp: ordentliche Kündigung; Fristdauer: 6 Monate
„Übergabe bis spätestens 01.04.2026“	Erfüllungshandlung → Datum

LSI stellt damit sicher:

alle Informationen für rechtlich korrekte elektronische Vorgänge
eindeutige Zuordnung im ERV‑Portal
vollständige maschinenlesbare Verfahrensdaten
automatische Fristenkontrolle

2. Transformation für LCI LEGANTA® Contract Intelligence

(vollständige Vertragsdigitalisierung, Risiko‑ und Pflichtenanalyse, Prozess‑Trigger)

Für LCI transformiert LSI nicht nur Fakten, sondern:

Geschäftsereignisse
Pflichten & Rechte
Bedingungen
Abhängigkeiten
Rollen
Risiken
Indexmechanismen
Ereignis‑Kaskaden
Vertragsnutzen & Leistungsversprechen

Transformation ins LCI‑Modell:

Textinhalt	LCI-Datenstruktur
„Der Leasingnehmer ist verpflichtet, die Wartung jährlich durchzuführen.“	Pflicht: Wartung durchführen (Zyklus: jährlich)
„Die Miete erhöht sich gemäß Index, wenn …“	Ereignis: Indexschwelle überschritten → Berechnungsparameter
„Bei verspäteter Rückgabe fällt eine Vertragsstrafe an“	Risiko: Verspätete Rückgabe → Kostenformel
„Der Vermieter muss Mängel binnen 14 Tagen beheben“	SLA/Pflicht: Mängelbehebung 14 Tage

LSI ermöglicht damit:

vollautomatische Pflichtenmodelle
vollautomatische Risiko‑Signaturen (LRI)
Prozess‑Trigger für Workflow‑Automatisierung
Nutzung im LEGANTA® Unternehmenskreislauf

Hier entfaltet LSI seine volle Kraft:
Es versteht, wie ein Vertrag das Unternehmen steuert.

3. Transformation für SAP LCM (Lease Contract Management)

(Buchungslogik, Zahlungspläne, ROU‑Asset, IFRS 16, Laufzeiten)

SAP braucht eine völlig andere Sicht:

Zahlungspläne
Anfangsbewertung
Nutzungsrechte
Indexierungen
Restwerte
Vertragsänderungen
implizite und explizite Zinssätze

Transformation ins SAP‑LCM‑Modell:

Vertragsinhalt	SAP LCM Datenpunkt
„Mietbeginn 01.03.2026“	Startdatum der Leasinglaufzeit
„Monatliche Rate 3.500 EUR“	Recurring Payment (Periodizität: monatlich)
„Laufzeit 36 Monate“	Contract Term → 36
„Restwert 10.000 EUR“	Residual Value
„Indexierung jährlich VPI“	CPI‑Indexregel
„Option: Verlängerung um 12 Monate“	Modify Option / Non‑lease component
„Kaution 5.000 EUR“	Initial Direct Cost (je nach Systemkonfiguration)

LSI liefert SAP genau:

alle Zahlen
alle Konditionen
alle Zeitpunkte
alle Indexierungslogiken
alle lease‑relevanten Parameter

— vollständig, fehlerfrei und revisionssicher.

Warum LSI einzigartig ist

Die meisten Systeme können:

OCR
regelbasierte Extraktion
einfaches Text Mining
Schlagworterkennung

Aber kein anderes System kann:

Fähigkeit	LSI beherrscht	Andere Systeme
Text semantisch interpretieren	✅	❌
verschiedene Zielmodelle gleichzeitig bedienen	✅	❌
vollständige Pflichten‑ & Risiko‑Modelle erstellen	✅	❌
juristische, kaufmännische & technische Semantik verbinden	✅	❌
Ereignis‑, Rollen‑ und Parameterlogik extrahieren	✅	❌
Daten passgenau in ERP/DMS/ERM/ERV überführen	✅	❌
Audit‑Trail & Maschineninterpretation gleichzeitig liefern	✅	❌

LSI ist damit der entscheidende Hebel, um die Metadaten‑Krise endgültig zu überwinden.

Fazit

LSI macht aus einem einzigen Dokument drei vollkommen verschiedene, vollständige, fehlerfreie und systemgerechte Datensätze – gleichzeitig.

Damit wird möglich, was bislang unmöglich war:

10× schneller
100 % vollständig
100 % fehlerfrei
perfekt passend zum Zielsystem