Die automatisierte Erkennung eines Vertragstyps wird Anwälten und Unternehmen wirtschaftliche, organisatorische und zeitliche Vorteile bringen, indem zu analysierende Verträge in Sekunden richtig gruppiert und entsprechende Rechtsfolgen angezeigt werden. Das automatisierte Vertragstagging ist der erste Schritt bei der Entwicklung einer umfassenden Dokumenten-KI, die durch hohe Sorgfalt bei der Wahl der ersten Datensätze eine disruptive Innovation im Rechtsmarkt darstellen kann.
Vertragstyp und Rechtsfolgen der Vertypisierung
Definition
Es wird zwischen typischen und gemischten Verträgen unterschieden. Typische Verträge sind alle Verträge, die gesetzlich normiert sind. Solche sind neben Dienstverträgen und Werkverträgen auch eine Vielzahl von Gesellschaftsverträgen. Ebenso sind Arbeitsverträge, Mietverträge und Kaufverträge typische Verträge.[1] Gemischte Verträge werden dagegen nochmals in Typenkombinationsverträge, doppeltypische Verträge und Typenverschmelzungsverträge unterschieden.[2]
Einordnungskriterien
Zur Bestimmung eines Vertragstyps wird die Hauptleistung analysiert und durch Subsumtion des Gesetzestexts eine Typisierung vorgenommen.[3] Diese Subsumtion ist mitunter schwierig. Neben Kombinationen verschiedener Hauptleistungen(z.B. Bewirtungsverträge, die neben Dienstleistungselementen auch mietrechtliche Einschläge beinhalten und den Kombinationsverträgen zuzuordnen sind), ist die Abgrenzung zweier Vertragstypen problematisch. Auch können Überschneidungen der Leistungen denkbar sein, sog. Typenverschmelzungsvertrag (z.B. Verträge über Theaterbesuch). Die Einordnung eines Vertrages erfordert juristisches Fingerspitzengefühl und die Kenntnis zahlreicher vergleichbarer Vertragstypen.
Rechtsfolgen
Die Typisierung eines Vertrages hat erhebliche rechtliche Relevanz. Rechte und Pflichten einer Vertragspartei variieren mit der Typisierung eines Vertrags. Diese Rechte- und Pflichten-Varianz hat zur Folge, dass zur wirtschaftlichen und rechtlichen Analyse eines Vertrages der Vertragstyp präzise bestimmt werden muss. Wird ein Vertragstyp falsch bestimmt, wird die falsche Gesetzesmaterie angewandt. Folgen sind unter anderem mögliche Verfristungen, die Missachtung von Gewährleistungsrechten oder auch die nicht fällige Zahlung von Schadensersatz.
Problemlösung durch automatisiertes Vertragstagging
Problemanalyse
Verträge werden nicht nur in Kanzleien für Mandanten analysiert. Auch in Unternehmen erfolgt eine Typisierung, wenn Vertragspartner u.a. als Lieferanten oder Investoren die Verträge stellen. Insbesondere kann eine Due Dilligence Prüfung die vielfältige Analyse und Typisierung von Verträgen zur Folge haben. Dabei erfolgt derzeit die Vertragsanalyse durch einen Anwalt oder einen entsprechend kundigen Mitarbeiter eines Unternehmens, indem jeder Vertrag einzeln analysiert wird. Dazu bedarf es mitunter einer großen Anzahl von Rechtsanwälten.[4] Diese Verfahrensweise ist fehleranfällig, zeit- und kostenintensiv. Gerade komplexere Verträge können nicht durch eine kurze Durchsicht analysiert werden. Vielmehr werden derartige Verträge in erheblichem zeitlichen Umfang gesichtet und teils infolge des Zeitdrucks falsch subsumiert und damit falsch typisiert.
Lösung und Vorteile durch KI
Eine informationstechnische Typisierung kann mangels Gesetzesanwendung durch eine KI nicht auf gesetzlicher Subsumtion basieren. Vielmehr werden zunächst manuell bestimmte Vertragstypen von der KI verglichen. Dadurch lernt die KI, welche Vertragstypen wie ausgestaltet sind und welche Besonderheiten die jeweiligen Vertragstypen unterscheiden.
Beispiel: Bei einem Kaufvertrag hat die KI gelernt, dass der zu übereignende Gegenstand nicht zurückgegeben werden muss, da in keinem bisher analysierten Kaufvertrag der Kaufgegenstand der Vertragspartei zurückzugeben war. Dagegen fällt der KI bei der Analyse eines Mietvertrags auf, dass das Mietobjekt stets zurückzugegeben ist. Auf diese Weise entscheidet sich die KI bei der Analyse eines Vertrags für einen Kaufvertrag, wenn analysiert wurde, dass der Gegenstand nicht zurückgegeben werden muss.
Der Vergleich eines unbekannten Vertragstyps mit den Charakteristiken der bekannten Vertragstypen dauert dabei nur wenige Sekunden und erfolgt je nach getaggten Datensatz mit hoher Qualität und daher ohne Fehleranfälligkeit.[5]
Überblick Textklassifizierung
Die Textklassifizierung ist der Prozess der Klassifizierung von Dokumenten in vordefinierten Kategorien, basierend auf ihrem Inhalt. Es handelt sich um die automatisierte Zuordnung von natürlichsprachigen Texten zu vordefinierten Kategorien. Die Textklassifizierung ist die primäre Anforderung von Text-Retrieval-Systemen, die Texte als Reaktion auf eine Benutzeranfrage abrufen, und Natural Language Processing (NLP) Systemen, die Texte in irgendeiner Weise transformieren, wie z.B. Zusammenfassungen erstellen, Fragen beantworten oder Daten extrahieren.[6]
Konkreter Anwendungsfall auf Vertragstagging
Die Text- bzw. Dokumentenklassifizierung kann für eine Vielzahl von Aufgaben wie Sentimentanalyse, Themenerkennung, Absichtserkennung und vieles mehr eingesetzt werden. In diesem Anwendungsfall wird auf die Dokumentenebene eingegangen, welche die relevanten Kategorien eines vollständigen Dokuments als Output zur Folge hat. Durch die große Anzahl von Vertragsdokumenten in Unternehmen und/oder Kanzleien und die ansteigende Bedeutsamkeit von Big Data, werden Analysetools und automatisierte Workflows stetig wichtiger. Mit den verschiedenen Ausgestaltungen der Vertragsarten wird der Überblick, die Kontrolle und Einhaltung von Pflichten immer schwieriger.[7] Ein automatisiertes „tagging“ mit einer NLP-Klassifizierung löst dieses Problem nicht nur, sondern kann zusätzlich weitere Vorteile schaffen.[8] Mit dieser Dokumentenklassifizierung lassen sich Dokumente zu vordefinierten Vertragstypen z.B. Mietvertrag, Kaufvertrag, Beteiligungsvertrag, GmbH-Satzung, Gbr-Vertrag etc. einordnen.
Herausforderungen
Die Qualität des vordefinierten, getaggten Datensatzes (training-set) ist die wichtigste Komponente eines statistischen NLP-Klassifikators. Der Datensatz muss in jeder Klasse groß genug sein, um eine ausreichende Anzahl von Dokumenten im Vorhinein analysieren zu können. Zudem muss der Datensatz auch qualitativ hochwertig sein, um die Unterschiede zwischen den Dokumenten in den verschiedenen Kategorien klar abgrenzen zu können.[9]
Abschließend bedarf es weiterer informationstechnischer Lösungen wie einem Dokumentenmanagementsystem und einem Analysetool, in denen die KI eingebettet ist. Eine reine KI ohne anschließende Verarbeitung der automatisch gefundenen Daten ist praxisfern. Vielmehr müssen die analysierten Vertragstypen dem Nutzer abgebildet und im besten Fall etwaige Rechtsfolgen angezeigt werden.
Ergänzungen und Ausblick
Die automatische Typisierung von Verträgen ist der erste Schritt auf einem langen Weg von konservativer Anwaltsarbeit hin zur disruptiven Wirkung digitaler Dokumenten-KI. Eine KI muss jedoch schon zu Beginn durch die Qualität der ersten Datensätze gepflegt werden, wodurch bereits dieser erste Schritt entscheidende Auswirkungen auf die Qualität der später eingesetzten KI hat. Eine Dokumentenanalyse-KI kann neben der Vertragsklassifizierung in einem weiteren Schritt auch die rechtliche Prüfung komplexer Verträge vornehmen. Nach der Klassifizierung eines Vertrages können automatisiert rechtliche Auffälligkeiten wie Kündigungsfristen, unwirksame Garantien, Übergabezeitpunkte etc. aufgezeigt und ggf. durch Verbesserungsvorschläge seitens der KI abgeändert werden. Die Einbettung einer solchen KI in ein umfassendes digitales Ökosystem bietet zahlreiche Vorteile. So kann z.B. ein Vertrag nach Typisierung als Mietvertrag direkt fristgemäß zum nächstmöglichen Zeitpunkt gekündigt werden, indem ein der KI nachgeschalteter Generator, der juristische Schriftsätze automatisiert auf Knopfdruck erstellt, ein Kündigungsschreiben anhand der Vertragsdaten verfasst.
[1] Vgl. §§ 611, 535, 433 BGB.
[2] Heuer-James/Chibanguza/Stücker, BB 2018, 2818-2832.
[3] BGH, Urteil vom 22. Dezember 2005 - VII ZR 183/04; BGH, Urteile vom 10. März 1983 - VII ZR 302/82, BGHZ 87, 112, 117 und vom 15. April 2004 - VII ZR 291/03, BauR 2004, 1152, 1153 = ZfBR 2004, 555.
[4] Vgl. insoweit das „LKW-Kartellverfahren“, in dem allein der Anwaltsschriftsatz 650.000 Seiten umfasst(das entspricht einer Datenmenge von ca. 1 bis 5 Gigabyte): https://www.handelsblatt.com/unternehmen/industrie/schadensersatzprozess-sammelklage-gegen-lkw-kartell-ist-zulaessig-spediteure-fordern-mehr-als-800-millionen-euro/25150470.html?ticket=ST-46210755-aGlMAqdJD3nMfOtPzWGN-ap1
[5] Vgl. II., 5.
[6] Sikder M. Kamruzzaman, Text Classification using Artificial Intelligence.
[7] Siehe oben unter II., 1.
[8] Vgl. unter II., 6.
[9] INTL JOURNAL OF ELECTRONICS AND TELECOMMUNICATIONS, 2011, VOL. 57, NO. 3, PP. 263–270.