19. Mai 2026

KI-Agent erstellen: So bereitest du deine Daten richtig vor

Dein KI-Agent gibt unvollständige Antworten? Schuld ist meist die Datenbasis. Barrierefreie Dokumente mit Struktur, semantischen Tags und klarer Lesereihenfolge machen Inhalte maschinenlesbar.

Roboter der ein Kindliches Gesicht hat und in die Kamera schaut.

Vielleicht planst du ja gerade selbst einen KI-Agenten einzuführen und möchtest damit:

Automatisch Antworten aus deinen Bedienungs- und Wartungsanleitungen generieren,
Kundenanfragen schneller und präziser beantworten,
Neue Mitarbeiter*innen schneller einarbeiten,
Kosten für Support und Dokumentation reduzieren.

Aber beim Ausprobieren merkst du, dass der KI-Agent unvollständige Antworten liefert. Eventuell sind sie unlogisch oder gar fehlerhaft. Möglich, dass hier die KI gar nicht das Problem ist, sondern die Datenbasis, also eure Dokumente.

Warum scheitern KI-Agenten an der Datenbasis?

Ein KI-Agent ist ein digitaler Assistent, der deine Dokumente durchsucht, relevante Informationen extrahiert und daraus eine präzise Antwort generiert. Was aber, wenn dein Agent die Daten missverstanden hat? Dann funktioniert natürlich das ganze System nicht mehr und du kannst die Antworten in den Müll kloppen.

Sind KI-Agenten nicht clever genug, um unsere Daten immer richtig zu verstehen? Leider nein, und das fängt schon bei einfachen Problemen an:

Visualisierung von verschachtelten Tabellen, Texten ohne Überschriften und Flasche Lesereihenfolge.

Verschachtelte Tabellen: Tabellen sind eine komplexe Datenstruktur und können beliebig kompliziert gemacht werden, wenn wir Inhalte schachteln. Was technisch nicht als Kopf- und Datenzelle markiert wurde, kann auch von KI nicht fehlerfrei erraten werden.
Fehlende Überschriften: Eine saubere Gliederung ist das A & O bei Dokumenten. Wenn die fehlt, können Informationen nicht in das richtige Verhältnis zueinander gesetzt werden oder werden bei falscher Verwendung vielleicht sogar falsch zugeordnet.
Bilder mit Text: Bilder mit Text eignen sich für Menschen, die gerne mit ihren Augen schauen. Da sind KI-Agenten leider raus. Verwendest du beispielsweise Bilder von Tabellen ohne Textalternativen, benötigst du spezielle Systeme, die Datenstrukturen in Bildern erkennen und in Text übersetzen können.
Falsche Lesereihenfolge: Ist die Lesereihenfolge im Dokument nicht korrekt hinterlegt, wird das Dokument in einer falschen Reihenfolge gelesen und es entsteht ein Zusammenhang zwischen Inhalten, die eigentlich nicht zusammengehören.

Welche Folgen können Fehler in der Datenbasis von KI-Agenten haben?

Du hast deinen KI-Agenten aus wichtigen Gründen eingeführt. Vielleicht um intern eine Dokumentation zur Verfügung zu stellen, oder um Anfragen deiner Kunden besser abzuwickeln. Um diese Aufgaben souverän zu erledigen, braucht der KI-Agent eine wertige Datenbasis. Ist die nicht gegeben, kann der KI-Agent dieser Aufgabe nicht nachkommen. Du hast dann nichts gewonnen, arbeitest im schlimmsten Fall mit falschen Daten und erreichst das Gegenteil von Arbeitserleichterung.

Konsequenzen einer mangelhaften Datenbasis sind:

Hohe Supportkosten, weil Mitarbeiter*innen mit falschen Daten arbeiten und manuell nachbessern müssen.
Hohe Folgekosten, weil Mitarbeiter*innen mit falschen Daten arbeiten und Fehler nicht aufgefallen sind.
Aussagekraft von Antworten ist gering, weil der Zusammenhang der Dokumentinhalte nicht korrekt erarbeitet worden ist.
Es fehlen Informationen, da Inhalte aufgrund des Formats gar nicht erfasst werden konnten.

Kann das Erstellen einer qualitativ hochwertigen Datenbasis automatisiert gelöst werden?

Eine hochwertige Datenbasis zu erstellen, ist für viele eine Herausforderung. Deshalb gibt es hier auch Hilfestellung in Form von automatisierten Tools, die, obgleich sie Fehler reduzieren, doch schnell an ihre Grenzen stoßen. Im Gegensatz zu dir und mir besitzen sie keine semantische Intelligenz. Das heißt sie können zwar Tags erstellen, um z. B. eine Überschrift als solche zu kennzeichnen, aber sie erkennen nicht, ob diese Zuordnung sinnvoll ist. Sie verstehen den Kontext nicht und können daher keine inhaltliche Plausibilität sicherstellen.

Fragen zur Dokumentenstruktur müssen bereits bei der Erstellung eines Dokuments bedacht werden. Diese Überlegungen sind essenziell, um Wissen und Informationen verständlich zu transportieren. Sie lassen sich nur in den seltensten Fällen nachträglich in ein Dokument einfügen. (Wenn das Haus gebaut wurde, ist es zu spät, sich über die Architektur Gedanken zu machen.)

Aber was kannst du tun, um deine Daten zu verbessern? Die Lösung liegt in einer Kombination aus automatisierter Unterstützung und manueller Nacharbeit.

Eine souveräne Datengrundlage für deinen KI-Agenten erstellen.

Wir sagen es immer wieder gerne: Von digitaler Barrierefreiheit profitiert jeder, sogar dein KI-Assistent. Denn in der Barrierefreiheit geht es nur darum, Inhalte so zu strukturieren, dass sie optimal von Menschen und Software ausgelesen und interpretiert werden können. Barrierefreie Dokumente sind:

Strukturiert: Sie verwenden Überschriften, Listen und Tabellen mit einer klaren, logischen Lesereihenfolge.
Semantisch ausgezeichnet: Überschriften, Tabellen und andere Bausteine sind technisch korrekt ausgezeichnet. Das bedeutet, dass der KI-Agent versteht, um welche Art von Element es sich handelt (z. B. eine Überschrift, eine Tabelle oder eine Liste).

Durch die Vorarbeit erkennt der KI-Agent die Hierarchie der Dokumente, kann die relevanten Informationen extrahieren und daraus präzise Antworten generieren. Gleichzeitig erfüllst du damit möglicherweise bereits bestehende Anforderungen an deine Dokumente, die ohnehin mit der EN 301 549 oder WCAG konform sein müssen.

Warum schreibt nicht jeder einfach barrierefreie Dokumente?

Leider gibt es hier einen klaren Haken: Die meisten gängigen Editoren wie Word, PowerPoint oder InDesign sind derzeit nicht in der Lage, von sich aus barrierefreie Dokumente zu erstellen. Auch dann nicht, wenn du beim Erstellen die Best Practices einhältst. Für barrierefreie Dokumente sind Stand heute zusätzliche Plugins oder Tools erforderlich, wie etwa AxesWord oder MadeToTag.

Vielleicht hast du intern auch eine ganze Menge an Bestandsdokumenten herumliegen, die erst mal barrierefrei gemacht werden müssen. Hier gibt es zwei Möglichkeiten:

Anpassung in der Ursprungsdatei: Öffne das Dokument in seinem ursprünglichen Format (z. B. Word oder InDesign) und passe die Struktur direkt an. Dies ist besonders empfehlenswert für lebende Dokumente, die regelmäßig aktualisiert werden.
Nachträgliches Taggen: Falls der Zugriff auf die Ursprungsdatei nicht möglich ist, können PDF-Dokumente auch nachträglich mit Tools wie Adobe Acrobat oder dem Sitebrunch Accessibility barrierefrei gemacht werden.

Das ist natürlich eine Menge Arbeit, darum hier ein paar Tipps, auf die du, unabhängig vom Vorgehen, achten solltest.

Checkliste: PDFs KI-Agententauglich gestalten

Damit dein KI-Agent deine Dokumente korrekt versteht und präzise Antworten liefern kann, müssen sie maschinenlesbar sein. Folgende Schritte solltest du beachten:

1. Überschriften richtig nutzen

Überschriften sind das Rückgrat deiner Dokumente. Sie strukturieren den Inhalt, machen ihn übersichtlich und helfen dem KI-Agenten, Informationen richtig zuzuordnen. Nutze Überschriften nur zur Gliederung, nicht aus stylistischen Gründen.

Nutze die eingebauten Überschriftenfunktionen deines Editors (z. B. „Überschrift 1“, „Überschrift 2“, „Überschrift 3“ in Word).
Achte auf die richtige Verschachtelung: Nach einer „Überschrift 1“ folgt eine „Überschrift 2“, und bei tieferer Gliederung eine „Überschrift 3“, nicht eine „Überschrift 5“.
Verwende keine manuellen Formatierungen: Nutze keine fett gedruckten oder vergrößerten Texte als Überschriften.

2. Tabellen, Listen und andere Elemente

Tabellen sind komplexe Datenstrukturen. Wenn sie nicht korrekt markiert sind, kann der KI-Agent die Daten nicht korrekt extrahieren. Daher solltest du stets die eingebauten Tabellenfunktionen deines Editors nutzen.

3. Lesereihenfolge kontrollieren

Die Lesereihenfolge bestimmt, in welcher Reihenfolge der KI-Agent den Inhalt verarbeitet. Eine falsche Reihenfolge führt zu unlogischen oder unvollständigen Antworten. Du kannst die Lesereihenfolge mit Tools wie dem sitebrunch Accessibility prüfen oder den Screenreader anwerfen und die Seiten manuell durchgehen.

4. Metadaten korrekt setzen

Metadaten verbessern die Auffindbarkeit deiner Dokumente und unterstützen bei der Suche.

Titel (z. B. „Wartungsanleitung für Maschine X“),
Sprache (z. B. Deutsch),
Autor/Herausgeber (z. B. IT-Support),
Schlagworte (z. B. Wartung, Sicherheit, Bedienung).

Fazit: Barrierefreiheit als Lösung für funktionierende KI-Agenten

Die Anforderungen der digitalen Barrierefreiheit helfen dir, deine Dokumente optimal für den Einsatz von KI-Agenten vorzubereiten. Ohne strukturierte und semantisch ausgezeichnete Dokumente kann dein KI-Agent falsche oder unvollständige Antworten geben.

Beginne heute damit, deine Dokumente barrierefrei zu gestalten. Dein KI-Agent und deine Nutzer*innen werden es dir danken.