Es ist ein bekanntes Muster: Ein mittelständisches Unternehmen investiert in ein KI-gestütztes Vertriebs­tool – Lead-Scoring, Next-Best-Action, automatisierte Segmentierung. Die Demo überzeugt, der Pilot läuft an, die ersten Ergebnisse enttäuschen. Ursachen­analyse: Das Modell hat nicht versagt. Die Daten haben es nie arbeiten lassen.

Das Fundament, das niemand prüft

Gartner beziffert in seinem Data Quality Market Survey 2024 den durchschnittlichen finanziellen Schaden mangelhafter Datenqualität auf rund 12,9 Millionen US-Dollar pro Jahr und Unternehmen – über alle Branchen. Für den B2B-Vertrieb im Mittelstand ist der Wert absolut niedriger, relativ aber oft gravierender: Kleinere Vertriebsteams haben weniger Kapazität, Daten­lücken manuell zu kompensieren. Forrester Research kommt in seinem B2B Data Health Benchmark 2024 zu einem ähnlichen Befund: In typischen CRM-Instanzen mittelständischer B2B-Unternehmen sind zwischen 40 und 60 Prozent der Kontaktdatensätze in mindestens einem vertriebsrelevanten Feld unvollständig, veraltet oder inkonsistent. Branchenkennzeichnung fehlt, Entscheider­rollen sind nicht gepflegt, Telefon­nummern stammen aus dem Erstgespräch vor drei Jahren.

Das Salesforce State of Sales Report 2024 ergänzt die Perspektive der Anwender: Rund zwei Drittel der befragten Vertriebs­mitarbeiter zweifeln an der Qualität der Daten, mit denen KI-Empfehlungen in ihrem CRM generiert werden. Vertrauen in die Ausgabe des Systems entsteht nicht – und damit auch keine Verhaltens­änderung.

Warum KI-Modelle Datenmängel nicht selbst heilen

Ein verbreiteter Irrtum: KI werde das schon richten. Tatsächlich verstärken viele Modelle systematische Datenlücken eher, als sie zu schließen. Ein Lead-Scoring-Algorithmus, der auf historischen Abschlüssen trainiert wurde, repliziert die Verzerrungen jener Abschlüsse – inklusive der Branchen, die im CRM nicht sauber klassifiziert waren. McKinsey hält im State of AI 2025 fest, dass Unternehmen, die KI im Vertrieb nutzen, ohne zuvor eine Datenstrategie zu etablieren, im Schnitt nur rund 30 Prozent der erwarteten Produktivitäts­gewinne realisieren. Der Rest versickert in Korrektur­schleifen, manuellem Nachpflegen und sinkender Nutzer­akzeptanz.

IDC dokumentiert in der European CRM Adoption Study 2025, dass nur etwa ein Viertel der mittelständischen CRM-Nutzer in der DACH-Region ein formales Daten­governance-Konzept betreibt – also definierte Verantwortlichkeiten, Pflicht­felder, Validierungs­regeln und regelmäßige Daten­bereinigungszyklen. Der Rest vertraut darauf, dass die Vertriebsmitarbeiter es schon richtig eintragen. Das tun sie nicht – nicht weil sie nachlässig sind, sondern weil ein Außendienstler zwischen zwei Terminen keine Zeit hat, Postleitzahlen zu normieren.

Ein KI-Modell kann keine Informationen auswerten, die nicht existieren. Es kann schlechte Daten nicht erraten – es kann sie nur falsch gewichten. Forrester Research, B2B Data Health Benchmark 2024

Drei Hebel, die Abhilfe schaffen – ohne großes Projekt

Die gute Nachricht: Datenqualität lässt sich schrittweise verbessern, ohne ein Mammut­projekt aufzusetzen. Bitkom weist im Digitalisierungsindex Mittelstand 2025 darauf hin, dass Unternehmen, die eine strukturierte Datenpflege in den Vertriebsalltag integrieren – statt sie als Sonderprojekt zu behandeln –, innerhalb von sechs bis zwölf Monaten messbar bessere Modell­ausgaben erzielen. Drei Ansätze haben sich in der Praxis bewährt:

DREI HEBEL FÜR BESSERE CRM-DATEN 01 Pflichtfelder & Validierung Wenige, aber harte Felder als Pflicht definieren. Branche, Rolle, Land: Dropdown statt Freitext. 02 Automatische Anreicherung Externe Datenanbieter (z. B. Firmendaten-APIs) ergänzen fehlende Felder ohne manuellen Aufwand. 03 Verfall & Bereinigung Datensätze älter als 18 Monate automatisch flaggen und zur Prüfung dem Eigentümer zuweisen.
Maßnahmen mit dem höchsten Hebel auf KI-Ausgabe­qualität im Mittelstands-CRM. Quelle: Forrester 2024, Gartner 2024, IDC 2025.

Der erste Hebel – erzwungene Felddisziplin – ist der unangenehmste, weil er Vertriebsmitarbeitern Eingabe­pflichten auferlegt. Er wirkt aber am schnellsten. Studien zeigen, dass schon drei bis fünf hart verpflichtende Felder (Branche, Entscheiderrolle, Umsatz­größenklasse) die Modell­güte eines Lead-Scorings messbar anheben, weil diese Felder für fast alle Segmentierungs­aufgaben zentral sind.

Der zweite Hebel – automatische Datenanreicherung – hat durch die Verbreitung strukturierter Firmen­datenbanken und entsprechender API-Dienste deutlich an Aufwand verloren. Mittelständische Unternehmen können heute für überschaubare monatliche Kosten Handels­register­daten, Branchen­codes und Unternehmens­größen automatisch in ihr CRM zurückspielen lassen. Das ersetzt keine Entscheidung über Kauf­bereitschaft, schafft aber die Grundlage, auf der KI-Modelle überhaupt erst segmentieren können.

Der dritte Hebel – systematischer Datenverfall – wird am häufigsten übersehen. Ein Kontakt­datensatz, der vor zwei Jahren als qualifizierter Lead eingestuft wurde, ist heute möglichweise Schrottdaten: Der Ansprechpartner hat das Unternehmen gewechselt, das Unternehmen selbst wurde übernommen, der Bedarf hat sich aufgelöst. Ohne Verfall­mechanismus sammeln CRM-Systeme über Jahre tote Datensätze an, die das Modell weiter als Trainings­grundlage verwendet.

Was das für die KI-Investitionsentscheidung bedeutet

Für Geschäftsführer und Vertriebsleiter im Mittelstand ergibt sich daraus eine klare Priorität: Bevor die nächste KI-Lösung evaluiert wird, lohnt eine ehrliche Bestandsaufnahme der eigenen CRM-Datenqualität. Das muss kein teures Consulting-Projekt sein. Eine Stichproben­analyse von 200 bis 300 Datensätzen – manuell durchgeführt oder mit einfachen Auswertungs­abfragen – gibt in wenigen Stunden Aufschluss darüber, wie hoch der Anteil nutzbarer Datensätze tatsächlich ist.

Wer dabei feststellt, dass weniger als drei von fünf Feldern zuverlässig gefüllt sind, sollte den KI-Roll-out verschieben – oder parallel mit der Datenpflege beginnen und das Modell erst nach einem definierten Daten­qualitäts-Schwellenwert produktiv schalten. Dieser Schwellenwert ist keine Wissenschaft: Forrester empfiehlt als Faustregel, dass mindestens 70 Prozent der Datensätze in den für das Modell relevanten Kern­feldern vollständig sein sollten, bevor man auf KI-Ausgaben vertraut.

Die Alternative – KI auf schlechten Daten laufen zu lassen und die Ergebnisse zu ignorieren – ist keine neutrale Entscheidung. Sie erzeugt im Vertriebsteam das Signal, dass KI nicht funktioniert. Dieses Signal ist schwer zu revidieren. Wer den zweiten Schritt vor dem ersten tut, zahlt den Preis nicht einmal, sondern zweimal: einmal für das Tool, einmal für das verlorene Vertrauen.