Es ist ein bekanntes Muster: Ein mittelständisches Unternehmen investiert in ein KI-gestütztes Vertriebstool – Lead-Scoring, Next-Best-Action, automatisierte Segmentierung. Die Demo überzeugt, der Pilot läuft an, die ersten Ergebnisse enttäuschen. Ursachenanalyse: Das Modell hat nicht versagt. Die Daten haben es nie arbeiten lassen.
Das Fundament, das niemand prüft
Gartner beziffert in seinem Data Quality Market Survey 2024 den durchschnittlichen finanziellen Schaden mangelhafter Datenqualität auf rund 12,9 Millionen US-Dollar pro Jahr und Unternehmen – über alle Branchen. Für den B2B-Vertrieb im Mittelstand ist der Wert absolut niedriger, relativ aber oft gravierender: Kleinere Vertriebsteams haben weniger Kapazität, Datenlücken manuell zu kompensieren. Forrester Research kommt in seinem B2B Data Health Benchmark 2024 zu einem ähnlichen Befund: In typischen CRM-Instanzen mittelständischer B2B-Unternehmen sind zwischen 40 und 60 Prozent der Kontaktdatensätze in mindestens einem vertriebsrelevanten Feld unvollständig, veraltet oder inkonsistent. Branchenkennzeichnung fehlt, Entscheiderrollen sind nicht gepflegt, Telefonnummern stammen aus dem Erstgespräch vor drei Jahren.
Das Salesforce State of Sales Report 2024 ergänzt die Perspektive der Anwender: Rund zwei Drittel der befragten Vertriebsmitarbeiter zweifeln an der Qualität der Daten, mit denen KI-Empfehlungen in ihrem CRM generiert werden. Vertrauen in die Ausgabe des Systems entsteht nicht – und damit auch keine Verhaltensänderung.
Warum KI-Modelle Datenmängel nicht selbst heilen
Ein verbreiteter Irrtum: KI werde das schon richten. Tatsächlich verstärken viele Modelle systematische Datenlücken eher, als sie zu schließen. Ein Lead-Scoring-Algorithmus, der auf historischen Abschlüssen trainiert wurde, repliziert die Verzerrungen jener Abschlüsse – inklusive der Branchen, die im CRM nicht sauber klassifiziert waren. McKinsey hält im State of AI 2025 fest, dass Unternehmen, die KI im Vertrieb nutzen, ohne zuvor eine Datenstrategie zu etablieren, im Schnitt nur rund 30 Prozent der erwarteten Produktivitätsgewinne realisieren. Der Rest versickert in Korrekturschleifen, manuellem Nachpflegen und sinkender Nutzerakzeptanz.
IDC dokumentiert in der European CRM Adoption Study 2025, dass nur etwa ein Viertel der mittelständischen CRM-Nutzer in der DACH-Region ein formales Datengovernance-Konzept betreibt – also definierte Verantwortlichkeiten, Pflichtfelder, Validierungsregeln und regelmäßige Datenbereinigungszyklen. Der Rest vertraut darauf, dass die Vertriebsmitarbeiter es schon richtig eintragen. Das tun sie nicht – nicht weil sie nachlässig sind, sondern weil ein Außendienstler zwischen zwei Terminen keine Zeit hat, Postleitzahlen zu normieren.
Drei Hebel, die Abhilfe schaffen – ohne großes Projekt
Die gute Nachricht: Datenqualität lässt sich schrittweise verbessern, ohne ein Mammutprojekt aufzusetzen. Bitkom weist im Digitalisierungsindex Mittelstand 2025 darauf hin, dass Unternehmen, die eine strukturierte Datenpflege in den Vertriebsalltag integrieren – statt sie als Sonderprojekt zu behandeln –, innerhalb von sechs bis zwölf Monaten messbar bessere Modellausgaben erzielen. Drei Ansätze haben sich in der Praxis bewährt:
Der erste Hebel – erzwungene Felddisziplin – ist der unangenehmste, weil er Vertriebsmitarbeitern Eingabepflichten auferlegt. Er wirkt aber am schnellsten. Studien zeigen, dass schon drei bis fünf hart verpflichtende Felder (Branche, Entscheiderrolle, Umsatzgrößenklasse) die Modellgüte eines Lead-Scorings messbar anheben, weil diese Felder für fast alle Segmentierungsaufgaben zentral sind.
Der zweite Hebel – automatische Datenanreicherung – hat durch die Verbreitung strukturierter Firmendatenbanken und entsprechender API-Dienste deutlich an Aufwand verloren. Mittelständische Unternehmen können heute für überschaubare monatliche Kosten Handelsregisterdaten, Branchencodes und Unternehmensgrößen automatisch in ihr CRM zurückspielen lassen. Das ersetzt keine Entscheidung über Kaufbereitschaft, schafft aber die Grundlage, auf der KI-Modelle überhaupt erst segmentieren können.
Der dritte Hebel – systematischer Datenverfall – wird am häufigsten übersehen. Ein Kontaktdatensatz, der vor zwei Jahren als qualifizierter Lead eingestuft wurde, ist heute möglichweise Schrottdaten: Der Ansprechpartner hat das Unternehmen gewechselt, das Unternehmen selbst wurde übernommen, der Bedarf hat sich aufgelöst. Ohne Verfallmechanismus sammeln CRM-Systeme über Jahre tote Datensätze an, die das Modell weiter als Trainingsgrundlage verwendet.
Was das für die KI-Investitionsentscheidung bedeutet
Für Geschäftsführer und Vertriebsleiter im Mittelstand ergibt sich daraus eine klare Priorität: Bevor die nächste KI-Lösung evaluiert wird, lohnt eine ehrliche Bestandsaufnahme der eigenen CRM-Datenqualität. Das muss kein teures Consulting-Projekt sein. Eine Stichprobenanalyse von 200 bis 300 Datensätzen – manuell durchgeführt oder mit einfachen Auswertungsabfragen – gibt in wenigen Stunden Aufschluss darüber, wie hoch der Anteil nutzbarer Datensätze tatsächlich ist.
Wer dabei feststellt, dass weniger als drei von fünf Feldern zuverlässig gefüllt sind, sollte den KI-Roll-out verschieben – oder parallel mit der Datenpflege beginnen und das Modell erst nach einem definierten Datenqualitäts-Schwellenwert produktiv schalten. Dieser Schwellenwert ist keine Wissenschaft: Forrester empfiehlt als Faustregel, dass mindestens 70 Prozent der Datensätze in den für das Modell relevanten Kernfeldern vollständig sein sollten, bevor man auf KI-Ausgaben vertraut.
Die Alternative – KI auf schlechten Daten laufen zu lassen und die Ergebnisse zu ignorieren – ist keine neutrale Entscheidung. Sie erzeugt im Vertriebsteam das Signal, dass KI nicht funktioniert. Dieses Signal ist schwer zu revidieren. Wer den zweiten Schritt vor dem ersten tut, zahlt den Preis nicht einmal, sondern zweimal: einmal für das Tool, einmal für das verlorene Vertrauen.