Einmal hält besser

Im zweiten Teil unserer Serie zum Thema Datenmanagement erfahren Sie mehr über doppelte Daten. Selbst in gut gepflegten Adressdatenbanken sind vier bis sechs Prozent Dubletten enthalten, wenn sie nicht systematisch – zum Beispiel mit Hilfe einer speziellen Software – bekämpft werden. Nun klingen so ein paar Prozent nicht gerade gravierend. Aber fünf Prozent Dubletten von 100.000 Werbebriefen sind immerhin 5.000 Stück – das ist ein ganz schön großer Haufen Briefe. Und es sind eine Menge Kosten, die unnütz verursacht werden.

Dubletten schaden nicht nur wegen der doppelten Werbekosten:
-Dubletten machen jegliche Personalisierung zunichte. Ein Kunde, der einen Brief doppelt erhält, weiß sofort: Massenwerbung!

-Dubletten verfälschen Analysen des Database Marketing. Wettbewerbs-Analysen, CLV (Customer Lifetime Value) und Cross-Selling-Analysen werden signifikant verfälscht. Denn Dubletten verteilen sich nicht gleichmäßig über die Datenbank, sondern tauchen insbesondere dort auf, wo die Analyse ansetzt: bei den Mehrfachkäufern.

Gegenmaßnahmen

Um die Dublettenquote in Ihrer Datenbank möglichst gering zu halten, gibt es zwei Ansätze: Sie können die Datenbank entweder von Zeit zu Zeit bereinigen, oder Sie können versuchen, Dubletten von vornherein zu vermeiden. Für beides gibt es heute Software-Hilfsmittel. Im Folgenden erfahren Sie mehr darüber.

Grundsätzliche Anforderungen an Dublettensoftware
Dubletten entstehen immer durch Abweichungen in der Schreibweise von Adressen. Dabei gibt es verschiedene Arten von Abweichungen. Folgende sind für Privatadressen typisch:
– Tippfehler: Alexander wird zu Alexnader

– Schreibfehler: Chryschanowski wird zu Krischanoffsky

– verschiedene Namensschreibweisen: Meier/Mayer, Sylvia/Silvia, Mathias/Mattias

– Freudsche Hörfehler: Sponheimstr. wird zu Sponhainstr.

– Weitergehende Freudsche Fehler: Friedrich-Silcher-Weg wird zu Friedrich-Schiller-Weg, weil das Gehirn schon bei „Friedrich“ auf „Schiller“ schaltet.

Bei Firmenadressen treten andere Abweichungen in den Vordergrund:
– Vertauschungen: Müller Möbel / Möbel-Müller
– Zusätze: Müller Möbel / Müller Design-Möbel GmbH
– Wortteil-Verschiebungen: Müller Direkt- und Dialogmarketing / Müller Direktmarketing
– Abkürzungen: Westf. Inst. f. Agrarökonomie / Agrarökonomisches Institut Westfalen

Sie sehen: welche Ähnlichkeiten gefunden werden müssen, unterscheidet sich nach Firmen- und Privatadressen. Ihre Software muss also auf Ihren Typ Adressen passen.

Overkill und Underkill

Im Einzelvergleich ist (bisher) kein Verfahren so gut wie der Mensch. Teilweise findet Software Dubletten, die nicht wirklich welche sind. Diese zuviel gefundenen Dubletten nennt man Overkill. Umgekehrt findet kein Verfahren alle Dubletten. Zuwenig gefundene Dubletten bezeichnet man analog als Underkill. Je besser Ihr Verfahren, desto geringer die Summe aus Over- und Underkill. Geringer Over- und Underkill wird auch als hohe Trennschärfe bezeichnet.

Ähnlichkeits-Verfahren zur Dublettenprüfung

Im Folgenden erhalten Sie ein Überblick über die wichtigsten Verfahren, damit Sie angebotene Software einschätzen können.

Das einfachste Verfahren: Matchcode
Statt die gesamte Adresse Buchstabe für Buchstabe zu vergleichen, werden nur markante Punkte miteinander verglichen, z.B. PLZ, Hausnummer, der 1 und 3. Buchstabe des Nachnamens und der 1. Buchstabe des Vornamens. Solange alle diese Dinge übereinstimmen, wird die Adresse als Dublette gefunden, auch wenn in den anderen Buchstaben Abweichungen sind.
Solche Verfahren benötigen kaum Rechenzeit, da dieser „Matchcode“ einfach gebildet wird und in einem so genannten Index für jede Adresse abgelegt werden kann – er muss also nicht jedes Mal für alle Adressen neu errechnet werden. Der Pferdefuß ist die schlechte Trennschärfe: Maier/Meier wird zwar gefunden, aber schon bei Meyer weicht der dritte, der relevante Buchstabe ab – der Matchcode versagt. Bei Maier/Maihofer wird hingegen fälschlich eine Dublette gemeldet. Fazit: Das Verfahren ist veraltet. Nehmen Sie ein Programm mit besserem Verfahren.

Phonetik
Hier werden unterschiedliche Schreibweisen vereinheitlicht, indem ähnlich klingende Buchstaben in denselben Code verwandelt werden. P und B werden z.B. zur „1“, K und C und G zur „2“. Ob es nun Becker oder Begger heißt – egal, alles gleich. Wie beim Matchcode kann hier der Phonetik-Code in einem Index gespeichert werden, was das Verfahren beschleunigt. Es gibt eine Vielzahl solcher Phonetik-Verfahren, wobei die einfachen nur einzelne Buchstaben, die besseren auch Buchstabengruppen („Sch“) betrachten. Das einfachste ist das Russell-Soundex-Verfahren, häufig nur Soundex genannt. Es ist weit verbreitet, liefert aber sehr viel Overkill: So wird z.B. „Mehl“ und „Maier“ gleichgesetzt. Von einer heutigen Profi-Phonetik können Sie erwarten, dass sie auch mit deutschen Umlauten klarkommt und selbst kompliziertere Abweichungen wie „Kristof“/“Christoph“ oder „Klusoh“/“Cluseault“ findet – bei geringem Overkill. Aber Achtung: Auch die beste Phonetik findet nur phonetische Fehler. Tippfehler oder Abkürzungen lassen sich damit nicht aufspüren. Deshalb sind phonetische Verfahren allein zumindest für Firmenadressen völlig unzureichend.

Unscharfe Ähnlichkeitsverfahren
Da Computer immer leistungsfähiger und billiger geworden sind, ist es heute nicht mehr nötig, ein indizierbares Verfahren zu verwenden. Die Matchcode-Verfahren wurden daher von so genannten „unscharfen“ Verfahren abgelöst. Ein unscharfes Verfahren trifft keine Ja/Nein-Entscheidungen, sondern bestimmt den Grad der Ähnlichkeit. Durch Abwägen verschiedener Elemente der Adresse können so wesentlich höhere Trennschärfen erzielt werden: Sind beispielsweise Firmenname und Ansprechpartner sehr ähnlich, so kann trotz gänzlich anderer Straße (Umzug!) die Firma als Dublette zugeordnet werden. Bei annähernd identischer Straße und Hausnummer können andererseits stärkere Abweichungen im Firmennamen zugelassen werden. Diese Abwägung wäre mit Matchcode-Verfahren nicht möglich. Heutige professionelle Adressverfahren sind optimiert für Adresseinsatz. So findet z.B. das FACT®-Verfahren alle oben aufgeführten Beispiele und kommt damit dem menschlichen Ähnlichkeitsempfinden verdächtig nahe.

Ähnlichkeit ist nicht alles

Ein gutes Ähnlichkeitsverfahren ist Voraussetzung für eine gute Dublettensoftware. Aber das Verfahren allein genügt nicht. Für eine Software, die ganze Dateien auf Dubletten prüft, spielt die Bedienung eine große Rolle: Was nützt die beste Software, wenn Sie sie nie anwenden? Neben einer eingängigen Benutzeroberfläche zählt hier das Dateiformat: Die Software sollte möglichst ohne Zwischenschaltung einer Konvertierung jenes Dateiformat verarbeiten können, das Sie verwenden. Jede Zwischenkonvertierung kostet Zeit und birgt Fehlerrisiken – achten Sie darauf.

Wann sollte man Dublettenprüfung durchführen?

Hierfür gibt es vier mögliche Zeitpunkte:
– Gleich bei der Eingabe
– Beim Einspielen separat erfasster (oder gekaufter) Adressen, also beim Hinzufügen eines neuen Adressbestandes zu Ihrer Kundendatei
– Innerhalb der Kundendatei
– Direkt vor dem Mailing
Die optimale Antwort heißt: Alle vier – denn zu jedem Zeitpunkt gibt es vernünftige Gründe, obwohl Sie zu den anderen Zeitpunkten auch prüfen. Ob sich der Mehrfach-Aufwand für Sie lohnt, hängt natürlich von Ihrer Adressmenge ab und vom Negativ-Effekt, der durch jede Dublette verursacht wird.

Prüfung gleich bei der Eingabe
Wenn in Ihre Kundenverwaltungssoftware eine Prüfung integriert ist, die direkt nach Eingabe einer Adresse wirksam prüft, ob diese Adresse in ähnlicher Form bereits in Ihrem Datenbestand enthalten ist, dann vermeiden Sie viel Arbeit:
– Einerseits ist in vielen Unternehmen das Anlegen eines neuen Kunden mit Aufwand verbunden: Kreditwürdigkeitsprüfung, Heraussuchen der zuständigen Regionalvertretung, … Diesen Aufwand machen Sie unnötigerweise doppelt, wenn Sie nicht merken, dass der Kunde schon existiert.

– Vor allem aber: Ist erst einmal ein neuer Kundenstammsatz angelegt, sammelt er automatisch Vorgänge: Rechnungen, Kontakte, Ansprechpartner, Zahlungsinfos usw. Alle diese Daten von einem Datensatz zum anderen zu bewegen, kann je nach Umfang über 10 € an Arbeitszeit für jede einzelne Dublette verursachen.
Die Prüfung bei der Eingabe ist die wirksamste, denn
– hier sitzt ein Mensch davor: Sie können also die Prüfung etwas sensibler einstellen, so dass sie im Zweifel lieber eine Dublette zuviel als eine zuwenig anzeigt; und der Erfassungsmitarbeiter kann „keine Dublette“ anklicken. Dadurch finden Sie sicherer alle Dubletten.

– Der Mitarbeiter hat jetzt die beste Gelegenheit, einer aufgezeigten Dublette auf den Grund zu gehen:

– Hat er den Kunden am Telefon, kann er zurückfragen, beispielsweise „ich habe hier einen Hans Müller, aber an einer anderen Adresse – haben Sie früher in der Mühlgasse gewohnt?“.

– Hat er eine Antwortkarte vor sich, kann er noch mal nachschauen, ob sich kleine Unterschiede zwischen vorhandener und neu eingegebener Adresse nicht vielleicht doch als Identität herausstellen: Manchmal sieht z.B. ein handschriftliches „u“ ähnlich wie ein „n“ aus usw.

– Dabei können übrigens auch Fehler in der bereits vorhandenen Adresse durch das Telefonat oder die neue Antwortpostkarte korrigiert werden.

Prüfung beim Hinzufügen eines neuen Adressbestandes zu Ihrer Kundendatei
An dieser Stelle ist zumindest eines noch klar: welche Ihre bestehenden Adressen sind und welche Ihre neuen. Wenn Sie fremde Adressen hinzufügen, die Sie günstig von einem Adressverlag gekauft oder von einer CD geladen haben, dann ist die Folge-Verarbeitung ganz einfach: Wenn ein Dublettenverdacht zwischen einer bestehenden und einer neuen Adresse besteht, lassen Sie die neue einfach weg. Falls Sie dabei unnötigerweise ein paar Adressen zuviel gelöscht haben, ist das auch nicht schlimm.
Ganz anders sieht es aus, wenn die einzuspielenden Adressen z.B. Messekontakte sind: Jeder dieser Kontakte hat Sie wahrscheinlich mehrere 100 Euro gekostet, und die Messebesucher erwarten jetzt Infomaterial, einen Außendienstkontakt etc.
Hier müssen Sie alle Zweifelsfälle klären. Alles was sicher keine Dublette ist, kann eingespielt werden. Die Vielleicht-Dubletten spielen Sie besser nicht einfach ein, sondern übergeben Sie lieber denjenigen Vertriebsmitarbeitern zur manuellen Eingabe, die mit diesen Kunden später zu tun haben – bzw. die im Falle einer Dublette diesen Kunden schon kennen.

Prüfung innerhalb der Kundendatei
Warum muss man die Daten nochmals in sich prüfen, wenn schon bei der Eingabe und beim Einspielen eine Dublettenkontrolle stattgefunden hat? Das erscheint in der Tat zunächst merkwürdig, hat sich aber als sinnvoll herausgestellt. Die Gründe:
– Mitarbeiter drücken manchmal nachlässig „keine Dublette“, wenn bei der Prüfung während der Eingabe häufig Adressen als Dubletten ausgewiesen werden, die tatsächlich gar keine Dubletten sind.

– Beim Einspielen zusätzlicher Adressbestände wurden Fehler in der Dublettenprüfung gemacht – oder dieser Schritt wurde bei manchen Zusatzadressen völlig vergessen.
Wenn Sie bei einer solchen Prüfung feststellen, dass tatsächlich keine oder nur eine vernachlässigbare Menge Dubletten vorhanden sind: Herzlichen Glückwunsch! Bisher habe ich erst einmal erlebt, dass die Dublettenquote über 2 Jahre lang unter 0,2% gehalten wurde. Sind entsprechende Eingabeprüfungen vorhanden, dann ergeben sich meiner Erfahrung nach meist noch Dublettenquoten zwischen 0,5 und 1% – das sind immerhin viel weniger als die normalen 4-6%. Empfehlung: Machen Sie ca. 2 Monate nach Einführung einer Eingabeprüfung einen Test. Sollten sich schon wieder viele Dubletten eingeschlichen haben, dann prüfen Sie, ob die Software richtig eingestellt ist und ob die Mitarbeiter richtig geschult wurden – und holen Sie das eine oder andere ggf. nach. Wenn sich jedoch herausstellt, dass sich bei Ihnen tatsächlich sehr selten Dubletten einschleichen, dann verlängern Sie den Zeitraum zwischen den Prüfungen.

Prüfung in der Mailing-Datei
Hiermit hat es eine andere Bewandtnis als mit den zuvor genannten drei Prüfungen: Dubletten sind unerwünschte doppelte Adressen; doch in der Stammdatei müssen manche Adressen doppelt vorhanden sein, die beim Mailing aber nur einmal angeschrieben werden sollen. Insbesondere handelt es sich um verschiedene Firmen mit demselben Ansprechpartner:
– 3 Linden Hotel-Betriebs-GmbH & Co., Herrn Martin Feldner
– 3 Linden Hotel-Holding GmbH, Martin Feldner
– 3 Linden Restaurant-Betriebs-GmbH, z. Hd. Martin Feldner
Klar, dass Sie die drei Unternehmen bei der Rechnungsstellung nicht vertauschen dürfen. Aber braucht Herr Feldner tatsächlich drei Kataloge?

Dieser Artikel erschien am und wurde am aktualisiert.
Nach oben scrollen