Datenqualität in der modernen Lead-Generierung

Wie moderne Filter und kriminalistischer Spürsinn für valide Daten sorgen: Telefonnummern, E-Mail- und Post-Adressen potenzieller Kunden zählen weltweit zu den mit steigender Tendenz nachgefragten Datensätzen, sogenannten Leads. Vor wenigen Jahren zählte im Geschäft mit den Kontaktdaten nur eines: große Datenmengen zu einem möglichst kleinen Preis. Neue Gesetze, ein verändertes Verbraucherverhalten aber durchaus auch der eigene Raubbau in der Direktmarketing-Branche haben das Lead-Geschäft in den letzten Jahren nachhaltig verändert. Während der Anteil falscher Datensätze immer höher und die Tricks der Datenfälscher immer raffinierter werden, werden die Validierungsprozesse immer ausgefeilter. Ein modernes Katz- und Maus-Spiel in der Online-Welt.

Ein iPad, ein nagelneuer A4 oder ein hochpreisiger Einkaufsgutschein gegen ein paar Werbemails mehr im Postfach – so lautet vereinfacht der Deal bei der Online Lead-Generierung. Was einfach klingt, wird in Wahrheit immer komplexer. Noch vor wenigen Jahren konnten Kontaktdaten potentieller Kunden quasi ohne Beschränkungen generiert, verwendet, getauscht und verkauft werden. Neue Gesetze, veränderte Konsumentengewohnheiten sowie nicht zuletzt das nicht nachhaltige Wirtschaften mit Konsumentendaten haben den Bedarf an validen und möglichst zielgenauen Daten ständig erhöht und werden das Lead Business in den nächsten Jahren nachhaltig verändern. Der Umgang mit der steigenden Zahl falscher und gefälschter Daten wird dabei zum entscheidenden Faktor.

Falsche und gefälschte Daten
„Die wenigen unseriösen Partner unter der hohen Zahl der heute für erfolgreiche Lead-Generierung benötigten Partner herauszufiltern, ähnelt der Suche nach der Stecknadel im Heuhaufen.“
Trotz steigender falscher und gefälschter Einträge, ist der Anteil echter Einträge in den meisten Ländern noch immer sehr hoch. Laut Untersuchungen von eGentic entsprechen 60-70 Prozent der in Deutschland generierten Leads den Qualitätsanforderungen. Skandinavische Länder liegen mit 75 Prozent und mehr deutlich höher, der Mittelmeerraum leicht darunter.

Von den 30 bis 40 Prozent falscher Daten resultiert fast die Hälfte aus unabsichtlichen Fehlern. Fehlerquelle Nummer Eins sind Eingabefehler, beispielsweise Zahlendreher, Rechtschreib- oder Tippfehler. Hier zeigen sich innerhalb Europas deutlich kulturelle Unterschiede: generell scheinen Nordeuropäer sorgfältiger und korrekter bei der Eingabe ihrer Daten vorzugehen, während in Südeuropa Daten eher locker, schnell und damit auch häufiger falsch eingetragen werden.

Die andere Hälfte der falschen Daten sind absichtlich manipulierte Daten. Diese stammen zu einem geringen Teil von Konsumenten, die bewusst ihre Daten verfälschen, um nicht kontaktiert werden zu können. Das geht oft so weit, dass die Teilnehmer auch dann nicht kontaktiert werden können, wenn sie als Gewinner ermittelt wurden. Die überwiegende Zahl bewusst gefälschter Daten stammt allerdings von Anbietern beziehungsweise Publishern, die für die Veröffentlichung und Verbreitung von Kampagnen zur Lead-Generierung verantwortlich zeichnen. Diese Anbieter werden meist pro generierten Lead vergütet. Mehr Leads bedeuten automatisch mehr Gewinn. Die Versuchung gefälschte Daten einzuspielen ist darum groß. Die wenigen unseriösen Partner unter der hohen Zahl der heute für erfolgreiche Lead-Generierung benötigten Partner herauszufiltern, ähnelt der Suche nach der Stecknadel im Heuhaufen.

Lead-Generierung für Direkt-Marketing-Aktivitäten gehört zu den Marketing-Bereichen, in denen Manipulationen vergleichsweise leicht fallen. Es ist leicht einen Datensatz zu erstellen, der real wirkt oder es auch ist, ohne dass eine Einwilligung vorliegt. Der „worst case“, nämlich die Vermarktung realer Konsumentendaten, ohne deren Einwilligung, passiert seriösen Anbietern mittlerweile glücklicherweise äußerst selten – zum einen aufgrund rechtlicher Bestimmungen, harter Strafen und Haftungsfragen, zum anderen aufgrund gängiger „Double Opt-In“-Verfahren. Viel häufiger werden heutzutage gefälschte Daten in Kampagnen eingespielt, sprich Daten, die echt wirken, hinter den aber keine reale Person steht. Solche Daten lassen sich schwer ermitteln. Unmöglich ist es aber nicht.

Moderne Filter und kriminalistischer Spürsinn
„Die Methoden der Datenfälscher werden raffinierter, die Möglichkeiten diese aufzuspüren auch.“
Im Lead-Generierungsprozess stehen zahlreiche technische Möglichkeiten zur Verfügung um die Echtheit (Validität) der Daten zu prüfen. Zusätzlich ist mittlerweile geradezu kriminalistischer Spürsinn gefragt und die menschliche Komponente neben nötiger und wichtiger Software unerlässlich.

Bis zu 60 verschiedene Filter und mehr begleiten heutzutage in Echtzeit den Lead-Generierungs-prozess. Neben rein technischen Filtern beispielsweise gegen „Mass Subscriptions“, also Massen-Einträgen, die von nur einer IP Adresse oder einem IP-Adressen-Block stammen, zählt das Filtern nach sogenannten „Bad-Word“-Listen zu den bekanntesten Instrumenten gegen unechte Daten. Die Bezeichnung „Bad Word“ bezieht sich nicht auf die Eigenschaften der Worte oder Namen, sondern auf die Wahrscheinlichkeit, dass der Datensatz falsch beziehungsweise gefälscht ist. Namen wie Mickey Mouse, Biene Maja und Max Mustermann tauchen genauso reihenweise auf wie historische Figuren von Julius Caesar über Albert Einstein oder Personen des öffentlichen Lebens wie Dieter Bohlen, Jogi Löw oder Angela Merkel. Das Filtern dieser Daten ist leicht, herausfordernd ist die Aktualität der Listen. Denn aktuelle Ereignisse oder auch Namen von Casting-Show Teilnehmern finden sehr schnell den Weg in Daten-Generierungsprozesse.

Auch sogenannte „Short Adresses“ werden direkt ausgefiltert, also Personen oder Ortsnamen mit nur zwei oder drei Buchstaben. Ausgefeilte Systeme prüfen mittlerweile sogar das Verhältnis von Konsonanten zu Vokalen. Je nach Sprache lassen sich hier Auffälligkeiten schnell und automatisiert erkennen. Die auf diese Weise aussortierten Daten werden aber nicht einfach gelöscht, sondern einer weiteren Prüfung unterzogen. Die kroatische Insel „Krk“ beispielsweise beinhaltet keinen Vokal und besteht aus nur drei Buchstaben. Dennoch ist es ein realer Ort. Diese Ausnahmen werden in sogenannte „White Lists“ eingetragen und die auf diese Weise validierten Daten wieder zurück in den Datenpool gespielt. Auch beim White-Listing ist darum die manuelle Komponente der eigentlich entscheidende Faktor.

Wesentlich komplexer als das Filtern nach Listen oder IP-Adressen ist das Erkennen beziehungsweise Aufspüren von bestimmten Mustern. Leads über eine Quelle (Traffic-Source) weisen dabei eine bestimmte Anomalie auf, zum Beispiel fortlaufende Muster in der Verwendung von Zahlen, Großbuchstaben, Punkten, Geburtsdaten etc. Moderne Filtersysteme erkennen immer komplexere Muster. Eine große Bedeutung hat hierbei ebenfalls die manuelle Prüfung. Denn die Leistungen, die das Gehirn vollbringen kann, lassen sich meist kaum oder gar nicht in Algorithmen für eine technische Umsetzung fassen. Geschulte und erfahrene muttersprachliche Mitarbeiter hingegen erkennen mit sehr hoher Wahrscheinlichkeit, ob eine Datenreihe valide ist oder gefälscht.

Ein Beispiel für aus der Praxis: Ein Buchstabe, Punkt, sieben Buchstaben (z.B. m.mueller) – so sehen zahlreiche E-Mail-Adresse aus. Wenn in immer gleichen Zeitabfolgen aber Mails eintreffen, die nachfolgend zwei Buchstaben, Punkt, sechs Buchstaben, dann drei Buchstaben, Punkt, fünf Buchstaben usw. aufweisen, die zumal noch alle über den gleichen Publisher generiert wurden, lohnt sich genaueres Hinschauen. Die Methoden der Datenfälscher werden raffinierter, die Möglichkeiten diese aufzuspüren auch. Insbesondere wenn technische und menschliche Fähigkeiten optimal Hand in Hand arbeiten. Moderne und schnelle Pinging-Prozesse helfen dabei ebenso weiter wie die zahlreichen neuen Echtzeit-Validierungsprozesse.

Zukunftsmarkt Lead-Generierung
„Der Trend zu Qualität und Nachhaltigkeit bei der Lead-Generierung wird sich in dem Maße durchsetzen, wie Anbieter und Unternehmen lernen, dass sich diese Investitionen für beide Seiten lohnen.“
Von den mittlerweile über sieben Milliarden Menschen auf der Welt zählen schon jetzt rund ein Drittel zu Online Usern. Die Zahlen der Onliner sowie der Mobilfunknutzer steigen rasant. Die Möglichkeiten der Neukundengewinnung über Online Lead-Generierung steigen damit ebenfalls – allerdings auch die Risiken. Großbritannien und die USA zählen zu den Märkten, in den Lead-Generierung am weitesten fortgeschritten ist. Und genau diese Märkte sind durch extrem hohe Anteile schlechter Daten zu großen Teilen abgewirtschaftet. Es wird noch Jahre dauern, um in diesen Ländern einen Turnaround zu schaffen. Noch herrscht die Einstellung vor: wenn immer weniger der generierten Daten funktionieren, benötige ich einfach mehr Daten.

In vielen anderen Ländern und in den Marketing- und Vertriebsabteilungen zahlreicher Unternehmen lässt sich erfreulicherweise ein anderer Trend erkennen: der Wunsch nach besserer Datenqualität, um weniger Streuverluste und bessere Conversion-Rates zu erzielen. Insbesondere Unternehmen, die langfristig und nachhaltig in einem Wirtschaftsraum aktiv sein wollen, sehen mehr und mehr die Notwendigkeit, dafür entsprechende Investitionen zu tätigen. Auf der anderen Seite stehen im Lead-Geschäft die Anbieter und Netzwerke, die ebenfalls an langfristigem Wachstum und damit an nachhaltigem Wirtschaften interessiert sind. In Deutschland und Europa sind darum beispielsweise die Traffic-Anbieter sehr viel mehr daran interessiert, einzelne, unseriöse Publisher zu isolieren als sich das in anderen Ländern bzw. Kontinenten beobachten lässt. Auch setzen immer mehr Anbieter bei der Lead-Generierung auf eine vertraglich festgelegte Beschränkung der Kommunikationsfrequenz.

Der Trend zu Qualität und Nachhaltigkeit bei der Lead-Generierung wird sich in dem Maße durchsetzen, wie Anbieter und Unternehmen lernen, dass sich diese Investitionen für beide Seiten lohnen. Das Umdenken hat in allen entscheidenden Märkten längst begonnen – ein irreversibler Prozess. Der optimale Mix aus externen und internen Filtern, Algorithmen und Abgleichlisten sowie manuellen, menschlichen Leistungen und Erfahrungen wird so über kurz oder lang zum entscheidenden Erfolgsfaktor für Anbieter werden.

ECIN-Fachtext von Yvonne Thierfeld, Team Leader Performance Marketing, eGentic GmbH
www.eGentic.com

Dieser Artikel erschien am und wurde am aktualisiert.
Nach oben scrollen