Die Flüchtlingskrise sollte vor allem als eines verstanden werden: als Chance. Die rund 11 Milliarden Euro zur Bewältigung der Flüchtlingskrise wirken wie ein Konjunkturprogramm, Flüchtlinge sind vor allem eines: Konsumenten. Arabische Namen sind jedoch oftmals überaus komplex – eine Herasforderung für das CRM und Big Data gleichermaßen. Doch genau hierfür gibt es Lösungen.
Rund 11 Milliarden Euro wird der deutsche Staat alleine in diesem Jahr für die Bewältigung der Flüchtlingskrise aufbringen müssen. Nach dem Herbstgutachten des Deutschen Instituts für Wirtschaftsforschung (DIW) sind die Aufwendungen aber gut angelegtes Geld – nämlich als zusätzlicher Anreiz für die Wirtschaft. „Das wirkt ähnlich wie ein Konjunkturprogramm“, sagt der DIW-Experte Ferdinand Fichtner.
Denn die Flüchtlinge würden den Großteil an Asylleistungen oder später Hartz IV in den Konsum stecken. Und wenn die schnelle Integration in die Wirtschaft tatsächlich klappt, werden viele Zuwanderer schon bald als zahlende Kunden in den CRM-Systemen und Datenbanken der Unternehmen zu finden sein.
Einige Branchen spüren das schon heute, beispielsweise die Telekommunikationsanbieter. Denn eins bringen fast alle Flüchtlinge aus der Heimat mit oder beschaffen es sich hier sehr schnell: Ein Smartphone. Denn das Handy ist in der Regel zunächst die einzige Verbindung zu den Freunden und Verwandten in den Herkunftsländern.
Arabische Namen sind oft sehr komplex
Auch auf Banken, Energieversorger und viele weitere Branchen kommen in der nächsten Zeit zahlreiche neue Kunden zu. Und arabische Namen wie „Abderrahim Al Husseini“ oder „Oumaima El Khatib“ stellen herkömmliche Kundendatenbanken vor neue Anforderungen, denn sie sind in der Regel erheblich komplexer als mitteleuropäische Namen.
Neben dem persönlichen Namen gibt es oft noch Beinamen, Abstammungsbezeichnungen unterschiedlichster Art oder Ehrennamen. Und damit steigt auch das Risiko von Falscherfassungen und Buchstabendrehern, insbesondere bei der telefonischen Aufnahme der Adressen in Call-Centern oder durch falsch ausgefüllte Onlineformulare.
First time right: Unnötige Kosten vermeiden
Dazu kommt das Risiko der Mehrfacherfassung, weil der angehende Kunde eventuell nicht weiß, dass er sich schon einmal bei diesem Unternehmen angemeldet hat und auch die Mitarbeiter dort dies nicht bemerken. Schon jetzt gehen Schätzungen selbst bei gut gepflegten Kundendatenbanken von zwei bis zehn Prozent Dubletten aus. Bei schlecht gepflegten Datenbanken können diese Zahlen sogar auf 20 bis 30 Prozent steigen.
Die Folgen sind unnötige Kosten, beispielsweise durch Retouren. Daher ist es sinnvoll, von vornherein auf die Datenqualität zu achten und dabei menschliche Intelligenz mit computergestützten Systemen zu kombinieren, um Kunden später richtig ansprechen zu können. Denn die bisher einigermaßen zuverlässig arbeitenden Prozeduren zur Dublettenerkennung und Adressvalidierung stoßen bei „exotischeren“ Namen aus dem Irak, Syrien oder Afghanistan schnell an ihre Grenzen.
Neben den herkömmlichen Algorithmen kommen deshalb in einer guten Datenqualitätssoftware zunehmend auch wissensbasierte Methoden zum Einsatz. Sie wenden Einsichten der Computerlinguistik zur Spracherkennung und -synthese an, um eine deutlich höhere Erkennungsquote von Dubletten und Fehlern zu erreichen.
Sinnvollerweise sollte die Datenbereinigung auch nach dem „First-Time-Right-Prinzip“ erfolgen, bei dem Daten direkt bei der Eingabe in eine Datenbank oder ins CRM-System auf ihre Richtigkeit überprüft werden. So können bereits zahlreiche Datenverunreinigungen und Dubletten zugunsten einer hohen Datenqualität verhindert werden.
Bei guten Software-Lösungen kontrolliert das System unmittelbar bei der Eingabe eines neuen Kunden die Daten beispielsweise auf ihre Groß-und Kleinschreibung, die korrekte Geschlechts-Zuordnung und die Syntax. Gleichzeitig können E-Mail-Adressen automatisch validiert und postalische Adressdaten geprüft werden.
Wie Unternehmen auch unter den neuen Herausforderungen eine hohe Datenqualität in ihren Kundendatenbanken sicherstellen können, können Sie detailliert in diesem Whitepaper nachlesen: http://www.humaninference.de/unternehmen/resources/whitepapers/whitepaper-high-precision-matching