Voorspellingen gebruiken om respons op direct mail te verhogen


Direct mail versturen heeft zin als het veel traffic en conversie oplevert. Is een hoge respons voorspelbaar? Ja, met retail datamining kun je het resultaat van een mailing beïnvloeden.

Reader’s Digest was een van de eersten die datascience gebruikte om de resultaten van campagnes te beïnvloeden.  Alexei Cherenkov, nu data scientist bij Philips, vertelde op donderdagavond 27 februari bij de Utrecht datascience meetup hoe hiervoor tientallen jaren terug regressiemodellen werden gebruikt. Nu kan iedere retailer dit, met de rekenkracht van de computers van nu en opensource software zoals R en python. In drie stappen, van schieten met hagel naar folders op maat.

De basis op orde
Je wilt niet weten hoeveel stukken bezorgd worden bij consumenten die zijn overleden, al lang zijn verhuisd of geen enkele belangstelling hebben om op de aanbieding in te gaan. Jammer van alle druk- en portokosten maar ook een bron van veel irritatie. Daarbij komt dat privacyregels adverteerders verplichten om in hun database te registreren of consumenten toestemming hebben gegeven voor het vastleggen van persoonsgegevens. Voor degenen die voorspellingen willen gebruiken om respons op direct mail te verhogen alle reden om de basis op orde te brengen. De eerste stap is werken aan datakwaliteit: persoonsgegevens vastleggen in een professionele database; consumenten het recht geven op inzage en wijziging van de gegevens; vastleggen wanneer en hoe toestemming is gegeven om de data te gebruiken; en regelmatig gegevens vergelijken met het Nationaal Overledenenregister en de consumenten die geadresseerde reclamepost willen ontvangen. Dat kan eenvoudig via Postfilter. Voldoen aan de nieuwe privacyregels voorkomt hoge boetes en negatieve publiciteit. Datakwaliteit is een voorwaarde voor iedere retailer die de respons op direct mails wil verhogen.

Respons verhogen met voorspelmodellen
Retail datamining maakt het mogelijk om de kans te voorspellen dat iemand op een direct mail reageert. De tweede stap naar meer respons begint met een lookalike-analyse van het klantenbestand, voor zover postcodes en huisnummers bekend zijn. Dit is het geval bij vrijwel alle webshops en ook meubelbedrijven beschikken over deze data.

Retailers kunnen klantenonderzoek doen door bij de kassa naar postcode en huisnummer te vragen en daarvan de demografische kenmerken aan te kopen. Zo wordt een klantprofiel opgebouwd. Met behulp van de gevonden kenmerken wordt een vergelijkbaar adressenbestand aangekocht. Nadat hiermee de eerste direct mail is uitgevoerd, kun je meten welk type klanten reageert op mails. Met deze data kun je een algoritme bouwen dat de respons op de volgende direct mail voorspelt. Reader’s Digest gebruikte hiervoor logistische regressie. Dat is een methode die nog steeds goed werkt, naast meer complexe methoden zoals random forests en neurale netwerken. Welke methode je ook kiest, het gaat steeds om het bepalen van de variabelen die per consument respons voorspellen. Variabelen die niet aan de voorspelling bijdragen of onderling samenhangen schrap je uit het model. Het eindresultaat is een lijst waarbij van iedere consument is aangegeven hoe groot de kans is dat hij of zij op de mailing reageert.

De business case
Deze kans, vermenigvuldigd met de waarde van de voorspelde aankoop, bepaalt of het zinvol is om een specifieke consument per post te benaderen. Stel dat de marge op de voorspelde aankoop € 100 is. Als de kans op respons 1% is terwijl druk- en portokosten € 1,50 zijn, heeft de direct mail geen zin. De voorspelde opbrengst voor deze consument is 1% van € 100 ofwel € 1,-. Bij 2% kans op respons is de business case positief. € 2 is immers meer dan een € 1,50.  Alleen de consumenten waarbij er kans op succes is ontvangen de mailing. Het aantal adressen waarnaar de direct mail verzonden wordt is kleiner, waardoor kosten dalen. Consumenten met een laag voorspelde respons worden uit het adressenbestand gefilterd. Eigenlijk net zoals tijdens de eerste stap, waarbij het nationaal postfilter is gebruikt. Minder adressen betekent minder druk- en portokosten. Door de adressen van consumenten die toch niet kopen te schrappen, wordt het resultaat van de direct mail beter. Onderstaande grafiek laat zien wat de optimale adresselectie is waarop de business case hoogste uitkomst heeft en de groene lijn het hoogste punt heeft bereikt.

In dit voorbeeld gaan we uit van 10.000 adressen en € 5000 startkosten. Alle 10.000 voorspellingen zijn op volgorde gesorteerd. Tot een oplage van 800 is de voorspelde respons hoog maar is het aantal niet hoog genoeg om de startkosten terug te verdienen. De groene lijn met campagne-opbrengst valt onder de gele lijn van productiekosten. Als we de mailing naar alle 10.000 adressen sturen, is de businesscase ook negatief. Dit komt door een groot aantal adressen waar een te lage respons van verwacht wordt. Daar waar de groene lijn op het hoogste punt is, is de campagne-opbrengst maximaal. In dit geval is dit bij 4650 van de 10.000 adressen. De voorspelde opbrengst van de campagne is hier € 27.650.

Folders op maat
Logistische regressie is een geweldige manier om de respons op direct mail te verhogen, maar het wordt nog beter door de inhoud van de folder af te stemmen op de consument. De folder personaliseren is de logische derde stap naar meer traffic en converse. Retail datamining gebruikt hiervoor methoden zoals een clusteranalyse en market basket analyse. Moderne druktechnieken maken het mogelijk om iedere afdruk af te stemmen op klantvoorkeuren. Ook dit zijn, net als de logistische regressie, machine learning methoden die continu getest en verbeterd worden. Personaliseren kan op twee verschillende manieren aangepakt worden. Eerst kun je klanten groeperen naar segmenten van klanten die vergelijkbaar koopgedrag vertonen. Het product dat een vergelijkbare klant heeft gekocht leent zich om in de folder af te drukken. De andere manier is kijken welke producten samen of opeenvolgend gekocht worden. Als iemand bepaalde producten heeft gekocht, is het verstandig om andere producten aan te bieden die daarbij passen. Analyses waarbij de klant of het product centraal staan worden vaak gecombineerd. Dat de respons op direct mail zo sterk verhoogd wordt zal niemand verbazen.

Analyse van de aankopen per consument bepaalt de inhoud van folders op maat.