Älliä ristiinmyyntiin, osa 2

Tämä blogi on ristiinmyynnistä kertovan kolmiosaisen blogisarjan viimeinen osa. Ensimmäisessä osassa Ville Niemijärvi osoitti konkreettisten esimerkkien avulla, kuinka rempallaan verkkokauppojen ristiinmyynti heikoimmillaan voi olla. Toisessa osassa Lasse Liukkonen ja Antti Ollikainen lähestyivät ristiinmyynnin haastetta ostoskorianalyysin kautta. Tässä osassa esitellään miten mallinnuksen avulla ennustetaan asiakkaan ostotodennäköisyys. Samalla vedetään yhteen blogisarjan sisältö.

Ristiinmyynnissä tavoite on myydä jotain toista tuotetta Y sellaiselle asiakkaalle, joka on jo ostanut tuotteen X. Se mitä apuja analytiikalla on annettavana ristiinmyyntiin riippuu tilanteesta.

Case 1: ei tiedetä, mikä olisi optimaalinen tarjottava tuote kullekin asiakkaalle

Jos ristiinmyytäviä tuotteita on paljon, eikä ole etukäteen lyöty lukkoon, mitä halutaan myydä, voidaan analytiikalla vastata seuraaviin kysymyksiin:

1) Mitä tuotetta kannattaa ristiinmyydä kullekin asiakkaalle?
2) Kenelle kannattaa ylipäätään ristiinmyydä?
3) Milloin ei kannata ristiinmyydä ollenkaan?

Lassen ja Antin sarjan toisessa blogissa Älliä ristiinmyyntiin, osa 1 esitetään kuinka näihin kysymyksiin saadaan vastaukset ostoskorianalyysillä. Keskeisessä asemassa ovat confidence ja support tunnusluvut: ensimmäinen kertoo tuotteen Y ostotodennäköisyyden kun X on jo ostettu ja jälkimmäinen yhdistelmän X,Y todennäköisyyden.

Kysymyksen 2 osalta on myös mahdollista ennustaa mallinnuksen kautta todennäköisimmät ostajat.

Case 2: Tiedetään, mikä olisi optimaalinen tarjottava tuote kullekin asiakkaalle.

Monesti tiedetään tai on päätetty (vaikkapa osana kampanjaa), mitä tuotetta kannattaa tarjota ja keille asiakkaille. Tällöin ristiinmyynti muistuttaa suuresti uusmyyntiä, kohdejoukko vain on jokin jo olemassa olevian asiakkaiden osajoukko. Analytiikan keskeinen anti on löytää ne asiakkaat, jotka ovat todennäköisimpiä ostajia. Mallinnustekniikat ovat käytännössä samoja kuin uusmyynnissä.

Suurimpana erona uusmyyntiin se, että ristiinmyynnissä asiakkaan aiempi ostohistoria on tiedossa. Siksi myynnin todennäköisyyttä voidaan ennustaa jopa ilman asiakastietoja pelkkien vanhojen tuotteiden ostotietojen perusteella.

Case 3: Haluttaisiin ristiinmyydä kokonaan uutta tuotetta.

Jos halutaan ristiinmyydä jotain kokonaan uutta tuotetta, nousee haasteeksi se, ettei historian perusteella voida suoraan päätellä, ketkä olisivat todennäköisimpiä ostajia. Haaste voidaan ratkaista kahdella tavalla:

1) Käytetään samankaltaista tuotetta verrokkina ja päätellään ostamistodennäköisyys sen pohjalta tehdyllä mallinnuksella.
2) Jos verrokkia ei löydy, myydään uutta tuotetta satunnaisesti valituille 10 000 asiakkaalle ja perustetaan ristiinmyyntitodennäköisyyden ennustaminen näin saatuihin tuloksiin.

Ristiinmyyntitodennäköisyyden ennustaminen

Kaikissa edellisissä tapauksissa yksi keskeinen kysymys on se, ketkä asiakkaat ostavat todennäköisimmin uuden tuotteen. Analytiikan keinoin voidaan tuottaa tähän vastaus mallintamalla ostamisen todennäköisyyttä niiden asiakkaiden pohjalta, jotka ovat jo aiemmin ostaneet kyseisen uuden tuotteen. Tämän jälkeen löydettyä mallia eli ostotodennäköisyyden riippuvuutta asiakkaan ominaisuuksista sekä hänen ostohistoriastaan sovelletaan niihin asiakkaisiin, jotka eivät vielä ole uutta tuotetta ostaneet.

Ostotodennäköisyyden ennustamisen työvaiheet ovat tyypillisesti seuraavat:

1. Datan saatavuuden ja laadun varmistaminen

Jotta ostamisen todennäköisyyttä voidaan ennustaa, on oltava saatavilla dataa olemassa olevien asiakkaiden ostokäytöksestä sekä asiakkaiden ominaisuuksista. Usein tiedot haetaan analytiikkaan soveltuvasta tietokannasta. Jos kantaa ei ole, voi sellaisen rakentaminen olla osa projektia. Datan laatuun liittyvät kysymykset (puuttuvat, virheelliset ja ristiriitaiset arvot jne.) on järkevintä ratkaista samalla osana tätä työvaihetta.

2. Muuttujien muunnokset ja datan muokkaus

Monesti dataa halutaan muokata johtamalla vanhoista kentistä uusia tai aggrekoimalla dataa uudelle tasolle. Voi esimerkiksi osoittautua, että ikä vaikuttaa ostotodennäköisyyteen epälineaarisesti, jolloin ennustamisessa voidaan käyttää vaikkapa iän neliöjuurta.

3. Muuttujien valinta

Melkein aina on saatavilla paljon enemmän kenttiä ostamisen ennustamiseen kuin on tarpeen. Tällöin joukkoa karsitaan valitsemalla mallinnukseen kaikkein parhaiten ostamista ennustavat kentät. Monesti muuttujien valinta sulautetaan osaksi mallinnusprosessia.

4. Kilpailevien mallien teko

Tyypillisessä ristiinmyynnin ennustamisprojektissa kokeillaan useampaa potentiaalista mallinnustapaa. Yleisiä ovat esim. päätöspuu, logistinen regressio ja neuroverkko. Ristiinvalidoinnilla testataan, kuinka hyvin kukin malli pystyy ennustamaan ostamista. Tyypillisiä osumatarkkuuden mittareita ovat Area Under Curve (AUC) ja Accuracy. Osumatarkkuudeltaan paras malli valitaan ennustamaan ostamista. Malleja voidaan myös yhdistellä.

5. Iterointi

Usein mallinnus paljastaa asiakkaiden ostokäyttäytymisestä asioita, joita ei tiedetty ennalta. Tällöin voidaan esimerkiksi haluta johtaa havaintojen perusteella uusia kenttiä ja tehdä vaiheet 2 – 4 uudelleen niin kauan, että osumatarkkuuteen ei saada enää parannusta.

6. Parhaan mallin hyödyntäminen

Mallinnuksen keskeisenä lopputulemana on sääntö, jolla asiakkaan ominaisuuksista ja hänen ostohistoriastaan voidaan päätellä hänen todennäköisyytensä ostaa uusi tuote. Tätä sääntöä sovelletaan niihin asiakkaisiin, jotka eivät ole vielä ostaneet uutta tuotetta. Näin heidän joukostaan voidaan löytää todennäköisimmin ostavat asiakkaat.

7. Kohdejoukon valinta

Kun kaikille kiinnostaville asiakkaille on muodostettu mallin avulla ostotodennäköisyydet, on edessä valinnan paikka: markkinoidako uutta tuotetta isolle joukolle matalamman ostotodennäköisyyden asiakkaita vai valitaanko pienempi joukko suuremman ostotodennäköisyyden asiakkaita. Ensimmäisessä tapauksessa toteutuu isompi myynti, mutta markkinoinnin kulut per myynti ovat myös suuremmat, koska kohdejoukkoon päätyy enemmän asiakkaita, jotka eivät oikeasti halua ostaa uutta tuotetta. Jälkimmäisessä tapauksessa markkinoinnin teho on suurempi, mutta pienemmästä kohdejoukosta johtuen toteutuu vähemmän uutta liikevaihtoa.

Rajan asettaminen on liiketoiminnallinen päätös ja analytiikan tulokset osoittavat sen, mikä on vaihtosuhde kohdejoukon koon ja markkinoinnin tehon välillä.

8. Mallinnushistorian tallentaminen (optionaalinen)

Mallinnuksen päätteeksi kannattaa malli ja sitä kuvailevat tiedot aina tallettaa. Yritys saa nimittäin maksimihyödyn irti analytiikasta kun muutkin näkevät mitä malleja aiemmin on tehty ja kenen toimesta. Näin yrityksen mallinnustyö ei kierretä kehää, vaan tieto ja osaaminen kumuloituu.

9. Mallin osumatarkkuuden seuranta (optionaalinen)

Kun malli on otettu käyttöön, kannattaa myös aloittaa sen osumatarkkuuden systemaattinen seuranta. Käytännössä voidaan tehdä esimerkiksi raportti, joka vertaa ostivatko mallin mukaan todennäköisimmin ostavat asiakkaat todella tuotteen. Jos kyllä, mallilla on hyvä osumatarkkuus. Jos ei, malli kaipaa päivitystä.

10. Automaattiset hälytykset (optionaalinen)

Seurantaan kannattaa myös rakentaa hälytykset: jos mallin ennusteet eivät osu kohdalleen, voidaan mallin tehneelle analyytikolle lähettää automaattisesti vaikkapa sähköpostiin kehoitus päivittää malli. Näin toimimalla ristiinmyyntianalytiikkaa harjoittava yritys tekee kuitenkin melko työlästä mallinnusta juuri silloin kun se on tarpeen ja juuri oikean mallin osalta – eikä yhtään enempää.

Esimerkki mallinnuksesta RapidMinerissa

Alla on esimerkki ristiinmyynnin ostotodennäköisyyden mallinnusprosessista RapidMinerissa. Ensin mallinnusdataan tehdään mallinnuksen kannalta tarpeellisia lisäkenttiä (”Attributes” operaattori). Tämän jälkeen itse mallinnukseen valitaan ostotodennäköisyyttä ennustavat kentät ”Informatioin Gain Ratio” -kriteerin perusteella (”Informatioin Gain Ratio” operaattori tuottaa tunnusluvut, joilla tunnistetaan ostamista parhaiten ennustavat kentät ja ”Select by weights” operaattori tekee itse valinnan):

”Compare ROCs” operaattorin sisällä verrataan neljää kilpailevaa mallia: Naive Bayes, päätöspuu ja logistinen regressio (Operaattori tekee samalla myös ristiinvalidoinnin kunkin mallin osumatarkuuden mittaamiseksi.) Alin, eli ”Vote” –operaattori on yhdistelmä kolmesta ylemmästä mallista. Se ennustaa ostamisen tapahtuvan, jos enemmistö kolmesta mallista on sitä mieltä:

ROC-käyrä vetää yhteen neljän mallin suorituskyvyn: mitä ylempänä käyrä kulkee, sitä suurempi on AUC-tunnusluku ja sitä paremmin malli ennustaa ristiinmyyntiä. Huomataan, että kolmen mallin tulokset yhdistävä ”Vote” yhdistelmämalli on paras:

Tämän mallinnusprosessin perusteella ostotodennäköisyyttä siis kannattaisi jatkossa ennustaa ”Vote” yhdistelmämallilla.

Yhteenveto

Blogisarjan yhteenvetona voi todeta että ajoittain ristiinmyynti saattaa olla melkoisen heikosti järjestetty ja että tässä analytiikka voi auttaa monella tavalla:

1. Voidaan arvioida, kenelle ylipäätään kannattaa ristiinmyydä.
2. Tunnistetaan tilanteet, joissa ei kannata ristiinmyydä ollenkaan.
3. Voidaan arvioida, mitä tuotetta kullekin asiakkaalle kannattaa ristiinmyydä.
4. Markkinoinnin tehoa voidaan nostaa, kun markkinointiponnistelut voidaan kohdistaa todennäköisimmin ostaviin asiakkaisiin satunnaisvalinnan sijasta.

– Lasse Liukkonen ja Antti Ollikainen