Mange lurer på hvordan vi analyserer oss frem til de beste vinene som lanseres i vinslippene til Vinmonopolet. Det er ingen heksekunst og noe som alle med litt erfaring med Excel kan gjennomføre. Vi ønsker med dette å dele vår kunnskap om hvordan du man kan lage en gjenbrukbar BI løsning for rask og effektiv analyse av vinanmeldelser for å komme frem til de beste kjøpene.
Vi ønsker oss en gjenbrukbar BI løsning for rask og effektiv analyse av alle anmeldelser av nye viner som blir lansert ved et av vinslippene til Vinmonopolet.
Mulige bruksområder vil være:
For å støtte dette vil vi implementere:
|
Avisartikkel i Bergens Tidende om Burgund vinslippet i 2018.
|
Introduksjon - målsetning, verktøy og metode
På bakgrunn av informasjon om nye viner fra Vinmonopolet og anmeldelser av vinene i forskjellige nettaviser ønsker vi å lage en nyhetsartikkel om vinen som kommer best ut i vintestene.
Vi skal ut utføre analysen med Microsoft Excel 2013 med følgende add-ins:
- Microsoft Office PowerPivot for Excel 2013
- Microsoft Power Query for Excel
Dette er de ulike stegene i analyseprosessen:
Finn kildedata - surf på nettet
I analysen for september 2014 lastet vi ned informasjon om vinene fra Vinmonopolet:
- Vinmonopolet - Nye produkter i september
- Vinmonopolet - Nyheter i basis-, parti- og testutvalget september 2014.xlsx
- Vinmonopolet - Nyheter i bestillingsutvalget september 2014.xlsx
- Vinmonopolet - Nyheter i basis-, parti- og testutvalget september 2014.pdf
- Vinmonopolet - Nyheter i bestillingsutvalget september 2014.pdf
I analysen for september 2014 benyttet vi anmeldelser fra de følgende testene av vin:
- Aperitif - Nyhetene på polet september 2014 - hvitvin og musserende
- Aperitif - Nyhetene på polet september 2014 - rødvin
- Aperitif - Nyhetene på polet september 2014 - øl
- DN - Polets vinøse øyhopping
- DN - Tørt fra Breuer
- DN - Rød nedtur
- DN - Tyske stjerner
- DN - Modne toppburgundere
- DN - Høstslipp med glipp
- Adressa - September 2014 - Verdenspremiere på Polet
- Dagbladet - Polets høstmeny - Her er vinene du må velge
- Vinofil - Nyhetsslippet September 2014
- DinMat - Polet satser på topp-tyskere i september
- Klikk - Nye viner på polet
- ØB - Dette er nytt på polet i høst
Tilrettelegg kildedata - lag en csv-fil for hver anmelder
Butikkategorier
Butikkene til Vinmonopolet er delt inn i syv kategorier, 1-7, på grunnlag av salgstall. Kategori 7-butikkene er de største og fører om lag 1 850 produkter. I tillegg har Vinmonopolet også en nettbutikk (se fanen Vareutvalg), med rundt 12 000 varer.
Per 1. juli 2014 hadde Vinmonopolet 292 butikker fordelt over hele Norge.
Med syv forskjellige butikk-kategorier med ulikt tilbud av varer, kan noen komme i tvil om hvor en kan kjøpe hva av polvarer. Bruk nettbutikken til å finne ut lagerstatus for varen du er på jakt etter i din butikk.
Se oversikt over hvilken kategori ditt nærmeste Vinmonopol er i under relaterte filer nederst på siden.
Det som til en hver tid finnes av testvarer og spesielle partivarer kommer i tillegg. Per i dag er det cirka 250 merker til sammen i disse to gruppene. Bestillingsutvalget med sine 8 000 - 9 000 merker kommer også som et tilbud til kunder som kan vente noen dager på leveransen. Du finner alle produkter i nettbutikken under fanen Vareutvalg.
Butikkene til Vinmonopolet er delt inn i syv kategorier, 1-7, på grunnlag av salgstall. Kategori 7-butikkene er de største og fører om lag 1 850 produkter. I tillegg har Vinmonopolet også en nettbutikk (se fanen Vareutvalg), med rundt 12 000 varer.
Per 1. juli 2014 hadde Vinmonopolet 292 butikker fordelt over hele Norge.
Med syv forskjellige butikk-kategorier med ulikt tilbud av varer, kan noen komme i tvil om hvor en kan kjøpe hva av polvarer. Bruk nettbutikken til å finne ut lagerstatus for varen du er på jakt etter i din butikk.
Se oversikt over hvilken kategori ditt nærmeste Vinmonopol er i under relaterte filer nederst på siden.
Det som til en hver tid finnes av testvarer og spesielle partivarer kommer i tillegg. Per i dag er det cirka 250 merker til sammen i disse to gruppene. Bestillingsutvalget med sine 8 000 - 9 000 merker kommer også som et tilbud til kunder som kan vente noen dager på leveransen. Du finner alle produkter i nettbutikken under fanen Vareutvalg.
Anmeldelser som en kildefil
Innholdet på nettsiden som er relatert til de enkelte anmeldelsene blir overført til en semikolon separert tekstfil slik at den enkelt kan lastes inn til Excel for konsolidering med vinanmeldelser fra andre kilder.
Hvilke kolonner som er med i CSV-filen er avhengig av hva kilden ar å by på, men de fleste nettsidene vil inneholde varenummer, varenavn, pris, land/distrikt, smaksnotat, score (terningkast, poeng eller stjerner).
Filen lagres med et filnavn som angir kilden, f.eks. vil anmeldelsene fra Vinofil bli lagret i csv-filen vinofil.csv.
Innholdet på nettsiden som er relatert til de enkelte anmeldelsene blir overført til en semikolon separert tekstfil slik at den enkelt kan lastes inn til Excel for konsolidering med vinanmeldelser fra andre kilder.
Hvilke kolonner som er med i CSV-filen er avhengig av hva kilden ar å by på, men de fleste nettsidene vil inneholde varenummer, varenavn, pris, land/distrikt, smaksnotat, score (terningkast, poeng eller stjerner).
Filen lagres med et filnavn som angir kilden, f.eks. vil anmeldelsene fra Vinofil bli lagret i csv-filen vinofil.csv.
Her ser vi at ikke alle kildene har den samme informasjonen om vinen i anmeldelsene sine.
I tillegg bruker kildene forskjellige måter (terning/poeng/stjerner) for å score en vin.
I tillegg bruker kildene forskjellige måter (terning/poeng/stjerner) for å score en vin.
Konsolider kildedata - lag en tabell for viner og en for anmeldelser
Når en vin presenteres på bloggen så ønsker vi å fortelle historien bak vinen samtidig som vi vil lede leseren i riktig retning dersom personen ønsker å finne ut mer om produsenten, vinen eller vindistriktet som vinen kommer fra.
I blogginnlegget vil vi ha en lenke til produsenten og vindistriktet. Denne informasjonen hentes fra Vinmonopolets nettside som vi så senere finner lenkene ved å søke oss frem på internett.
Vi har altså behov for å hente følgende informasjon fra nettsidene til anmelder; produsent url og distrikt url.
I blogginnlegget vil vi ha en lenke til produsenten og vindistriktet. Denne informasjonen hentes fra Vinmonopolets nettside som vi så senere finner lenkene ved å søke oss frem på internett.
Vi har altså behov for å hente følgende informasjon fra nettsidene til anmelder; produsent url og distrikt url.
Når en vin presenteres på bloggen så ønsker vi å fortelle historien bak vinen samtidig som vi vil lede leseren i riktig retning dersom personen ønsker å finne ut mer om produsenten, vinen eller vindistriktet som vinen kommer fra.
De ulike anmelderne vil ha noe forskjellig skrivemåte på navnet til vinen. På bloggen vil alltid vinens navn hentes fra Vinmonopolets informasjonssiden for vinen.
I blogginnlegget vil vi ha en lenke til produsenten og vindistriktet. Denne informasjonen hentes fra Vinmonopolets nettside som vi så senere finner lenkene ved å søke oss frem på internett.
Drikkevindet som oppgis for en vin på bloggen er en sammenstilling av informasjon om lagringsgrad fra Vinmonopolets nettside og anbefalinger som vi finner i de enkelte vinanmeldelsene.
Vi har altså behov for å hente følgende informasjon fra nettsidene til Vinmonopolet; varenavn, distrikt, lagringsgrad og produsent.
De ulike anmelderne vil ha noe forskjellig skrivemåte på navnet til vinen. På bloggen vil alltid vinens navn hentes fra Vinmonopolets informasjonssiden for vinen.
I blogginnlegget vil vi ha en lenke til produsenten og vindistriktet. Denne informasjonen hentes fra Vinmonopolets nettside som vi så senere finner lenkene ved å søke oss frem på internett.
Drikkevindet som oppgis for en vin på bloggen er en sammenstilling av informasjon om lagringsgrad fra Vinmonopolets nettside og anbefalinger som vi finner i de enkelte vinanmeldelsene.
Vi har altså behov for å hente følgende informasjon fra nettsidene til Vinmonopolet; varenavn, distrikt, lagringsgrad og produsent.
Når en vin presenteres på bloggen så ønsker vi å gi en enkel og kortfattet beskrivelse av informasjonen som vi henter fra Vinmonopolet.
Beskrivelse av vinene i bestillingsutvalget er foretatt av grossistene. Produktbeskrivelsene av varer i basis-, parti- og testutvalget er, etter sensorisk prøving og kvalitetskontroll, foretatt av Vinmonopolet.
For hver anmeldelse konstruerer vi en beskrivelse sammensatt av smaksnotat, poeng, terningkast og stjerner.
Under analysen vil vi inkludere varebeskrivelse og beskrivelse av anmeldelse som felter i pivot tabellen og bruke score som pivot verdi (måling).
Vi har altså behov for å hente følgende informasjon fra nettsidene til Vinmonopolet; varebeskrivelse, pris, varenummer, varetype, farge, lukt, smak, passer til, distrikt og lagringsgrad.
Beskrivelse av vinene i bestillingsutvalget er foretatt av grossistene. Produktbeskrivelsene av varer i basis-, parti- og testutvalget er, etter sensorisk prøving og kvalitetskontroll, foretatt av Vinmonopolet.
- Dersom vinen har en varebeskrivelse så brukes denne som utgangspunkt, så legger vi til informasjon om pris, varenummer, varetype, passer til og lagringsgrad.
- Dersom ikke vinen har en varebeskrivelse så genererer vi en ved å slå sammen informasjon om farge, lukt, smak, pris, varenummer, varetype, passer til og lagringsgrad.
For hver anmeldelse konstruerer vi en beskrivelse sammensatt av smaksnotat, poeng, terningkast og stjerner.
Under analysen vil vi inkludere varebeskrivelse og beskrivelse av anmeldelse som felter i pivot tabellen og bruke score som pivot verdi (måling).
Vi har altså behov for å hente følgende informasjon fra nettsidene til Vinmonopolet; varebeskrivelse, pris, varenummer, varetype, farge, lukt, smak, passer til, distrikt og lagringsgrad.
Når en vin presenteres på bloggen så ønsker vi å presentere en kortfattet beskrivelse av hver anmeldelse av vinen.
Informasjon om varenummer, varenavn og pris i en anmeldelse vil bli brukt til å bestemme (gjenkjenne) hvilken vin anmeldelsen gjelder for.
På bloggen presenteres anmelders smaksnotat sammen med terning/poeng/stjerner som angir anmelders originale score av vinen.
Vi har altså behov for å hente følgende informasjon fra nettsidene til anmelder; varenummer, varenavn, terning, poeng, stjerner, pris, og smaksnotat.
Informasjon om varenummer, varenavn og pris i en anmeldelse vil bli brukt til å bestemme (gjenkjenne) hvilken vin anmeldelsen gjelder for.
På bloggen presenteres anmelders smaksnotat sammen med terning/poeng/stjerner som angir anmelders originale score av vinen.
Vi har altså behov for å hente følgende informasjon fra nettsidene til anmelder; varenummer, varenavn, terning, poeng, stjerner, pris, og smaksnotat.
Analysemodell - lag en tabell for viner og en for anmeldelser
Detaljeringsgraden for fakta tabellen Score er en rad for hver vin/vinslipp/anmeldelse. Dette betyr at vi kan analysere viner begrenset til et gitt vinslipp og se alle anmeldelsene samt den gjennomsnittlige scoren for hver vin som er med i vinslippet.
Antall anmeldelser knyttet opp mot det siste slippet blir et problem fordi det bare kan gjelde for et spesifikt vinslipp. Hvordan løser vi den utfordringen?
All informasjon om selve vinen i dimensjonstabellen Anmeldelse vil skules fordi vi ønsker at bruker av modellen skal bruke kolonnene i dimensjonstabellen Vin.
Ingen av Key kolonnene vil være synlig fordi de er programmeringstekniske verdier.
Antall anmeldelser knyttet opp mot det siste slippet blir et problem fordi det bare kan gjelde for et spesifikt vinslipp. Hvordan løser vi den utfordringen?
All informasjon om selve vinen i dimensjonstabellen Anmeldelse vil skules fordi vi ønsker at bruker av modellen skal bruke kolonnene i dimensjonstabellen Vin.
Ingen av Key kolonnene vil være synlig fordi de er programmeringstekniske verdier.
Analyse - beste viner med minst 3 anmeldelser
Alternativ løsning - kan dette løses på en enklere måte?
Forbedringer - kan løsningen lages bedre?
Endringer som ville forbedre løsningen
- Maskinell parsing av HTML for å laste inn anmeldelsene
- Laste inn smaksnotater fra anmeldelser med undersider
- Laste inn detaljert informasjon av vinene fra Vinmonopolet
- Vasking av varenummer med bruk av Master Data Management
- Lage en ønskeliste av interessante viner
- Lage en innkjøpsliste som kan sendes som e-post