BEDREINNSIKT
  • Velkommen
  • Analyse
    • Prosess >
      • Design Workshop
    • Metode >
      • Automatisert utrulling >
        • Skript for utrulling
        • Skript for kloning
      • Oversettelse
      • Sertifisering 70-778
      • Sertifisering 70-779
      • Sertifisering DP-200
      • Sertifisering DA-100
    • Teknologi >
      • Power Apps >
        • Navnestandard
    • Meetups >
      • Designforslag
      • Datafangst hos Evry
      • Design Workshop
      • Big Data and AI
      • UX in BI
    • Datasett >
      • Vinmonopolet
      • Språkkoder
    • Løsninger
    • Oppslagsverk >
      • Konvertering av datatyper
      • Navn på formler i Excel
      • Engelske begrep oversatt
  • Sider
    • Skjema for smaksnotater
    • Aromahjul for sider
    • Unoter i sideren
    • Eikjohistorien
    • Beskjæring
    • Eksamensspørsmål
    • Plantevern
    • Integrert plantevern
    • Skadegjørere
    • Epledyrking >
      • Innhøsting av epler
    • Siderkurs
    • Siderslipp >
      • Juli 2020
      • Juni 2020
      • Mars 2020
      • November 2019
      • September 2019
      • Juli 2019
      • Mai 2019
    • Smaksnotater
    • Eikjo Sider >
      • Eikjo Sider 2023
      • Eikjo Sider 2021
      • Eikjo Sider 2020
      • Eikjo Sider 2019
      • Eikjo Sider 2018
      • Eikjo Sider 2017
      • Soga om Eikjo >
        • Segn og fakta fra Luster
      • Siderproduksjon >
        • Pressing av epler
        • Fruktig sider
        • Tilsetting av sukker
        • Steinarbeid
        • Sagbruk
        • Dyrking av epler
        • Pressing av epler
        • Setting av sider
        • Klargjøring av ståltanker
        • Overvåking og kontroll av gjæringen
        • Filtrering av sider
        • Gjæringsprosessen
        • Taping på flasker
      • Sideroppskrifter
    • Norsk Sider
  • Vin
    • Vinkurs >
      • Mat og vin
      • Vinstil og kvalitet
      • Musserende vin
      • Burgund
      • Bordeaux
      • Rhone
    • Vinslipp >
      • Burgund 2023
      • Champagne 2020
      • Burgund 2020
      • Champagne 2019
      • Burgund 2019
      • Burgund 2018
      • Januar 2018
      • Bordeaux 2017
      • Rhône 2017
      • Italia 2017
      • September 2017
      • Mai 2017
      • Tyskland 2017
      • Burgund 2017
      • November 2015
      • November 2014
      • September 2014
      • Juli 2014
  • Juleøl
    • Hva er juleøl?
    • Juleølkalender 2023
    • Juleølkalender 2022
    • Juleølkalender 2021
    • Beste juleøl 2020
    • Beste juleøl 2019
    • Juleølkalender 2019
    • Beste juleøl 2018
    • Beste juleøl 2017
    • Beste juleøl 2016
    • Beste juleøl 2015
    • Beste juleøl 2014
    • Beste juleøl 2013
  • Musikk
    • Logic over Zoom
    • SSL 2+ lydkort
    • Komplete Kontrol
    • EZ Drummer 2
    • MIDI Filer
  • Ta kontakt
    • Curriculum Vitae
    • Memorarer
    • Ukens ildsjel
  • Blogg

Hva er det beste vinkjøpet?

     last ned presentasjonen
CHAMPAGNE-VINSLIPP 2019
Mange lurer på hvordan vi analyserer oss frem til de beste vinene som lanseres i vinslippene til Vinmonopolet. Det er ingen heksekunst og noe som alle med litt erfaring med Excel kan gjennomføre. Vi ønsker med dette å dele vår kunnskap om hvordan du man kan lage en gjenbrukbar BI løsning for rask og effektiv analyse av vinanmeldelser for å komme frem til de beste kjøpene.
Vi ønsker oss en gjenbrukbar BI løsning for rask og effektiv analyse av alle anmeldelser av nye viner som blir lansert ved et av vinslippene til Vinmonopolet.
Mulige bruksområder vil være:
  • Beste kjøp: Vi ønsker a finne det beste kjøpet i vår prisklasse
  • Middagsvin: Vi ønsker å servere den beste vinen til gjestene våre
  • Til kjelleren: Vi ønsker de beste kandidatene til å legge i kjelleren
  • Vindistrikt: Vi ønsker å prøve en ny vin fra vårt favorittdistrikt

For å støtte dette vil vi implementere:
  • En standard metode for å laste inn kildedata for vin og anmeldelser
  • En standard metode for å konsolidere anmeldt vin og score
  • En datamodell som lar brukerne å utføre analysere og lage egne rapporter
Picture
Avisartikkel i Bergens Tidende om Burgund vinslippet i 2018.

Introduksjon - målsetning, verktøy og metode

​På bakgrunn av informasjon om nye viner fra Vinmonopolet og anmeldelser av vinene i forskjellige nettaviser ønsker vi å lage en nyhetsartikkel om vinen som kommer best ut i vintestene.
Picture
Vi skal ut utføre analysen med Microsoft Excel 2013 med følgende add-ins:
  • Microsoft Office PowerPivot for Excel 2013
  • Microsoft Power Query for Excel
Picture
​Dette er de ulike stegene i analyseprosessen:
Picture

Finn kildedata - surf på nettet

I analysen for september 2014 lastet vi ned informasjon om vinene fra Vinmonopolet:
  • Vinmonopolet - Nye produkter i september
  • Vinmonopolet - Nyheter i basis-, parti- og testutvalget september 2014.xlsx
  • Vinmonopolet - Nyheter i bestillingsutvalget september 2014.xlsx
  • Vinmonopolet - Nyheter i basis-, parti- og testutvalget september 2014.pdf
  • Vinmonopolet - Nyheter i bestillingsutvalget september 2014.pdf
Picture
I analysen for september 2014 benyttet vi anmeldelser fra de følgende testene av vin:
  • Aperitif - Nyhetene på polet september 2014 - hvitvin og musserende
  • Aperitif - Nyhetene på polet september 2014 - rødvin
  • Aperitif - Nyhetene på polet september 2014 - øl
  • DN - Polets vinøse øyhopping
  • DN - Tørt fra Breuer
  • DN - Rød nedtur
  • DN - Tyske stjerner
  • DN - Modne toppburgundere
  • DN - Høstslipp med glipp
  • Adressa - September 2014 - Verdenspremiere på Polet
  • Dagbladet - Polets høstmeny - Her er vinene du må velge
  • Vinofil - Nyhetsslippet September 2014
  • DinMat - Polet satser på topp-tyskere i september
  • Klikk - Nye viner på polet
  • ØB - Dette er nytt på polet i høst
Picture

​Tilrettelegg kildedata - lag en csv-fil for hver anmelder

Picture
Picture
Picture
Butikkategorier

Butikkene til Vinmonopolet er delt inn i syv kategorier, 1-7, på grunnlag av salgstall. Kategori 7-butikkene er de største og fører om lag 1 850 produkter. I tillegg har Vinmonopolet også en nettbutikk (se fanen Vareutvalg), med rundt 12 000 varer.

Per 1. juli 2014 hadde Vinmonopolet 292 butikker fordelt over hele Norge. 

Med syv forskjellige butikk-kategorier med ulikt tilbud av varer, kan noen komme i tvil om hvor en kan kjøpe hva av polvarer. Bruk nettbutikken til å finne ut lagerstatus for varen du er på jakt etter i din butikk.

Se oversikt over hvilken kategori ditt nærmeste Vinmonopol er i under relaterte filer nederst på siden.
 
Det som til en hver tid finnes av testvarer og spesielle partivarer kommer i tillegg. Per i dag er det cirka 250 merker til sammen i disse to gruppene. Bestillingsutvalget med sine 8 000 - 9 000 merker kommer også som et tilbud til kunder som kan vente noen dager på leveransen. Du finner alle produkter i nettbutikken under fanen Vareutvalg.
Picture
Anmeldelser som en kildefil

Innholdet på nettsiden som er relatert til de enkelte anmeldelsene blir overført til en semikolon separert tekstfil slik at den enkelt kan lastes inn til Excel for konsolidering med vinanmeldelser fra andre kilder.

Hvilke kolonner som er med i CSV-filen er avhengig av hva kilden ar å by på, men de fleste nettsidene vil inneholde varenummer, varenavn, pris, land/distrikt, smaksnotat, score (terningkast, poeng eller stjerner).

Filen lagres med et filnavn som angir kilden, f.eks. vil anmeldelsene fra Vinofil bli lagret i csv-filen vinofil.csv.
Picture
​Her ser vi at ikke alle kildene har den samme informasjonen om vinen i anmeldelsene sine.

I tillegg bruker kildene forskjellige måter (terning/poeng/stjerner) for å score en vin.
Picture
Picture

​Konsolider kildedata - lag en tabell for viner og en for anmeldelser

Når en vin presenteres på bloggen så ønsker vi å fortelle historien bak vinen samtidig som vi vil lede leseren i riktig retning dersom personen ønsker å finne ut mer om produsenten, vinen eller vindistriktet som vinen kommer fra.

I blogginnlegget vil vi ha en lenke til produsenten og vindistriktet. Denne informasjonen hentes fra Vinmonopolets nettside som vi så senere finner lenkene ved å søke oss frem på internett.

Vi har altså behov for å hente følgende informasjon fra nettsidene til anmelder; produsent url og distrikt url.
Picture
Når en vin presenteres på bloggen så ønsker vi å fortelle historien bak vinen samtidig som vi vil lede leseren i riktig retning dersom personen ønsker å finne ut mer om produsenten, vinen eller vindistriktet som vinen kommer fra.

De ulike anmelderne vil ha noe forskjellig skrivemåte på navnet til vinen. På bloggen vil alltid vinens navn hentes fra Vinmonopolets informasjonssiden for vinen.

I blogginnlegget vil vi ha en lenke til produsenten og vindistriktet. Denne informasjonen hentes fra Vinmonopolets nettside som vi så senere finner lenkene ved å søke oss frem på internett.

Drikkevindet som oppgis for en vin på bloggen er en sammenstilling av informasjon om lagringsgrad fra Vinmonopolets nettside og anbefalinger som vi finner i de enkelte vinanmeldelsene.

Vi har altså behov for å hente følgende informasjon fra nettsidene til Vinmonopolet; varenavn, distrikt, lagringsgrad og produsent.
Picture
Når en vin presenteres på bloggen så ønsker vi å gi en enkel og kortfattet beskrivelse av informasjonen som vi henter fra Vinmonopolet.

Beskrivelse av vinene i bestillingsutvalget er foretatt av grossistene. Produktbeskrivelsene av varer i basis-, parti- og testutvalget er, etter sensorisk prøving og kvalitetskontroll, foretatt av Vinmonopolet.
  • Dersom vinen har en varebeskrivelse så brukes denne som utgangspunkt, så legger vi til informasjon om pris, varenummer, varetype, passer til og lagringsgrad.
  • Dersom ikke vinen har en varebeskrivelse så genererer vi en ved å slå sammen informasjon om farge, lukt, smak, pris, varenummer, varetype, passer til og lagringsgrad.

For hver anmeldelse konstruerer vi en beskrivelse sammensatt av smaksnotat, poeng, terningkast og stjerner.

Under analysen vil vi inkludere varebeskrivelse og beskrivelse av anmeldelse som felter i pivot tabellen og bruke score som pivot verdi (måling).

Vi har altså behov for å hente følgende informasjon fra nettsidene til Vinmonopolet; varebeskrivelse, pris, varenummer, varetype, farge, lukt, smak, passer til, distrikt og lagringsgrad.
Picture
​Når en vin presenteres på bloggen så ønsker vi å presentere en kortfattet beskrivelse av hver anmeldelse av vinen.

Informasjon om varenummer, varenavn og pris i en anmeldelse vil bli brukt til å bestemme (gjenkjenne) hvilken vin anmeldelsen gjelder for.

På bloggen presenteres anmelders smaksnotat sammen med terning/poeng/stjerner som angir anmelders originale score av vinen.

Vi har altså behov for å hente følgende informasjon fra nettsidene til anmelder; varenummer, varenavn, terning, poeng, stjerner, pris, og smaksnotat.
Picture
Picture

​Analysemodell - lag en tabell for viner og en for anmeldelser

​Detaljeringsgraden for fakta tabellen Score er en rad for hver vin/vinslipp/anmeldelse. Dette betyr at vi kan analysere viner begrenset til et gitt vinslipp og se alle anmeldelsene samt den gjennomsnittlige scoren for hver vin som er med i vinslippet.

Antall anmeldelser knyttet opp mot det siste slippet blir et problem fordi det bare kan gjelde for et spesifikt vinslipp. Hvordan løser vi den utfordringen?

All informasjon om selve vinen i dimensjonstabellen Anmeldelse vil skules fordi vi ønsker at bruker av modellen skal bruke kolonnene i dimensjonstabellen Vin.

Ingen av Key kolonnene vil være synlig fordi de er programmeringstekniske verdier.
Picture
Picture
Picture
Picture
Picture
Picture

​Analyse - beste viner med minst 3 anmeldelser

Picture

​Alternativ løsning - kan dette løses på en enklere måte?

Picture
Picture
Picture

​Forbedringer - kan løsningen lages bedre?

Endringer som ville forbedre løsningen
  • Maskinell parsing av HTML for å laste inn anmeldelsene
  • Laste inn smaksnotater fra anmeldelser med undersider
  • Laste inn detaljert informasjon av vinene fra Vinmonopolet
  • Vasking av varenummer med bruk av Master Data Management
  • Lage en ønskeliste av interessante viner
  • Lage en innkjøpsliste som kan sendes som e-post
bedreInnsikt Copyright © 2023
  • Velkommen
  • Analyse
    • Prosess >
      • Design Workshop
    • Metode >
      • Automatisert utrulling >
        • Skript for utrulling
        • Skript for kloning
      • Oversettelse
      • Sertifisering 70-778
      • Sertifisering 70-779
      • Sertifisering DP-200
      • Sertifisering DA-100
    • Teknologi >
      • Power Apps >
        • Navnestandard
    • Meetups >
      • Designforslag
      • Datafangst hos Evry
      • Design Workshop
      • Big Data and AI
      • UX in BI
    • Datasett >
      • Vinmonopolet
      • Språkkoder
    • Løsninger
    • Oppslagsverk >
      • Konvertering av datatyper
      • Navn på formler i Excel
      • Engelske begrep oversatt
  • Sider
    • Skjema for smaksnotater
    • Aromahjul for sider
    • Unoter i sideren
    • Eikjohistorien
    • Beskjæring
    • Eksamensspørsmål
    • Plantevern
    • Integrert plantevern
    • Skadegjørere
    • Epledyrking >
      • Innhøsting av epler
    • Siderkurs
    • Siderslipp >
      • Juli 2020
      • Juni 2020
      • Mars 2020
      • November 2019
      • September 2019
      • Juli 2019
      • Mai 2019
    • Smaksnotater
    • Eikjo Sider >
      • Eikjo Sider 2023
      • Eikjo Sider 2021
      • Eikjo Sider 2020
      • Eikjo Sider 2019
      • Eikjo Sider 2018
      • Eikjo Sider 2017
      • Soga om Eikjo >
        • Segn og fakta fra Luster
      • Siderproduksjon >
        • Pressing av epler
        • Fruktig sider
        • Tilsetting av sukker
        • Steinarbeid
        • Sagbruk
        • Dyrking av epler
        • Pressing av epler
        • Setting av sider
        • Klargjøring av ståltanker
        • Overvåking og kontroll av gjæringen
        • Filtrering av sider
        • Gjæringsprosessen
        • Taping på flasker
      • Sideroppskrifter
    • Norsk Sider
  • Vin
    • Vinkurs >
      • Mat og vin
      • Vinstil og kvalitet
      • Musserende vin
      • Burgund
      • Bordeaux
      • Rhone
    • Vinslipp >
      • Burgund 2023
      • Champagne 2020
      • Burgund 2020
      • Champagne 2019
      • Burgund 2019
      • Burgund 2018
      • Januar 2018
      • Bordeaux 2017
      • Rhône 2017
      • Italia 2017
      • September 2017
      • Mai 2017
      • Tyskland 2017
      • Burgund 2017
      • November 2015
      • November 2014
      • September 2014
      • Juli 2014
  • Juleøl
    • Hva er juleøl?
    • Juleølkalender 2023
    • Juleølkalender 2022
    • Juleølkalender 2021
    • Beste juleøl 2020
    • Beste juleøl 2019
    • Juleølkalender 2019
    • Beste juleøl 2018
    • Beste juleøl 2017
    • Beste juleøl 2016
    • Beste juleøl 2015
    • Beste juleøl 2014
    • Beste juleøl 2013
  • Musikk
    • Logic over Zoom
    • SSL 2+ lydkort
    • Komplete Kontrol
    • EZ Drummer 2
    • MIDI Filer
  • Ta kontakt
    • Curriculum Vitae
    • Memorarer
    • Ukens ildsjel
  • Blogg