SVEUČILIŠTE U ZAGREBU
FILOZOFSKI FAKULTET U ZAGREBU
LEO MRŠIĆ
PRIJEDLOG IZGRADNJE MODELA ZA PODRŠKU ODLUČIVANJU U
TRGOVINI KORIŠTENJEM METODE TRANSFORMACIJE VREMENSKE
SERIJE (REFII) I BAYESOVE LOGIKE
DOKTORSKI RAD
ZAGREB, 2011.
UNIVERSITY OF ZAGREB
FACULTY OF HUMANITIES AND SOCIAL SCIENCES
LEO MRŠIĆ
DECISION SUPPORT MODEL IN RETAIL BASED ON UNIQUE TIME
SERIES TRANSFORMATION METHOD (REFII) AND BAYESIAN LOGIC
DOCTORAL THESIS
ZAGREB, 2011.
Sveučilište u Zagrebu
Filozofski fakultet u Zagrebu
LEO MRŠIĆ
PRIJEDLOG IZGRADNJE MODELA ZA PODRŠKU ODLUČIVANJU U
TRGOVINI KORIŠTENJEM METODE TRANSFORMACIJE VREMENSKE
SERIJE (REFII) I BAYESOVE LOGIKE
DOKTORSKI RAD
Mentori:
prof. dr. sc. Vladimir Mateljan
prof. dr. sc. Božidar Tepeš
Zagreb, 2011.
University of Zagreb
Faculty of Humanities and Social Sciences
LEO MRŠIĆ
DECISION SUPPORT MODEL IN RETAIL BASED ON UNIQUE TIME SERIES
TRANSFORMATION METHOD (REFII) AND BAYESIAN LOGIC
DOCTORAL THESIS
Supervisors:
Prof. Vladimir Mateljan Ph.D.
Prof. Božidar Tepeš Ph.D.
Zagreb, 2011.
I
SAŽETAK
Svrha ovog rada je ponuditi rješenje odnosno metodologiju kojom je moguće analizirati
raznorodne podatke uz pretpostavku da ih je moguće izraziti u obliku vremenske serije na
bazi čega se gradi široko primjenjiv sustav za podršku odlučivanju posebno u trgovini.
Rad opisuje model za podršku odlučivanju u trgovini baziran na odabranim metodama
rudarenja podataka te na ulančavanju metoda rudarenja podataka, u konkretnom slučaju
jedinstvene metode za transformaciju vremenske serije (REFII) i Bayesove mreže.
Promatrajući točku u kojoj se događa kupnja nekog proizvoda rad daje prikaz i analizu
tržišnih zakonitosti sa aspekta tvrtke koja proizvod stavlja na dostup kupcu te kupca koji se
slijedom različitih motiva odlučuje za kupnju. Pojašnjeni su razlozi provođenja istraživanja
ovakve vrste te razlog korištenja predloženog modela i pristupa. Prikazan je pregled radova
povezane tematike te su predstavljene prednosti i ograničenja dosadašnjih radova odnosno
prednosti predloženog pristupa. Prikazana je teoretska osnova na kojoj je izgrađen model uz
komentare vezano na poslovnu i znanstvenu praksu i primjenu u stvarnim okolnostima. U
konačnici, prikazan je model kroz faze nastajanja te je isti testiran na uzorcima podataka o
prodaji odabranih grupa tekstilnih proizvoda i vremenskih prilika kombinirano sa podacima
koji se tiču sezone i kalendara. U zaključnom dijelu navedene se smjernice daljeg razvoja
modela te opisana primjenjivost u različitim granama trgovine.
Ključne riječi
podrška odlučivanju, trgovina, maloprodaja, model podrške odlučivanju, REFII model,
Bayesova mreža, analiza tržišnih zakonitosti, analiza tržišnog trenda, predviđanje tržišnog
trenda
II
ABSTRACT
The purpose of this thesis is to provide a methodology and solution for heterogeneous dana
anaylsis (assuming that data can be expressed in the form of time series) based on which is
possible to build a widely applicable system for decision support especially in retail.
Thesis provides decision support model methodology in retail based on unique time series
transformation method (REFII) and Bayesian network. By observing product purchase
activity thesis gives an overview and analysis of market principles in terms of what needs to
be done by supplier to place product on shelf and, at the same time, what drives potential
customer to search, find and buy that specific product. Furthermore reasons for conducting
research of this kind are explained together with arguments for using proposed methodology,
model and approach. Overview of related works is shown together with presentation of
limitations of previous works and the advantages of the proposed approach. Model theoretical
basis is explained together with overview of business and scientific practice and applicability
in the real market circumstances. Finally, decision supoort model is presented through the
creation stages and it is tested on real-life data samples. Data samples are taken from points-
of-sale and are made of selected groups of textile products, weather conditions data combined
with seasonal (calendar) data. As conclusion model efficiency and usability are explained
both from scientific and business approach. At the end, guidelines for model further
development are exlplained together with model applicability for the various branches of
retail business.
Keywords
decision support, trade, retail, decision support model, REFII model, Bayesian networks,
analysis of market principles, analysis of market trends, forecasting market trends
III
S A D R Ž A J
SAŽETAK I
ABSTRACT II
S A D R Ž A J III
POPIS SLIKA VI
POPIS TABLICA VIII
1. UVOD 1 1.1. Uvod 1 1.2. Cilj rada 2 1.3. Struktura rada 3 1.4. Ciljevi istraživanja 5 1.5. Hipoteze i obrazloženje hipoteza 6 1.6. Metodološki postupci 7 1.7. Očekivan znanstveni doprinos 8
2. POSLOVNI ASPEKT ISTRAŽIVANJA 9 2.1. Primjena i značaj primjene istraživanja 9 2.2. Dosadašnji radovi i modeli te pogled sa aspekta trgovine 12 2.3. Prednosti korištenja REFII modela 15 2.4. Dodatni razlozi za istraživanje ovog pristupa 22 2.5. Pristup odabiru varijabli za model 26
3. DRUŠTVENI ASPEKT ISTRAŽIVANJA 30 3.1. Pojam ponašanja potrošača 30 3.2. Model ponašanja potrošača 32 3.3. Donošenje odluke o kupnji tekstilnih proizvoda 34
3.3.1. Vrste odluka potrošača 35 3.4. Čimbenici koji utječu na potrošače u trgovini tekstilnim proizvodima 36
3.4.1. Ciklus prihvaćanja mode 38 3.5. Ponašanje potrošača i rudarenje podataka 41 3.6. Vjernost potrošača kao prednost ili nedostatak 44 3.7. Smjernice razvoja istraživanja u ovom području 46
4. TEORETSKA OSNOVA ZA FORMIRANJE MODELA 47 4.1. Analiza i predviđanje kao proces 47 4.2. Korelacija i uzročnost 49 4.3. Lorenzova krivulja i Gini indeks 54 4.4. Mjere prosjeka i mjere varijabilnosti 55
4.4.1. Aritmetička sredina 56 4.4.2. Raspon 56 4.4.3. Srednje odstupanje 56 4.4.4. Varijanca i standardna devijacija 56 4.4.5. Koeficijent varijabilnosti 57
4.5. REFII model 57 4.5.1. Princip REFII modela 61 4.5.2. Površina ispod krivulje 64 4.5.3. Područje efikasnosti/neefikasnosti proračuna površine ispod krivulje 67 4.5.4. Proračun koeficijenta kutnog otklona 67 4.5.5. Algoritamska interpretacija proračuna koeficijenata kutnog otklona 70
IV
4.5.6. Prednosti i nedostaci proračuna koeficijenta kutnog otklona 70 4.5.7. Shematski prikaz REFII modela 71 4.5.8. Algoritamska interpretacija REFII modela 72 4.5.9. REFII model – područje efikasnosti / neefikasnosti 74 4.5.10. Kako analizirati vremenske serije posredstvom REFII modela 75
4.6. Bayesova logika i Bayesove mreže 77 4.6.1. Pojam vjerojatnosti 77 4.6.2. Osnove uvjetne vjerojatnosti 78 4.6.3. Bayesova logika 79 4.6.4. Osnvni (naive) Bayesov klasifikator 80 4.6.5. Bayesova mreža (kauzalna mreža) 81 4.6.6. Učenje vjerojatnosti u Bayseovoj mreži 84 4.5.7. Metode pretraživanja u Bayesovim mrežama 87 4.6.8. Primjena Bayesovih mreža 89
5. PRIJEDLOG MODELA ZA PODRŠKU ODLUČIVANJU U TRGOVINI KORIŠTENJEM METODE TRANSFORMACIJE VREMENSKE SERIJE (REFII) I BAYESOVE LOGIKE 91 5.1. Uvod 91 5.2. Paradigma efikasnosti i paradigma dovoljnosti 92 5.3. Izgradnja modela 92
5.3.1. Identifikacija problema 94 5.3.2. Odabir i prikupljanje podataka 95 5.3.3. Pristup i tehnike pretprocesiranja podataka 97 5.3.4. Transformacija u REFII 101 5.3.5. Formiranje modela (Bayesove mreže) 103
5.4. Model u primjeni 108 5.5. Posebnosti modela i analize u području trgovine 109
6. PRIKAZ I ANALIZA REZULTATA PREDLOŽENOG MODELA 111 6.1. Odabir varijabli, provjera odabira varijabli, analiza veza 111 6.2. Bayesova mreža 112 6.3. Scenarij analiza utjecaji na količinu prodaje 114
6.3.1. Definiranje blagog utjecaja 114 6.3.2. Definiranje utjecaja 117 6.3.3. „Što ako“ analiza utjecaja na količinu prodaje 120
6.4. Scenarij analiza utjecaji na realiziranu bruto maržu 121 6.4.1. Definiranje blagog utjecaja 121 6.4.2. Definiranje utjecaja 123 6.4.3. „Što ako“ analiza utjecaja na bruto maržu 125
6.5. Scenarij analiza kombinirani utjecaji na bruto maržu i razinu prodaje 125 6.6. Kako najbolje iskoristiti model 128 6.7. Odabrane metode vizualizacije 128 6.8. Prednosti i nedostatci predloženog modela 130 6.9. Analiza efikasnosti modela 131 6.10. Smjernice budućih istraživanja 132
7. ZAKLJUČAK 135
KORIŠTENA LITERATURA 139 Knjige, znanstveni i stručni radovi 139 Publikacije i časopisi 143 Internet mjesta 144 Video materijali 145 Ostali materijali 145
V
Alati 145
PRILOZI 146 Prilog 1. Državni hidrometeorološki zavod, klimatološki mjesečni izvještaj 146 Prilog 2. Državni hidrometeorološki zavod, minimalne temperature 149 Prilog 3. Državni hidrometeorološki zavod, maksimalne temperature 150 Prilog 4. Podaci o prodaji, uzorak 151 Prilog 5. Podaci o temperaturi, vjetru i kalendaru, transformirani 152 Prilog 6. Oracle PL/SQL skripte, pretprocesiranje podataka, primjer 153 Prilog 7. Oracle PL/SQL skripte, transformacija u REFII, primjer 154 Prilog 8. Vremenska serija, uzorak količina prodaje, normalizirana, prije pretprocesiranja 156 Prilog 9. Vremenska serija, uzorak bruto marža, normalizirana, prije pretprocesiranja 157 Prilog 10. Vremenska serija, uzorak srednja temperatura 158 Prilog 11. Prikaz mreže modela u alatu GeNIe 159 Prilog 12. Prikaz PL/SQL okruženja u alatu T.O.A.D. 160 Prilog 13. Prikaz okruženja u alatu Orange modul for Python 161 Prilog 14. Primjer definiranja poslovnih rizika u trgovini tekstilom 162 Prilog 15. Lokacije prodajnih mjesta poslovnog sustava Tekstilpromet d.d. u Gradu Zagrebu 165 Prilog 16. Matrice korelacije, grafički prikaz odnosa 167 Prilog 17. Popis korištenih kratica i simbola 168
ŽIVOTOPIS 169
OBJAVLJENI RADOVI 170
VI
POPIS SLIKA
SLIKA 1.3.1. Poslovni i društveni aspekt istraživanja i točka kupnje
SLIKA 2.1.1. Primjer agregacije tekstilnih proizvoda
SLIKA 2.3.1. Etape u otkrivanju znanja posredstvom REFII modela
SLIKA 2.3.2. Pretprocesiranje vremenske serije
SLIKA 2.3.3. Metodologija procesuiranja vremenske serije
SLIKA 2.4.1. Odstupanja globalne temperature
SLIKA 2.4.2. DowJones industrial average indeks od 2000. godine do danas
SLIKA 2.5.1. Redovna vremenska prognoza za Zagreb Hrvatska sa prikazanim „feels like“
faktorom
SLIKA 3.2.1. Složeni model ponašanja potrošača
SLIKA 3.3.1. Faze u modnom i tradicionalnom procesu donošenja odluka
SLIKA 3.3.1.1. Kontinuum donošenja odluka o kupnji
SLIKA 3.4.1.1. Uobičajen modni ciklus
SLIKA 3.4.1.2. Uobičajen životni ciklus proizvoda
SLIKA 3.4.1.3. Ciljevi i strategije marketinga i životni ciklus proizvoda
SLIKA 3.4.1.4. Usporedba ciklusa prihvaćanja za klasične i modne proizvode
SLIKA 4.1.1. Procedura tijekom procesa predviđanja
SLIKA 4.3.1. Primjer Lorentzove krivulje
SLIKA 4.5.1. Komponente REFII modela
SLIKA 4.5.2. Uloga koeficijenta kutnog nagiba pravca u REFII modelu
SLIKA 4.5.1.1. Prirast diskontinuirane funkcije
SLIKA 4.5.1.2. Prikaz vremenske serije kroz REFmodel
SLIKA 4.5.2.1. Numerička integracija
SLIKA 4.5.2.2. Grafička interpretacija numeričke integracije u REFII modelu
SLIKA 4.5.4.1. Model proračuna nagiba pravca i duljine kraka u vremenskoj seriji
SLIKA 4.5.7.1. Shema REF II modela
SLIKA 4.6.1.1. Svi slučajevi vjerojatnosti nalaze se između apsolutne sigurnosti (p=1) i
apsolutne nemogućnosti (p=0)
SLIKA 4.6.5.1. Jednostavan grafički prikaz Bayesove mreže
SLIKA 4.6.5.2. Grafički prikaz Bayesove mreže i tablica uvjetne vjerojatnosti
SLIKA 4.6.5.3. Tri vrste veza među elementima mreže
VII
SLIKA 4.6.6.1. Struktura Bayesove mreže, učenje vjerojatnosti parametara mrežne strukture
X → Y
SLIKA 4.6.7.1. Broj mogućih grafova za zadani broj varijabli, kombinatorna eksplozija
SLIKA 5.3.1. Skica modela
SLIKA 5.3.5.1. Bayesova mreža, prodaja količine
SLIKA 5.3.5.2. Prikaz modela u obliku grafikona vjerojatnosti (uzorak prodaja količine
2006.)
SLIKA 5.3.3.1. Kretanje srednje dnevne temperature tijekom 2006. i 2007.
SLIKA 6.1.1. Multigram prikaz veza svih varijabli, debljine linija označavaju snagu veza
(uzorak podaci o ostvarenoj bruto marži)
SLIKA 6.5.1. Vizualizacija podataka za opisanome setove podataka i godine
SLIKA 6.10.1. Raspoložive opcije vezano na odlaganje starih tekstilnih proizvoda
SLIKA 6.7.1. Vizualizacija modela sa 12 atributa, uzorak prodaja
SLIKA 6.7.2. Analiza veza, vizualni prikaz, muška i ženska trikotaža i konfekcija, uzorak
prodaja
VIII
POPIS TABLICA
TABLICA 4.5.1. Orijentacijski odnosi između tipa analize i elemenata REFII modela
TABLICA 4.5.2. Transformacija vremenske serije u objekte
TABLICA 4.5.1.1. Definicija REF oznaka na temelju prirasta diskontinuirane funkcije
TABLICA 4.5.1.2. Primjer nadopune REF modela sa na temelju koeficijenata kutnog otklona
TABLICA 4.5.2.1. Primjer nadopune REF modela sa površinom ispod krivulje
TABLICA 4.5.4.1. Intervalne vrijednosti otklona kuteva
TABLICA 4.5.10.1. Matrica transformacije
TABLICA 4.6.6.1. Pristupi pri učenju Bayesove mreže
TABLICA 5.3.2.1. Varijable korištene u modelu
TABLICA 5.3.3.1. Osnovna statistika seta podataka, uzorak bruto marža pomak
TABLICA 5.3.3.2. Matrica korelacije, uzorak bruto marža pomak
TABLICA 5.3.3.3. Osnovna statistika seta podataka, uzorak prodaja pomak
TABLICA 5.3.3.4. Matrica korelacije, uzorak prodaja pomak
TABLICA 5.3.3.5. Deskriptivni podaci, usporedba uzorka srednje dnevne temperature sa
mjerne postaje Maksimir Zagreb za 2006. i 2007. godinu
TABLICA 5.3.4.1. Podaci transofmirani u REFII notaciju
TABLICA 5.3.4.2. Rangiranje varijabli prema Gini indeksu
TABLICA 5.3.5.1. Prikaz veza u Bayesooj mreži, prodaja količine
TABLICA 5.3.5.2. Prikaz veza u Bayesovoj mreži, ostvarena bruto marža
TABLICA 6.3.1.1. Scenarij analiza utjecaji na količinu prodaje
TABLICA 6.3.1.2. Deskriptivni podaci, usporedba uzorka srednje dnevne temperature sa
mjerne postaje Maksimir Zagreb za proljeće 2006. i 2007. godinu
TABLICA 6.3.1.3. Deskriptivni podaci, usporedba uzorka srednje dnevne temperature sa
mjerne postaje Maksimir Zagreb za zimu 2006. i 2007. godinu
TABLICA 6.3.2.1. Primjena Annealed MAP algoritma na uzorku prodaje 2006.
TABLICA 6.3.2.2. Primjena Annealed MAP algoritma na uzorku prodaje 2007.
TABLICA 6.3.3.1. Primjeri ad-hoc analiza i interpretaciaj rezultata, uzorak količina prodaje
TABLICA 6.4.1.1. Scenarij analiza utjecaji na realiziranu bruto maržu
TABLICA 6.4.2.1. Primjena Annealed MAP algoritma na uzorku realizirana bruto marža
2006.
TABLICA 6.4.2.2. Primjena Annealed MAP algoritma na uzorku realizirana bruto marža
2007.
IX
TABLICA 6.4.3.1. Primjeri ad-hoc analiza i interpretacija rezultata, uzorak realizirana bruto
marža
TABLICA 6.5.1. Vizualizacija podataka za opisanome setove podataka i godine
1
1. UVOD
1.1. Uvod
Proteklih nekoliko godina naglo raste dostupnost raznih tehnologija koje za rezultat imaju sve
snažnije povezivanje sudionika na tržištu koje postaje globalno te se otvaraju nova područja
za primjenu raznih metoda analize koje ranije nije bilo moguće efikasno primijeniti
prvenstveno zbog nedostupnosti podataka i tehnologija. Iako globalizam znatno ubrzava
komunikaciju i razmjenu iskustava te otvara prostor za povećanje ciljanog tržišta tim se
procesom istovremeno povećava broj čimbenika koji utječu na tržište. U takvim uvjetima
efikasan proces analize i predviđanja osim što je vrlo značajan, možemo reći nezamjenjiv,
ujedno je i vrlo složen te je potrebno kombinacijama raznih alata i metoda kontinuirano
upravljati i prilagođavati se novim i drugačijim situacijama odnosno prepoznavati obrasce
koji se ponavljaju te ih koristiti za donošenje odluka.
Poznata je paradigma da je upravljanje tržištem uvijek u određenoj sferi pogađanja te da onaj
tko više zna bolje i uspijeva pogoditi kojim putem krenuti. Jedan od danas najutjecajnijih
ekonomista na svijetu1 dr. Dani Rodrik, poznat po nekonvencionalnom pristupu teoriji rasta i
globalizaciji u svojim radovima govori o stazi rasta gospodarstva u kontekstu „ne znamo
mnogo unaprijed, sve je eksperiment“. U tradicionalnoj ekonomiji u kojoj je sve definirano na
unaprijed utvrđenim pravilima koja se kasnije provode (u većoj ili manjoj mjeri ovisno o
društvu i okolnostima) stekao je popularnost ističući da takav, pasivan pristup nije u skladu s
današnjim okolnostima. On zagovara strategije rasta koje se, nasuprot ideji da postoje
unaprijed poznati faktori rasta koji se moraju ostvariti, oslanjaju na dijagnostiku i koje prije
dugoročne primjene eksperimentalnom metodom provjeravaju učinak reformi vodeći računa o
prioritetima čime se olakšava njihova provedba. Kao uspješan primjer dijagnostičkih
strategija navodi Kinu. Kina je prije svake dugoročne implementacije ekonomske politike
privremeno uvela kratkoročnu provedbu da ispita hoće li učinci biti povoljni i s vremenom,
kad je pronašla kombinaciju faktora, prestala je s velikim eksperimentima. One-size-fits-all
pristup sve je manje primjenjiv obzirom na rastuće zahtjeve tržišta.
Prije nekoliko desetljeća uloga trgovine bila je opskrba stanovništva kao posrednika industrije
i potrošača. Danas se odluke o kupnji u najviše slučajeva donose na prodajnom mjestu pa
trgovina dobiva novu ulogu. Gubi pretežito funkcionalno značenje te počinje biti mjesto
destinacije s drugačijim motivom (Pavlek, 2011, 48-51). Povećan broj kanala informiranja i 1 časopis Banka, godina XVII, broj 7., srpanj 2011. stranica 14-17, intervju dr. Dani Rodrik„Velika avantura“
2
prodaje kojima je moguće privući kupca danas postavlja pitanje efikasnosti određenog kanala
za pojedini proizvod i/ili ciljani tržišni segment. Novija istraživanja pokazuju značajnu
zastupljenost efekta u kojem kupac traži informaciju kroz sve raspoložive kanale no kupnju
najčešće obavlja kroz jedan te isti, ovisno o prirodi roba2. Velika dostupnost informacija o
robi (internet) i samih roba (dostava kataloga, robe) mijenja percepciju kupca koji očekuje (i
dobiva) više nego ranije.
Ukratko prezentirana složenost modernih tržišta, brojnost utjecaja te trendovi promjena
upućuju na potrebu za stvaranjem modela koji bi na drugačiji način pojednostavili prikaz
tržišnih okolnosti, omogućili fokusiranje na važno (prema nekim unaprijed određenim
smjernicama) te osigurali presudnu dodatnu informaciju potrebnu za donošenje odluke.
Reakcija pak poslovne ali i znanstvene javnosti na takve radove ukazuje na interes za takvim
modelima koji proizlazi iz spomenute potrebe.
1.2. Cilj rada
Cilj rada je dati prijedlog drugačijeg pristupa izgradnje modela za podršku odlučivanju koji će
sa jedne strane biti u mogućnosti obuhvatiti najrazličitije podatke koji se procjene važnima za
donošenje odluka i za provjeru odnosa te, sa druge strane, jednom formiran biti dovoljno
jednostavan za upotrebu od strane donositelja odluke.
Modeli za podršku odlučivanju mogu se grubo podijeliti na (Pyle, 2003):
- deskriptivne/prediktivne,
- asocijativne/sistemske,
- statičke/dinamičke,
- kvalitativne/kvantitativne,
- komparativne/interaktivne.
Navedene karakteristike nisu konačne te se međusobno ne isključuju. Također, u praksi se
može dogoditi i kombinacija pojedinih kategorija.
Prediktivnima je zadatak izgradnja modela koji će matematičkim operatorima što vjernije
opisati pojavu u stvarnosti te će se taj model kasnije koristiti u praksi za donošenje budućih
odluka koristeći aktualne podatke. Za kreiranje i testiranje uspješnosti modela najčešće se
koriste odvojeni setovi podataka čije se karakteristike kasnije uspoređuju. Dobre strane
2 http://www.investitor.org/kako_odabrati_kanal_prodaje.php, 18.07.2011.
3
ovakvih sustava su da kada se jednom definiraju mogu lako koristiti i od strane osoba koje
nemaju nužno analitička znanja već su u stanju čitati zaključke koji proizlaze iz podataka.
Loša strana sustava je da sporo reagira na eventualne promjene koje, posebno ako su
značajne, upućuju na ponovno prilagođavanje modela što je ograničenje.
Deskriptivni modela govore o zaključcima kroz „mekša“ pravila te pretpostavljaju da sa druge
strane sustava postoji osoba koja je u stanju pročitati više od matematičkog koeficijenta te na
temelju toga formirati uzročno posljedičnu vezu i izvesti konačnu odluku. Dobra strana ovih
sustava je što su prilagodljiviji specifičnim situacijama i uvjetima te su time i primjenjiviji u
složenim uvjetima. Loša strana ovih sustava je što za konačno formiranje zaključaka trebaju
ekspertno znanje iz specifičnog područja. Potreba za tim znanjem može se umanjiti u fazama
izgradnje modela na način da se ugradi u same postavke i time unaprijed ograniči polje
rješenja. Model koji će biti prikazan u ovom radu deskriptivni je model sa brojnim
mogućnostima primjene prvenstveno u trgovini ali i u drugim djelatnostima.
Asocijativni ili korelacijski modeli baziraju se na pronalaženju odnosa ili korelacija između
atributa. Sistemski modeli podrazumijevaju pogled na svijet kao povezan sustav događaja pri
čemu su oni međusobno povezani u svim smjerovima ne nužno simetričnim vezama.
Statički modeli podrazumijevaju model koji je baziran na jednom i samo jednom setu
podataka. Dinamički, nasuprot, podrazumijevaju više setova podataka kojima je moguće
napuniti model. U praksi postoje i situacije kada je model između dva spomenuta pristupa.
Podjela na kvalitativne i kvantitativne modele podrazumijeva fokus na vrstu podataka na
kojima je model nastao i/ili se izvodi. Kvalitativni se uglavnom koriste opisnim podacima dok
se kvantitativni baziraju na empirijskim strukturiranim podacima.
Komparativni modeli bave se uspoređivanjem podataka unutar seta podataka dok se
interaktivni bave poveznicama u slučaju promjene nekog podatka u uzorku.
Svrha disertacije je ukazati na skrivene potencijale za analizu koje leže u korištenju i
kombiniranju metoda REFII i Bayesovih mreža čime se kroz prikazani model stvara snažna
platforma kao alat za povezivanje i analizu raznorodnih i međusobno ovisnih atributa.
Također, predloženi model će se kroz rad analizirati u okviru spomenute podjele.
1.3. Struktura rada
Osobine složenih tržišnih uvjeta poticaj su mnogih istraživanja. Informacijski sustavi
suočavaju se s izazovom eksplozije informacija te potrebom da se iste pravovremeno uobliče,
evidentiraju te procesiraju. Područje trgovine, uz bankarski i telekomunikacijski sektor, jedno
4
je od najperspektivnijih za primjenu raznih metoda poslovne inteligencije. Priroda
informacijskih sustava za praćenje poslovanja umnogome je specifična kada se radi o
tekstilnim proizvodima. Interni podaci o poslovanju, kretanjima tržišta, konkurenciji, raznim
vanjskim utjecajima samo su neki od čimbenika koji mogu značajno utjecati na poslovanje.
Kako bi se što bolje razumjelo tržišne zakonitosti sa aspekta poduzeća sudionika nužna je
stalna aktivnost i budno praćenje raznih čimbenika. Moguće je pronaći radove koji za cilj
imaju predvidjeti razinu prodaje primjenom ili kombinacijom različitih metoda. Obzirom na
karakteristike predloženog modela identičan nije pronađen u literaturi. Pronađene su razne
primjene Bayesove logike (sustavi za prepoznavanje slika, nadzor, optimizacija lanca nabave,
obrasci ponašanja, valuacija sustava za upravljanje poslovanjem u uvjetima tzv. fast fashion)
od čega u trgovini uglavnom za modele asistiranja pri kupnji, proučavanje raznih analize
utjecaja zatim kao dopuna kombinaciji metoda i, rjeđe, kao predikcija buduće prodaje.
Motivacija za provođenje ovog istraživanja je primjena rezultata u poslovanju te dalji razvoj i
prilagodba modela.
Rad se bazira na analizi prodaje tekstilnih proizvoda na prodajnim mjestima u gradu Zagrebu.
Podaci o prodaji agregiraju se na dnevnoj razini i promatranoj grupi proizvoda nakon čega se
transformiraju modelom transformacije vremenske serije čime se dobivaju podaci o
pomacima u vremenskim razmacima. Vrijednosti pomaka udružuju se sa ekspertnim znanjem
te kao rezultat daju kategorizirane vrijednosti (rast, pad, značajan rast, stagnacija i sl.) koje se
koriste za prikaz sezonskih oscilacija. Na isti se način transformiraju i podaci o klimatskim
promjenama te se, zajedno s podacima o prodaji, koriste kao ulazni podaci za formiranje
Bayesove mreže.
Struktura rada podijeljena je u sedam dijelova. U uvodnom dijelu opisani su motivi za
provođenje istraživanja ove vrste, ciljevi rada, opisani su metodološki postupci te očekivani
znanstveni doprinos.
Drugi i treći dio rada daju poslovni i društveni okvir za provođenje ovakvih istraživanja te
potrebu za formiranje ovakvih modela u trgovini. Promatrajući proces kupnje odnosno točku
u kojoj se događa prodaja/kupnja na način prikazan na slici poslovni aspekt predstavlja sve
one radnje i motive sa strane onoga tko stavlja proizvod na raspolaganje kupcu na polici.
Društveni aspekt predstavlja sve one aktivnosti i motive koji potrošača dovode na prodajno
mjesto. Spajanjem ponude i potražnje događa se kupnja kao središnji promatrani događaj koji
će se zajedno sa zavisnim čimbenicima promatrati modelom. Navedeni su referentni radovi
povezan
prostor
metodam
Četvrti
matema
njegov s
Peti dio
uzorcim
prikazan
Šesti di
podatak
U sedm
1.4. Ci
Ciljevi
primjen
tržišnih
Skladišt
zadržav
vanjskim
Model
prodaje)
ne tematike
za buduća i
ma otkrivan
SLIKA
dio rada
atička, statis
smisao i naz
o opisuje m
ma podataka
n na uzorcim
io daje prik
ka.
mom dijelu n
iljevi istra
istraživanja
ne u drugim
zakonitosti
te podatak
vanja postoj
m faktorima
u konačni
) primjenom
e, prednosti
istraživanja
nja znanja iz
A 1.3.1. Pos
opisuje teo
stička i pos
znake primj
model prateć
a čime se
ma podatak
kaz i interpr
navedeni su
aživanja
a očituju se
m djelatnos
i te konačno
ka o proda
ećih kupaca
a koja se mo
ci predstav
m metoda r
pristupa k
. Navedena
z podataka t
slovni i druš
oretsku pod
lovna pravi
jenjivosti.
ći faze izgra
kroz pogla
ka o prodaji
retaciju rez
zaključci is
e u izradi m
stima te pr
o podrške od
aji primjen
a i pridobiv
ogu iskorist
vlja deskrip
rudarenja po
koji se navo
a su također
te se ukazuj
štveni aspek
dlogu na k
ila prikazan
adnje te na
avlje definir
tekstilnih p
zultata na p
straživanja u
modela za an
rimjenjivost
dlučivanju.
nom metod
vanje novih
titi kao doda
ptivni mod
odataka na
odi kao prij
iskustva iz
je na smjero
kt istraživan
kojoj je fo
na je osnova
avodeći deta
ra model. P
proizvoda.
predloženom
uz obrazlož
nalizu poda
ti modela u
da rudarenj
, uz projekc
atna predno
del predviđ
poslovnim
jedlog te og
prakse, ista
ove daljih is
nja i točka k
ormiran mo
a koja određ
alje pojedin
Predloženi
m modelu n
ženje rezulta
ataka u trgo
u svrhu bo
a podataka
ciju nekih k
ost u odnosu
đanja zakon
m podacima
graničenja
aknuta pove
straživanja.
kupnje
odel. Kroz
đuje ciljeve
ne faze na s
model u p
na stvarnom
ata i hipotez
ovini sa naz
oljeg razum
a postaje
kretanja i od
u na konkur
nitosti (pos
a u kombin
5
odnosno
eznica sa
ključna
e modela
stvarnim
praksi je
m uzorku
za.
znakama
mijevanja
sredstvo
dnosa sa
enciju.
sljedično
naciji sa
6
drugim vanjskim podacima te kroz analizu varijabli u modelu a s ciljem otkrivanja uzoraka,
razumijevanja odnosa i potvrde/otkrivanja drugih zakonitosti među njima.
Cilj istraživanja je potvrditi primjenjivost REFII modela te Bayesove logike u analizi
podataka o prodaji. Motivacija je izgraditi poslovno jednostavan i primjenjiv model analize (u
ovom slučaju podataka o prodaji i vanjskih utjecaja) kojim je moguće simulirati tržišne
okolnosti te temeljem toga donositi zaključke o povijesti odnosno o budućim reakcijama i
strateškim planovima. Obzirom na snažne sezonske oscilacije tržišta fokus je na analizi trenda
prodaje što omogućuje jedinstveni model transformacije vremenske serije. Problemi
proučavanog područja sastoje se u načinu na koji efikasno organizirati i transformirati
podatke te kako ih sučeliti sa eksternim podacima i sve to prikazati u prihvatljivom obliku za
korištenje. Za razliku od strogo prediktivnog modela ovaj rad usmjeren je prema izgradnji
deskriptivnog modela koji sadrži prediktivne elemente ali u prvi plan postavlja ekspertno
znanje i donosioca odluke.
1.5. Hipoteze i obrazloženje hipoteza
Kroz istraživanje dokazat će se, ili opovrgnuti, slijedeće hipoteze:
- događaje odnosno tržište moguće je analizirati metodama rudarenja podataka
- tržišne uvjete moguće je analizirati kombiniranjem /ulančavanjem metoda rudarenja
podataka
- primjenom REFII modela moguće je kombinirati i analizirati raznorodne grupe
podataka uz pretpostavku da ih je moguće izraziti putem vremenske serije (putem
promjene vrijednosti u nekom vremenu)
- moguće je izgraditi model za podršku odlučivanju slijednom primjenom metode
transformacije vremenske serije (REFII) i Bayesove logike
- model je primjenjiv u trgovini
- promjena vremenskih prilika utječe na prodaju
- ponašanje potrošača moguće je predvidjeti – ponašanje potrošača u nekoj se mjeri
podudara sa određenim uzorkom koji se pak može ponavljati u vremenu;
- ponašanje potrošača moguće je predvidjeti primjenom metoda rudarenja podataka –
primjenom metoda rudarenja podataka moguće je uočiti obrasce ponašanja i
predvidjeti ih u budućem vremenu;
- ponašanje potrošača tekstilnih i srodnih proizvoda moguće je predvidjeti primjenom
metoda rudarenja podataka – tekstilni i srodni proizvodi sa svojim posebnostima
7
dodatno povećavaju složenost istraživanja bilo na strani vanjskih utjecaja bilo na
strani potrošača;
- kvaliteta informacijskog sustava za praćenje poslovanja i pripadajućeg skladišta
podataka preduvjet su uspješnosti rudarenja podataka u trgovini, tek kvalitetno
uobličene i evidentirane poslovne informacije mogu biti temelj za analizu.
1.6. Metodološki postupci
U radu je predstavljen prijedlog modela koji kombinira transformaciju vremenske serije
nakon čega su transformirani podaci podvrgnuti analizi te je na bazi istih dodatno formirana
Bayesova mreža s ciljem redukcije polja rješenja a koja formira konačni model podrške
odlučivanju. Model je u primjeru prikazan na stvarnim podacima te se na osnovu tih
istraživanja izvode zaključci o primjenjivosti i efikasnosti modela.
Efikasnost modela je u konkretnom slučaju sposobnost povezivanja različitih analitičkih
koncepcija s ciljem provođenja složenih analiza u području istraživanja tržišnih zakonitosti.
Iako je model primjenjiv na sve podatke koji se mogu izraziti u obliku vremenskih serija za
potrebe istraživanja korištene su baze podataka o prodaji tekstilnih proizvoda te vremenskih
prilika na području Grada Zagreba.
Osnovna metoda rada i istraživanja svodi se na primjenu REFII modela i Bayesove logike na
uzorcima podataka te na stvaranje metodološkog i praktičnog modela koji povezuje različite
koncepcije analize a s ciljem dolaženja do rješenja za različite tipove problema iz područja
analize tržišta. Kroz rad je pokazana učinkovitost modela koja se odnosi na integraciju
tradicionalnih pristupa analizi vremenskih serija i kombiniranog pristupa. Tijekom
provođenja empirijskih istraživanja, korišteni su i analitički alati IBM SPSS Statistics,
GeNie&Smile, Orange for Python, Hugin, Tableau te programski jezik Oracle PL/SQL
odnosno baza podataka Oracle s ciljem transformacije podataka i kreiranjem modela. S tim u
skladu, primijenjeni su algoritmi rudarenja podataka te algoritmi za analizu vremenskih serija.
Analiza se sastoji od selekcije varijabli te analize dostupnih/željenih varijabli. Slijedi
prikupljanje podataka i pretprocesiranje pa vrednovanje varijabli modela. Slijedeći korak je
transformacija vremenske serije za svaku od varijabli REFII modelom. Transformacija se
izvodi primjenom REFII modela pri čemu se prati odstupanje u odnosu na prethodnu točku u
vremenu i bilježi pomak kojem se pridružuje značenje korištenjem ekspertnog znanja (rast,
pad, značajan rast i sl.) Transformirani podaci obuhvaćeni su analizom sezonskih oscilacija.
8
Konačni model formira se Bayesovom mrežom koja ujedinjuje podatke o trendovima kretanja
prodaje i eksternih podataka u ovom slučaju vremenskih prilika.
1.7. Očekivan znanstveni doprinos
Znanstveni doprinos očituje se u predstavljanju drugačije koncepcije u analizi u trgovini koja
u fokus stavlja model koji kombinira transformaciju vremenske serije i Bayesovu logiku.
Prednost ovakvoga pristupa očituje se u sintezi niza različitih pristupa i metoda u analizi, u
koje spadaju i tradicionalne metode rudarenja podataka, kao i nadogradnja novim
algoritamskim postupcima analize. Ovakav pristup omogućuje provedbu različitih tipova
analiza na podacima te povezivanje raznih atributa koje je drugim modelima teško ili
nemoguće povezati na sličan način. Kao ilustracija predstavljeno je rješenje analize utjecaja
prodaje i vremenskih prilika što zahtijeva angažman niza povezanih analitičkih postupaka.
Ove mogućnosti su do sada tradicionalnim pristupima analizi podataka u trgovini zbog
primjene niza nepovezanih metoda (nepostojanja generalne strategije povezivanja) bile
nemoguće ili vrlo teško izvedive, a pojavljuju se kao vrlo vrijedne u analizi tržišnih
zakonitosti.
Model pretendira dati prijedlog kako efikasno analizirati međuzavisnosti čimbenika koji
utječu na prodaju (u ovom slučaju tekstilnih ali u praksi bilo kojih proizvoda međusobno i
prema vanjskim utjecajima). Obzirom je moguće pronaći radove koji upućuju na zanimljivost
analize prodaje i podataka o vremenskim prilikama (utjecaja vremenskih prilika) ali nude tek
djelomična rješenja, model je usmjeren na to područje. Širi kontekst je primjenjivost REFII
modela i Bayesove logike u trgovini općenito. Područja u kojima bi ovakav mode bio
primjenjiv su: predikcija prodaje, predikcija trenda, analiza utjecaja, scoring prodajnog
mjesta, procjena rizika (npr. pada prodaje u slučaju promjene vremenskih prilika), analiza
utjecaja marketing kampanje na prodaju, uvođenje novog proizvoda na tržište.
9
2. POSLOVNI ASPEKT ISTRAŽIVANJA
Priroda informacijskih sustava za praćenje poslovanja umnogome specifična, među
najsloženijima kada se radi o tekstilnim proizvodima. Upravo primjer izgradnje modela u
trgovini tekstilom bit će obrađen u ovom radu. Razni modni trendovi, društvene skupine,
klimatski uvjeti, društveni status, medijske akcije pa sve do osnovne životne potrebe
motivacije su koje mogu u kratkom vremenu promijeniti tržišna uporišta kupca tekstilnog
proizvoda. Procesiranje podataka podrazumijeva aktivno praćenje raznih atributa proizvoda
(veličine, boje, dezena, sastava, uvjeta održavanja proizvoda...) kako bi se što kvalitetnije
uočile eventualne pravilnosti u prodaji te primjenom tih saznanja reagiralo na vrlo
promjenjivo tržište.
2.1. Primjena i značaj primjene istraživanja
Trgovina pokreće svijet. Većina se aktivnosti modernog tržišta svodi na kupnju i/ili prodaju
bilo robe bilo usluga. U želji da se anticipiraju tržišna kretanja i u što većoj mjeri upravlja
okolnostima, područje predikcije tržišnih kretanja kroz vrijeme se pokazalo zanimljivo
velikom broju autora od čega su tek poneki dali ozbiljniji doprinos sa rezultatima koje je
moguće iskoristiti izvan znanstvenih okvira. Kao ključan problem pokazano je kontroliranje
modela u vrlo složenim uvjetima modernog tržišta. Upravo zbog toga istraživači su sa jedne
strane ograničavali područje istraživanja na manje uzorke odnosno u modelima koristili one
grupe roba koje je bilo lakše pratiti kroz vrijeme. U ovom radu će, osim modela, biti prikazan
i primjer na uzorku podataka o prodaji tekstilnih proizvoda i vremenskim prilikama te
međusobnom utjecaju promatranih podataka. Tekstilni proizvodi su odabrani kao najsloženiji
primjer u trgovini uslijed prirode proizvoda (razne karakteristike) i broja čimbenika koji
utječu na tržište (od životne potrebe do iskazivanja statusa).
Tržišno natjecanje i globalizacija u velikoj mjeri određuju potrebu za točnošću procjena u
logističko – trgovačkom lancu tekstilnih proizvoda. Sustav predviđanja prodaje i zakonitosti
tržišta vrlo je važan kako bi se odgovorilo na nestalno tržište i potrebe distribucije. Od ideje
„što“ ćemo prodati i „kome“ ćemo prodati kreće cijeli niz ostalih aktivnosti. Na procjenama
tih parametara baziran je ostali dio lanca. Danas dostupne metode predviđanja i analize
generalno su neprikladne za tekstilnu industriju. Sa druge strane razvoj „mekih“ tehnika
baziranih na metodama umjetne inteligencije daleko je napredovao te se sve više primjenjuju
no zbog potrebe da se njima upravlja često se zaobilaze u primjeni. Radovi koji govore o
optimizaciji lanca nabave (Lee & Saser, 1995, 270-277) iz davne 1995. godine spominju
10
modele koji objedinjuju rigorozno upravljanje izvorima, proizvodnjom i distribucijom sve do
prodaje krajnjem kupcu. Spominjani supply chain management koncept uključuje alate koji
utječu na razne faze i na različitim mjestima u logističkom lancu te uključuje razne funkcije
poput odabira i kupnje robe, analize izvora nabave, planiranja proizvodnje, kontrole i
optimiziranja zaliha te razmjene informacija kao najvažnije karike (povratna veza). Do danas,
napretkom tehnike, došlo je do velikih napredaka. Tradicionalna metoda u tekstilu znači
sezonsku rezervaciju roba na bazi procjene prodaje i prodajnih kapaciteta 6 do 12 mjeseci
unaprijed. Na taj način optimizirali bi se proizvodni i transportni kapaciteti te osigurala
sredstva za plaćanje robe. Takav model podrazumijeva dvije sezone godišnje. Globalizacija,
razvoj tehnologije i tržišta ubrzali su ritam života. Iako i danas ima sustava koji i dalje
(najčešće ne u potpunosti) rabe tradicionalni model danas se kao primjer vrhunskog
proizvodno logističkog procesa navode lanci brze mode (fast fashion) sa 8 izmjena kolekcija
godišnje, do 6 posebnih kolekcija (flash) i sa posebnim programom vezanim uz kalendar
(praznici, povratak u školu, odvijanje globalnih događaja kao što su svjetska prvenstva i
slično) te nekoliko ciklusa sniženja robe u i izvan sezone te posebne promocije. Proučavajući
problem odaziva odnosno upravljanja lancem nabave i posebno logistikom pojedini radovi
bave se scoring metodologijama takvih sustava (Cachon & Swinnwy, 2011, 778-795).
Karakteristike tekstilnog tržišta također kompliciraju analizu i predviđanje. Uspješan sustav
mora biti sposoban:
- operirati sa velikim brojem proizvoda (primjer majice u tri varijante sa pet boja u šest
veličina izrađene iz tri vrste materijala i tri linije kroja daju gotovo 1.000 kombinacija
samo u jednom proizvodu) na raznim razinama agregacije (vidi sliku)
- anticipirati srednjoročne projekcije (jedna do dvije sezone) vezano na količine i stanje
zaliha
- dati informaciju za prilagođavanje kratkoročnih aktivnosti (1-3 tjedna) rezultati kojih
će se koristiti u srednjoročnim projekcijama za prilagodbu plana
- aktivno koristiti povijesne podatke
- pratiti stalno nove proizvode (95% kolekcije)
- inkorporirati u analizu i odnose druge podatke važne za izvođenje prodaje (vremenske
prilike, marketing akcije, promocije, modne trendove, ekonomske prilike itd.)
- osigurati jednostavnost korištenja donosiocima odluka.
Model o
prednos
Kako je
poput fi
postoji v
- h
-
Heuristi
područj
primjenj
vremens
ovisi o
paramet
mogu ut
Neki rad
mreže,
sustavi
okolnos
opisan u ov
sti i ogranič
e ranije spo
inancija, ek
više načina
heurističke
statističke.
ički se bazi
a marketin
njivost stati
skog period
kvaliteti po
tara modela
tjecati fakto
dovi (Kuo &
fuzzy logik
mogu prila
stima.
vom radu p
enja no uz v
SLIKA 2.
omenuto, an
onomije, m
grupiranja.
i,
iraju na istr
nga. Stati
stičkih mod
da koji se p
ovijesnih po
a. Mnogi atr
ori koji nisu
& Xue, 199
ka, evoluira
agoditi i ide
pretendira d
velik stupan
1.1. Primjer
naliza zakon
meteorologije
Jedan od n
raživanju i
stički mod
dela bitno
promatra (D
odataka kak
ributi gener
u kontrolabi
98, 105-126)
ani algoritm
entificirati z
dati odgovo
nj upotreblji
r agregacije
nitosti i pred
e, proizvodn
njih je podje
procjenam
deli istraž
ovise o po
Dasgupta et
ko bi se osig
ralno uključ
lni niti ih je
) kombinira
mi(Van Lith
zakonitosti
or na sve na
ivosti.
e tekstilnih p
dviđanje pr
nje energije
ela na (Arms
ma osoba ili
uju povije
odručju istr
al, 1994, 2
gurala kvali
uju kratkoro
e moguće id
anjem nekol
h et al, 20
u komplek
avedene za
proizvoda
risutni su u
e i slično. A
strong, 200
ekspertnih
esne poda
raživanja, z
235-244) št
itetna podlo
očne podatk
dentificirati.
liko „mekih
000)) pokaz
ksnim vezam
ahtjeve uz o
raznim pod
Analizirajući
1):
h grupa, naj
tke. Efika
znanju kori
to zapravo z
oga za uskl
ke o prodaji
h“ tehnika (n
zuju naznak
ma u promj
11
određene
dručjima
i modele
jčešće iz
asnost i
isnika te
znači da
ađivanje
i na koje
neuralne
ke da se
mjenjivim
12
2.2. Dosadašnji radovi i modeli te pogled sa aspekta trgovine
Godine 2004. novinar New Yorker-a James Surowiecki izdaje knjigu „Mudrost masa“
(Surowiecki, 2007) koja u podnaslovu govori o tome zašto više ljudi više zna i kako
kolektivna mudrost utječe na poslovanje, privredu, društva i narode. Knjiga se prodala u
milijunskoj nakladi a za uvod u ovaj dio rada navest ćemo dva primjera iz nje. U jednome je
britanski znanstvenik Francis Galton koji je proučavao parenje i nasljeđivanje na sajmu stoke
svjedočio natjecanju u procjenjivanju težine stoke. Na sajmu je odabran i izložen debeo bik a
posjetitelji su mogli uz novčanu naknadu pogađati njegovu težinu uz mogućnost osvajanja
nagrade onome tko buda najbliži. Glaton je želio ispitati sposobnosti „prosječnog glasača„
želeći dokazati da su vrlo male te da je prosjek važećih glasačkih listića biti posve pogrešan.
Prosječna procjena težine bika nakon klanja i vaganja bila je 1.197 funti dok je stvaran
rezultat iznosio 1.198 funti. Procjena mase bila je savršena. Galton je kasnije rezultate objavio
u znanstvenom časopisu uz napomenu da je „taj rezultat demokratskom prosuđivanju dao više
vjerodostojnosti negoli se ikada moglo očekivati“.
Drugi zanimljiv primjer (Surowiecki, 2007) odnosi se na potragu za podmornicom
izgubljenom 1968. godine. Slučaj je detaljno opisan u prepričavanju autora Sontag i Drew
(Sontag, Drew, 1998). Američka podmornica Scorpion nastala je na povratku u luku.
Mornarica je znala položaj s kojeg se podmornica posljednji put javila no o daljem kretanju i
smjeru nije bilo nikakvih podataka. Potraga koja je slijedila „ograničavala“ je područje
potrage na dvadeset milja u širinu i nekoliko tisuća stopa u dubinu. Mornarički časnik koji je
vodio potragu skicirao je niz scenarija i objašnjenja što se moglo dogoditi podmornici te je
okupio skupinu specijalista iz raznih područja da mu daju odgovore koliko je vjerojatan svaki
od njegovih scenarija. Na kraju konzultacija, niti jedna od pruženih informacija nije pomogla
locirati podmornicu. No mornarički oficir je došao na ideju da skupi sva razmišljanja i
iskoristi Bayesov poučak kako bi pronašao konačnu lokaciju. Kad je to napravio dobio je,
grubo rečeno, kolektivnu procjenu lokacije. Ta lokacija nije se poklapala ni sa jednom
pojedinačnom procjenom no bila je u stvarnosti 200m dalje od mjesta na kojem su pronašli
podmornicu. Impresivno je to što su dokazi na koje se skupina oslanjala pojedinačno bili
gotovo bezvrijedni, tek mali djelići podataka.
Autori Ramya Neelamegham i Pradeep Chintagunta (Ramya, Pradeep, 1999) sa INSEAD-a
istraživali su zakonitosti pokretanja novog proizvoda u filmskoj industriji. Razmatrajući kako
najefikasnije iskoristiti izvore informacija kako bi stvorili održiv model predviđanja rezultata
koje će polučiti novi proizvod stvorili su model baziran na Bayesovoj logici koji predviđa
13
rezultate u prvom tjednu izlaska na tržište koristeći zaključak da su pokazatelji tog prvog
tjedna ključni pokazatelj daljeg uspjeha. U svom radu pokazali su nekoliko karakteristika
ovog pristupa koji su važni za razumijevanje prednosti i ograničenja i u ovom radu.
Korištenje Bayesove logike podrazumijeva sužavanje polja mogućih rješenja te se u
usporedbi sa tradicionalnim pristupom postavlja pitanje da li su u fazi ograničavanja polja
rješenja ispušteni neki dijelovi koji su bitni ali zbog konkretnog kriterija koji je korišten u
ograničavanju to nije bilo vidljivo (pitanje kvalitete modela u uvjetima sužavanja polja
rješenja). Nasuprot tome, određene analize uopće ne bi bile provedive bez spomenutog
pojednostavljenja što otvara tradicionalistima prostor za pitanja o kvaliteti rješenja dok u
primjeni u npr. trgovini upravo može dati onu razinu potrebne informacije dovoljnu za
kvalitetno donošenje odluke. Drugi problem o kojem treba voditi računa je promjenjivost
uvjeta na tržištu. U takvim uvjetima primjena Bayesove logike pokazuje se kao nezamjenjiv
alat upravo zbog karakteristika koje tradicionalni pristup kritizira. Nadalje, u konkretnom
radu, lansiranje novog proizvoda/filma odvija se u više faza i na različitim tržištima pri čemu
svaka faza i tržište zahtijevaju blago prilagođen pristup što pak opravdava deskriptivni model
i kombiniranje ekspertnog znanja.
U radu drugačijeg pristupa autori Changshui Zhang, Shiliang Sun, Guoqiang Yu (Zhang et al
2004, 216 - 221) bave se modelom baziranom na Bayesovoj mreži a kako bi predvidjeli
opterećenja na prometnicama te temeljem rezultata modela upravljali prometom u velikim
gradovima i drugdje gdje je to potrebno. Inteligentno upravljanje prometom doživjelo je u
proteklim godinama veliki napredak. Iako i dalje ne postoje efikasna generalna rješenja za
probleme poput zagušenja prometa, analiza podataka i obrazaca u vremenu pomažu
iznalaženju zakonitosti koje se mogu iskoristiti za buduće odluke. Ne ulazeći u detalje više
nego je potrebno za navođenje u ovom radu, između raznih metoda od jednostavnih do
složenih, sve one koje se baziraju na tradicionalnom pristupu nisu u mogućnosti dati
upotrebljiv rezultat najviše zbog činjenice da nisu u mogućnosti kombinirati podatke o
zavisnosti promatranih točaka (npr. raskrižja) već se fokusiraju na jednu točku i sve točke
zajedno. Formirajući model na način da stanje susjedne točke ovisi o povezanoj točki (npr.
početak stvaranja prometnog čepa) te kombinirajući Bayesovu mrežu autori potvrđuju
efikasnost primjene modela na stvarnim uvjetima te njegovu prednost nad tradicionalnim
pristupima.
Kao jedan od rijetkih primjera pokušaja se da matematičkim modelom predvidi prodaja
upravo tekstilnih proizvoda izdvaja se rad Nacionalnog tekstilnog centra SAD u kojem više
14
autora (Frank, Vemulapalli, Sztandera, Raheja, 2003) potpisuje model predviđanja prodaje
ženske sportske odjeće sa ciljem da pokažu primjenjivost netradicionalnih metoda. Rad se
osvrće na ranije spomenut problem služenosti planiranja i izvođenja prodaje tekstilnih
proizvoda uslijed velikog broja karakteristika proizvoda i tržišnih utjecaja. Planiranje prodaje
sastavni je dio poslovanja i vrlo važna karika u lancu od proizvođača do kupca. Kako bi
osigurali efikasno upravljanje poslovanjem brand managerima je potreban vrlo sofisticiran
alat za planiranje koji može obuhvatiti raznorodna obilježja kao što su veličina, boja, podatci
o vremenskim prilikama, promjene cijena, marketing kampanje ali i vrijeme kao kategorija.
Primjena tradicionalnih metoda uglavnom daje rješenja koja su linearna prirode i nisu
efikasna u složenim uvjetima. Modeli bazirani na netradicionalnim metodama umjetne
inteligencije mogu obuhvatiti endogene i egzogene varijable te dopuštaju primjenu
nelinearnih aproksimacijskih funkcija (naučenog) direktno na podacima. U zaključku
istraživanja autori ukazuju na problem kvalitete uzorka te primjenjivost modela u manjoj
mjeri i to isključivo kratkoročno. Također, navode da vide prostor za napredak modela u
kombiniranju metoda a primjenjivost modela u pronalaženju način da se uz podatke o prodaji
dodaju podaci poput klimatskih uvjeta, promjena cijene i slično kao vrlo važni u ovoj grani
trgovine.
Kao još jedan zanimljiv rad Nacionalnog tekstilnog centra SAD navodim model predviđanja
prodaje baziran na fuzzy logici (Frank et al, 2001, 1-8). Autori u ovom radu također upućuju
na upotrebljivost netradicionalnih metoda te na primjeru ukazuju da na vrlo ograničenom
uzorku proizvoda u kontroliranim uvjetima mogu postići dobre rezultate u predikciji. Na
žalost takav model daleko je od situacije koja se događa na tržištu.
Od do sada objavljenih radova najkompleksnije je ovo područje obrađeno u radu grupe autora
(Thomassey et al, 2005) sa ambicioznim ciljem da korisnicima modela daju alat koji će
omogućiti „ponudu odgovarajućih proizvoda, na pravom mjestu u pravo vrijeme po pravoj
cijeni uz istovremeno upravljanje razinom zalihe“. Sustav je u praksi usmjeren na
optimizaciju logističkog lanca no obzirom da su za uzorak korišteni podaci prodaje tekstilnih
proizvoda (logistički je proces također specifičan kad se radi o tekstilnim proizvodima) te
uspješnost ovog modela ovisi o uspješnosti procjene prodaje (bilo da se radi o procjeni od
strane eksperta ili putem modela) važno ga je spomenuti jer se u fazi analize bavi
pretpostavkama i ograničenjima važnim za područje ovog rada. Za distributera, što preciznije
predviđanje zahtjeva tržišta/kupaca omogućava da upravlja i prilagođava proizvodne
kapacitete. Model je u ovom radu prilagođen za primjenu u distribucijskoj mreži tekstilnih
15
proizvoda te se sastoji od više dijelova koji svaki djeluju u zasebnom području koje je
definirano kao zanimljivo za istraživanje zakonitosti (kratkoročna procjena, srednjoročna
procjena, procjena po grupi robe, procjena po proizvodu, procjena po veličini i boji) a koji
međusobno mogu biti povezani. Rezultati modela ukazuju na već ranije spomenute probleme
u složenom okruženju uz napomenu da, obzirom je postojala procjena prema veličini koja je
manje podložna utjecajima, ista se pokazala konstantnija u rezultatima i lakša za
prognoziranje. Svi ostali rezultati upućuju na potrebu za pojednostavljivanje modela ili seta
podataka kako bi se dobili prihvatljiviji rezultati. Rad je važan jer kombinira i povezuje niz
raznih metoda kako bi se dobio što cjelovitiji model.
U ovom radu opisan je model koji se dijelom bazira na osnovnim idejama na koje ukazuju
autori u spomenutim radovima međutim ih svojom jednostavnošću i primjenjivošću
prevazilazi u smislu primjenjivosti u poslovne svrhe te se nadovezuje na njihove rezultate i
smjernice.
2.3. Prednosti korištenja REFII modela
Osim Bayesove logike model u radu bazira se na REFII3 modelu. U ovom dijelu ukratko će
biti predstavljene prednosti REFII modela (Klepac, 2004) sa uporabnog i poslovnog aspekta a
prije matematičkog pojašnjenja modela. Standardni modeli za analizu vremenskih serija, kao
što je već spomenuto koncentrirani su prvenstveno na generiranje određenih pokazatelja
proizašlih iz analize te su fokusirani na usku problematiku. Ovakvi modeli ne pružaju
mogućnost direktnog procesuiranja vremenske serije posredstvom klasičnih data mining
algoritama, kao što je to slučaj sa REFII modelom. Ovaj model nadalje pruža mogućnost
jednoznačnog opisa vremenske serije, što rezultira primjenu egzaktnih matematičkih modela i
procesa. Model se u osnovi može oslanjati na istovremeno korištenje tri podmodela u procesu
analize (oblik krivulje, nagib krivulje i površina ispod krivulje) o čemu će biti više riječi
kasnije u opisu modela, što rezultira vrlo visokim stupnjem jednoznačnosti i preciznosti. U
pojedinim slučajevima analize ovisno o potrebnom stupnju egzaktnosti i preciznosti, proces
analize moguće je provesti sa jednim ili dva elementa modela.
Primjenjivost REFII modela u različitim područjima (financije, trgovina, bankarstvo,
medicina itd.) karakteristika je koja ovom modelu daje dodatnu težinu kao univerzalnom
sustavu za otkrivanju znanja u vremenskim serijama.
3 REFII, akronim od engl. Raise-Equal-Fall u prijevodu Raste-Stagnira-Opada te verzije modela II odnosno druga (2) verzija
16
Generalno gledajući REFII modelom opisuje se krivulja nizom parametara, a skup tih
parametara možemo kasnije procesuirati različitim tipovima algoritama u različitim
problemskim prostorima s ciljem otkrivanja znanja.
Ako promotrimo područja koje obuhvaća koncepcija REFII modela, tada tu ubrajamo
(Klepac, 2004, 15):
- analizu kretanje trenda serije
- analize cikličkih pojava unutar serije
- analize sezonskih oscilacija unutar serije
- pronalaženje odsječka vremenske serije koji korespondira sa određenom tržišnom
pojavom
- pronalaženje uzoraka unutar serije
- pronalaženje i otklanjanje irelevantnih sekvenci iz serija
- analiza korelatornih odnosa, kako između vremenskih serija tako i njenih odsječaka
- autokorelatorna analiza vremenskih serija
- predviđanje vremenskih serija
- analiza prirasta i osjetljivosti vremenskih serija
SLIKA 2.3.1. Etape u otkrivanju znanja posredstvom REFII modela (Klepac, 2004, 25)
Osnovna koncepcija primjene REFII modela svodi se na tri koraka. U prvom koraku
vremenska se serija transformira u REFII sintaktički model. Drugi korak odnosi se na
algoritmiranu obradu pokazatelja u formi REFII sintakse, dok se u trećem koraku ekstrahira
znanje iz modela.
Upravo čitav niz algoritmiziranih obrada koje se mogu primijeniti nad vremenskom serijom
opisanom REFII sintaksom, jedna je od generalnih prednosti ove koncepcije, u odnosu na
ostale koncepcije koje su procesno orijentirane. Obrada podataka može se izvršiti izradom
Vremenska serija
Transformacija u REFII sintaksu
Algoritmizirana obrada
Otkrivanje znanja
17
algoritama za procesiranje ili posredstvom zatvorene metodologije na način da algoritam bude
dio nekog većeg analitičkog paketa. U oba slučaja važna faza u postupku je pretprocesiranje i
kontrola kvalitete prije svakog slijedećeg koraka.
Karakteristika koja je ujedno i prednost ove koncepcije očituje se u modularnosti koja je
determinirana problemskim prostorom i koja nudi modele rješenja unutar tog problemskog
prostora primjenom raspoloživih tehnika unutar samog modela, ali isto tako procesuiranjem
parametara posredstvom nadograđenih modula.
Upravo ova koncepcija pruža sa jedne strane snažan alat orijentiran na sofisticiranu analizu
vremenskih serija, a sa druge strane dobivamo vrlo otvorenu arhitekturu za nadogradnju
modela rješenja iz domene različitih područja. Moguće je pronaći radove koji na druge načine
upućuju na sličan pristup a s ciljem analize vremenske serije (Koegh & Pazzani, 1998).
Vremenske serije možemo definirati kao niz kronološki uređenih vrijednosti neke pojave.
Postoje različiti pristupi u analizi vremenskih serija koji dobrim dijelom ovise o problemskom
prostoru u okviru kojeg se vrše analize nad vremenskim serijama. Tako primjerice postoje
specijalizirani modeli za makroekonomska istraživanja, predikcije vrijednosti u budućim
razdobljima, telekomunikacijski modeli ili pak modeli koji se koriste u oblasti fizike.
Ovaj je rad fokusiran prvenstveno na otkrivanje znanja iz vremenskih serija iz oblasti analize
tržišta.
Promatrajući s aspekta primjene, tri su područja u kojima je zanimljivo usporediti pristup.
Modeli su se najprije pojavili u bankarstvu. Neki od prvih alata za analizu do su današnjih
dana narasli u vrlo ozbiljne programske pakete upravo na bazi upotrebe u financijskoj
industriji. Dostupnost podataka o klijentima uz istovremeno mogućnost da se rezultati analiza
direktno kvantificiraju kroz broj prodanih usluga i profit dovelo je do mnogih standarda od
kojih su neki kasnije korišteni i u drugim područjima.
Drugo zanimljivo područje su telekomunikacije. Doživjevši snažan rast pojavom mobilne
telefonije i interneta, modeli u ovom području zahtijevali su veći stupanj prilagodbe na
okolnosti (složenije okruženje) te nisu bili u mogućnosti opravdati svoje postojanje tako
direktnim utjecajem rezultata na poslovanje kao u bankarstvu. Ipak, određen broj tehnika i u
ovom području postao je standard a istraživanja i novi pristupi i dalje se pojavljuju.
Kao područje najzanimljivije za istraživanje koje je istovremeno najteže za upravljanje
pokazuje se trgovina. Iako su prvi radovi koji su popularizirali metode rudarenja podataka bili
iz područja trgovine (analiza pozicioniranja proizvoda u supermarketima – poznati slučaj pivo
18
i pelene, emocionalni aspekt kupnje4) razlog tome više se nalazio u tome da ta područja, zbog
složenosti okruženja, nije bilo moguće analizirati tradicionalnim metodama pa je ovaj pristup
predstavljao nešto novo nego u činjenici da takvi postupci direktno utječu na profit. Područje
trgovine izuzetno je zahtjevno ali i zahvalno za analizu međutim istoj treba pristupiti
uzimajući u obzir ograničenja te kombinirajući metode kako bi se izradio efikasan model. U
tom smjeru a na bazi višegodišnjeg iskustva autora nastao je i ovaj rad.
Do pojave REF modela metodologija analize vremenskih serija u domeni analize tržišta nije
poznavala jedinstveni model transformacije, kao ni usvojenu metodologiju pretprocesiranja
vremenskih serija s ciljem analize.
Općenito gledajući postoji niz nužnih, često puta korištenih postupaka u analizama
vremenskih serija koje predmnijevaju uspjeh analize bez obzira na korištenu metodu i bez
obzira na njihovu međusobnu nekompatibilnost a koje su korištene ili su postale standard u
raznim područjima kako je ranije spomenuto.
U jedan od nužnih postupaka koji prethode bilo kakvoj analizi vremenskih serija odnosi se na
unifikaciju vremenskih pomaka na jednake intervale. Taj postupak naziva se normiranje
vremenskih distanci.
Pod pojmom normiranja podrazumijevam svođenje vremenske serije na jednake vremenske
pomake između vrijednosti atributa. Prilikom normiranja potrebno je uzeti u obzir sve
vremenske podintervale kako bismo dobili jedinstvenu vrijednost na kraju vremenskog
pomaka. U literaturi (Pyle, 1999) se prilikom provođenja ovog procesa prakticira metoda
srednje vrijednosti, medijana moda, te metoda sumiranja.
Normiranje vremenske serije u uskoj je vezi sa stupnjem granulacije vremenske serije.
Jednostavnije rečeno vremensku seriju možemo ograničiti na minute, sate, dane, mjesece.
Procjena stupnja granulacije vremenske serije ovisi o konkretnom problemu kojega
rješavamo.
Slika u nastavku prikazuje opisanu metodologiju i ilustrira razloge, zašto se prilikom analize
vremenskih serija pristupa granulaciji koja se ujedno i može shvatiti kao pretprocesiranje
podataka. Kao što je vidljivo iz slike pojave odnosno poslovni događaji mogu se odvijati u
nejednolikim vremenskim razmacima, što je neprikladno za provođenje analiza. Da bi podaci
bili podesni za provedbu analiza, potrebno ih je svesti na jednolike vremenske razmake
(sumiranje, prosjeci).
4 http://dalje.com/hr-zivot/posaljete-li-mladog-oca-po-pelene-vratit-ce-se-s-pivom/337995; 10.08.2011.
19
Prilikom pristizanja informacija koje čine vremensku seriju, te informacije mogu dolaziti u
nejednolikim vremenskim razmacima (npr. sat i minuta obavljene transakcije na prodajnom
mjestu). Iako je ta podjela detaljna i opisuje realnu situaciju, ona je analitičaru kod evaluacije
vremenskih serija neprimjerena za analizu.
Prema nekim autorima (Westphal & Blaxton, 1998) neobrađena vremenska serija može biti
interesantna za promatranje nekim od alata za vizualizaciju, pri čemu možemo vizualno
odrediti trendove, gomilišta i sezonske oscilacije usprkos nejednolikoj vremenskoj raspodjeli.
No, ozbiljnijoj analizi vremenskih serija u domeni marketinških analiza možemo pristupiti
nakon svođenja vremenske serije na jednake odsječke kao što je to prikazano na ranijoj slici.
Nakon ovog postupka vremenska serija se transformira u prepoznatljiv stepenasti oblik koji je
podijeljen na jednake vremenske odsječke, što je polazišna osnova za veliki broj algoritama
za analizu vremenskih serija, pa tako i REFII model .
Proces normizacije odnosno granulacije spada u etapu pretprocesiranja podataka, a ovom
procesu prethodi proces čišćenja podataka. Pod pojmom čišćenja podataka u vremenskoj seriji
podrazumijevamo procese dijagnosticiranja i otkrivanja nedostajućih vrijednosti atributa i
njihovu supstituciju sa vrijednostima. Bitna predradnja prije samog pristupanja analizama
vremenskih serija jest otkrivanje “ekstremnih vrijednosti” (outliers).
20
SLIKA 2.3.2. Pretprocesiranje vremenske serije (Klepac, 2004, 12)
Ekstremne vrijednosti mogu nastati smetnjama u sustavu, ali isto tako mogu biti činjenično
stanje koje upućuje na određenu anomaliju koja može biti putokaz u otkrivanju nekih
ekstremnih stanja promatrane pojave. Uobičajena metoda za otkrivanje eksternih vrijednosti
koja je obuhvaćena u okviru softverskih paketa je metoda vizualizacije vremenske serije
(Jensen & Nielsen, 2007), nakon čega analitičar procjenjuje da li je određena ekstremna
vrijednost nastala kao rezultat smetnji sustava, ili pak kao rezultat objektivnih vrijednosnih
kretanja promatranog atributa na osnovu realnih tržišnih ili nekih drugih situacija. U slučaju
smetnji ekstremne vrijednosti se izoliraju iz promatranog uzorka, u protivnom ostaju u uzorku
kako bi se podvrgli procesu analize. Autori (Pyle, 1999) prednost prilikom otkrivanja
ekstremnih vrijednosti podataka daju klasičnoj statistici.
Najčešći tipovi analize koji se provode nad vremenskim serijama koncentrirani su na
pravilnosti kretanja neke pojave unutar vremenskih odsječaka (npr. otkrivanje sezonskih
oscilacija), predviđanje (eng. forecasting), otkrivanje senzibiliteta i jačine pomaka atributa u
atonomnom vremenskom odsječku.
Vrijednost pojave X
Vrijeme (sat:minuta)
Vrijednost pojave X
Vrijeme (dani)
21
Algoritmi koji uspješno rješavaju ove tipove problema izvedeni su iz klasičnog matematičkog
instrumentarija i svode se uglavnom na vektorski račun, a u pojedinim rješenjima i na fuzzy
logiku.
Dosadašnji algoritmi pristupali su vremenskoj seriji prvenstveno kao području gdje se
klasične data mining mining metode nisu direktno mogle primijeniti na vremensku seriju,
nego se za taj tip problematike koristio instrumentarij specijaliziran samo za to područje.
Model REF II koji je odabran specijaliziran je za analizu vremenskih serija, ali isto tako
otvara vrata ka primjeni klasičnih data mining algoritama na vremensku seriju. Na taj način
otvara se čitav niz novih mogućnosti za dogradnju modela kao što je primjerice korištenje
metoda poput klasteriranja odsječaka (uzoraka) vremenskih serija, klasifikacija (stabla
odlučivanja) odsječaka (uzoraka) vremenskih serija, predviđanje (neuralne mreže) daljnjeg
trenda vremenske serije na osnovu odsječaka (uzoraka) vremenske serije.
Definiranje vremenske serije posredstvom niza parametara otvara mogućnost korištenja
klasičnih algoritama u otkrivanju znanja i prepoznavanja uzoraka. Shema metodologije
primjene odsječaka vremenske serije u klasičnim algoritmima rudarenja podataka prikazana je
na slijedećoj slici.
22
SLIKA 2.3.3. Metodologija procesuiranja vremenske serije (Klepac, 2004, 14)
Jedna od vrlo bitnih karakteristika prikazanog modela svodi se na činjenicu da je njegovom
primjenom moguće izmodelirati rješenja za određene tipove problema kako u bankarstvu tako
i u područjima trgovine, medicine, prepoznavanja uzoraka i slično.
2.4. Dodatni razlozi za istraživanje ovog pristupa
Promišljanja za izradu ovog modela započela su izradom magistarskog rada (Mršić, 2005)
odnosno potrebom da se izradi sustav koji bi pomogao u svakodnevnom radu a vezano na
aktivnosti oko planiranja i odlučivanja u trgovini. Tijekom izrade magistarskog rada testirane
su razne metode na stvarnim uzorcima podataka te se, uslijed ograničenja koja su se
pojavljivala primjenom pojedinačnih metoda, logičnim pokazala ideja kombiniranja više
metoda. Problem pri korištenju više metoda je sa jedne strane u pojednostavljivanju polja
rješenja (pitanje kvalitete podataka mijenjanjem razine granulacije) a sa druge strane izazov je
izraditi jednostavno primjenjiv i što univerzalniji model sa, po mogućnošću, intuitivnim front-
end rješenjem za korištenje i od strane osoba koje nisu analitičari već donosioci odluka
Klasični algoritmi rudarenja podataka: klasteriranje, neuralne mreže, stabla odlučivanja, link analiza...
Znanje o vremenskoj
seriji
Vrijednost pojave X
. . .
Skup vrijednosti X(1)
Skup vrijednosti X(2)
Skup vrijednosti X(3)
Skup vrijednosti X(n)
Vrijeme (dani)
23
(dakle, odlično poznaju problematiku i uzročno-posljedične veze no nemaju duboko znanje u
primjeni analitičkih metoda i njihovim karakteristikama).
Obzirom na pristup u izradi modela, u proteklih nekoliko godina dogodile su se određene
promjene koje je važno spomenuti a koje u u nekoj mjeri utjecale na izradu ovog rada te
istovremeno prisnažuju potrebu za postojanjem ovakvog i sličnih modela te daju poticaj
daljem istraživanju ovog područja.
Prije svega vezano na generalne okolnosti na tržištu, svjedoci smo globalnog zatopljenja koje
ima dalekosežan utjecaj na sve aspekte društva. Za tržišne grane, efekti globalnog zatopljenja
očituju se u povećanju prosječne temperature, poremećaju sezonskih ciklusa te snažnijim
izmjenama meteoroloških prilika u kraćem vremenskom intervalu. Sezonska ovisnost i utjecaj
sezona posebnost su mnogih roba a posebno tekstilnih proizvoda. U konkretnom slučaju za
primjer modela u ovom radu korišteni su podaci iz mreže maloprodajnih mjesta u 2006. –
2008. godine na području Grada Zagreba (meteorološki podaci sa postaje Maksimir, Zagreb).
U tim godinama, iako se utjecaj globalnog zatopljenja već mogao osjetiti većim prosječnim
temperaturama ljeti, izmjena sezona ljeto-zima još uvijek je bila pravilnija ili više nalik
ranijim godinama nego u sezonama koje su slijedila do danas. U interpretaciji rezultata
modela ipak je primijećen utjecaj rasta prosječne godišnje temperature između promatranih
godina te je isti obuhvaćen komentarom na stvarnim podacima i utjecajima. Slika u nastavku
prikazuje odstupanja od prosječne globalne temperature od 1901. – 2000. godine Nacionalnog
centra klimatskih podataka u SAD koji prati kretanje temperature i utjecaj tog kretanja na
ostale aspekte života. Grafikon prikazuje snažno odstupanje tijekom 80ih i 90ih godina
prošlog stoljeća te nije za očekivati pad tijekom godina koje slijede.
24
SLIKA 2.4.1. Odstupanja globalne temperature5
Takva vrsta promjena ukida ili umanjuje jedno od temeljnih karakteristika sezonski ovisne
trgovine, postojanje jasno razdijeljenih sezona. Posebno, u uvjetima globalnog tržišta moguće
je neke zakonitosti koje se pojavljuju u područjima koje sporije zahvaćaju efekti zatopljenja
iskoristiti u onim u kojima su ti efekti snažnije zastupljeni. Važnost klimatskih utjecaja te
spomenute promjene čine set klimatoloških podataka vrlo važnim u ovakvim istraživanjima
na što upućuju i referentni radovi. Modela opisan u ovom radu omogućava korištenje i
uspoređivanje ovih podataka sa drugima na vrlo efikasan način. Obzirom sam tijekom svoje
karijere imao prilike utjecati i na formiranje skladišta podataka iz kojeg se koriste podaci o
prodaji i imao na raspolaganju podatke do danas u primjeru sam se odlučio za vremenski
interval do 2008. zbog još jednog važnog događaja odnosno niza događaja koji je utjecao na
kvalitetu tih podataka.
Financijska kriza koja je pogodila svijet 2008. godine utjecala i, i još uvijek utječe, na sve
aspekte društva. Globalnog karaktera sa nezabilježeno dubokim i širokim implikacijama na
najšire skupine krizu karakterizira niz okolnosti poput:
- početnog ignoriranja dimenzija problema pri čemu je uslijed promišljanja da je
problem lokalne prirode te ne-djelovanjem konačni efekt dodatno pojačan,
5 http://www.ncdc.noaa.gov/cmb-faq/anomalies.php; 01.07.2011.
25
- nerazumijevanja okolnosti u kojima je došlo do krize uslijed čega je došlo do pokušaja
da se na krizu utječe metodama koje su do nje i dovele što je također povećalu utjecaj
krize,
- gubitka povjerenja u institucije i općenito budućnost uslijed informacija koje su
ukazivale ne širinu problema i ograničene mogućnosti djelovanja,
- efekata smanjenja općih rashoda svih sudionika na tržištu što je dovelo do smanjenja
volumena tržišta što je pak uz efekt fokusiranja kupca na bitno (normalan u uvjetima
ograničenih prihoda) dovelo do značajnog pada u potrošnji pojedinih grupa proizvoda,
- efekta snažne osjetljivosti na cijenu proizvoda neovisno o kvaliteti i porijeklu,
- konačnog stanja u kojem je potrebno stalno pratiti kretanja te donositi odluke izvan
uobičajenih pravila, na bazi kratkoročnih utjecaja.
Mnogo je raznih autora obrađivalo okolnosti u kojima je došlo do krize. Jedan od zanimljivih
mass-market uradaka na tu temu je cjelovečernji igrani film dokumentarnog karaktera Inside
Job6. Kroz aktere koji su doveli do de-regulacije tržišta te kroz mnoštvo dokumentiranih
podataka i stvarnih osoba impresionira jednostavnost kako je došlo do cijele situacije. Slika
koja slijedi prikazuje Dow Jones Industrial Average7 indeks koji predstavlja vrijednost kroz
uzorak najvećih kompanija SADa uz iznimku kategorija usluga i transporta. Grafikon
prikazuje indeks u periodu od 2000. do danas sa vodljivim snažnim poremećajima u 2008. i
2009. Kriza je dovela do globalnog pada prodaje te gotovo nestajanja nekih tržišnih
segmenata. Najsnažniji negativni efekti očitovali su se u financijskoj industriji, medijima,
auto industriji, trgovini svega što nije osnovna životna potreba. Također, došlo je do
redefiniranja čimbenika koji više nisu bili usporedivi niti je podatke koji proizlaze iz takvih
okolnosti moguće koristiti u ovakvom istraživanju. Možemo reći da je ovim promjenama
potreba za modelima poput ovog opisanog u radu naglo porasla uz istovremeno nestajanje
kvalitetnih podloga za istraživanja istih uslijed poremećaja na tržištu pri čemu su utjecaji bili
toliko snažno da su utjecali na zaključke no nisu bili posljedica normalnog tržišnog
funkcioniranja. Time ovaj rado dobiva dodatnu vrijednost.
6 Sony Pictures, „Inside Job“, 2010.; http://www.imdb.com/title/tt1645089/ 01.07.2011. 7 http://www.djindexes.com/ 01.07.2011.
26
SLIKA 2.4.2. DowJones industrial average indeks8 od 2000. godine do danas
Kao zanimljivost povezano sa ovim istraživanjem valja spomenuti i suradnju sa Državnim
hidrometeorološkim zavidim u Zagrebu9 koje je u sklopu svojih inicijativa za popularizaciju
hidrometeorologije i utjecaja vremenskih prilika na društvo uključio i case-study i model iz
ovog rada kao iznimno rijedak i kvalitetan primjer (Vakula, 2009).
2.5. Pristup odabiru varijabli za model
Cilj ovog rada je dati prijedlog široko primjenjivog modela koji istovremeno može uključivati
potrebno ekspertno znanja i biti jednostavan za korištenje. Iako će se svaki istraživač pri
izradi modela usredotočiti na one podatke koji su mu najzanimljiviji smatram važnim kako u
promišljanju tako i u primjeru modela dati osvrt na pristup pri odabiru varijabli te zaključke
koji su se pokazali kroz vremenski period a tiču se odabira varijabli. Konačno, sam primjer na
predloženom modelu uključuje određene grupe podataka koji možemo nazvati najboljom
praksom za ilustraciju modela. U fazi promišljanja od samih početaka (Mršić, 2005)
istraživanja pa kroz prilagodbu informacijskog sustava, izgradnju različitih vrsta modela i 8 http://stockcharts.com/freecharts/historical/djia2000.html; 01.07.2011. 9 http://www.dhmz.hr; 01.07.2011.
27
primjenu u poslovanju10 iskustva se mogu svesti na nekoliko kratkih ali vrlo korisnih
smjernica:
- uvijek biti otvoren na novi pogled na situaciju,
- suzdržati se razvoja modela „u širinu“ ukoliko nema jasno definiranog okvira zašto to
činiti,
- fokusirati se na kompletiranje modela i testiranje hipoteza (kompletirati vertikale
modela),
- obzirom predloženi model dopušta kombiniranje raznorodnih podataka, usredotočiti se
na ekspertno znanje kao najosjetljiviji dio modela,
- prilikom odabira podataka, posebno ako se radi o specifičnom području, jasno utvrditi
korake u fazama prikupljanja i pretprocesiranja kako bi se isti mogli analizirati i
usavršavati.
Nastavno na primjenu modela u trgovini te ranije spomenute karakteristike takvih sustava,
dosege u istraživanju sličnih sustava te karakteristika roba kao izuzetno se zanimljivim
pokazuje analiza ovisnosti prodaje o vremenskim prilikama. Taj se aspekt pokazao posebno
zanimljivim i u praksi. Razmjenom iskustava za potrebe ovakvog modela na korištenje su
ustupljeni hidrometeorloški podaci za period od 1949. do kraja 2007. godine a kao uzorak za
utvrđivanje kriterija za grupiranje podataka u REFII notaciju. Vezano na podatke korisno je
spomenuti službenu notaciju (Vakula, 2008):
- ledeni dan - najniža temperatura (Tmin) toga dana je niža ili jednaka -10°C,
- studeni dan - najviša temperatura (Tmax) je niža ili jednaka 0°C,
- hladni dan - najniža temperatura (Tmin) toga dana je niža od 0°C,
- topli dan - najviša temperatura (Tmax) toga dana je viša ili jednaka 25°C,
- vrući dan - najviša temperatura (Tmax) toga dana je viša ili jednaka 30°C,
- topla noć - najniža temperatura (Tmin) toga dana je viša ili jednaka 20°C.
Način obrade empirijskih podataka opisan je u dijelu pretprocesiranja podataka. Konkretno u
tekstilnoj branši ali i u nekim drugim grupama roba, postoji snažna sezonska ovisnost koja se
posebno istražuje i analizira. Osim već spomenute podjele tržišnih sezona (proljeće, ljeto,
jesen, zima) u prodaji tekstilne robe, kao primjer može se spomenuti potrošnja plina u
sezonama zima – ljeto, potrošnja pića (poput npr. piva) u sezonama zima – ljeto i slično. Uz
navedeno potrebno je napomenuti da uz uobičajene podatke sve veću upotrebu ima i tzv.
10 vidi životopis autora na kraju rada
28
„feels like“ ili „chill“ faktor11. Radi se o faktoru koji upućuje na korekciju nominalne
vrijednosti temperature i daje osjećaj najčešće hladnijeg ali moguće i toplijeg vremena od
zaključka na koji upućuje temperatura. Najčešće se radi o utjecaju vjetra pri čemu npr. vjetar
koji se pojavljuje navečer i prividno snižava temperaturu (daje osjećaj hladnoće) utječe na
percepciju potrošača na vrijeme sutrašnjeg dana.
SLIKA 2.5.1. Redovna vremenska prognoza za Zagreb Hrvatska12 sa prikazanim „feels like“
faktorom13
Nadalje kod analize vremenskih serija u potrazi za uzorcima i ponavljanjima važnu ulogu
imaju specifični utjecaji poput:
- praznika/neradnog dana (efekt neradnog dana, intenzitet prije samo praznika se
povećava a nakon njega smanjuje),
- raznih organiziranih ili predvidivih događaja (npr. svjetsko prvenstvo, Olimpijske igre,
koncerti i slično) koji utječu na tržište,
- raznih okolnosti (npr. uspjeha tima neke države na nekom natjecanju, marketing
kampanje i slično) koje utječu na tržište,
- ritam životnih navika (tjedni ritam potrošača i utjecaju na njega).
Konkretno u primjeru modela korišteni su podaci o danu u tjednu i broju tjedna dok je za
vremenski odsječak odabran jedan dan.
Odabir varijabli važan je proces u izradi modela. Prednost predloženog modela je mogućnost
kombiniranja raznorodnih varijabli (sve dok se poštuju pravila kojima se procesira u model)
11 http://www.weatherzone.com.au/help/article.jsp?id=59, 20.07.2011. 12 http://www.accuweather.com/en-us/hr/grad-zagreb/zagreb/forecast15.aspx; 10.08.2011. 13 servis AccuWeather, ovdje nazvan „real feel“
29
te dodavanja ili uklanjanja varijabli u svrhu provođenja analiza a nakon što je model već
formiran.
30
3. DRUŠTVENI ASPEKT ISTRAŽIVANJA
3.1. Pojam ponašanja potrošača
Sedamdesetih godina prošlog stoljeća početak je sazrijevanja svijesti da marketing mora biti
djelatnost koja će se orijentirati isključivo prema tržištu i njegovim zakonitostima a one su
ponajviše određene ponašanjem potrošača. Ponašanje potrošača se općenito odnosi na
aktivnosti potrošača na tržištu. Sa aspekta vjernosti kupaca a posebno pojavom internetskih
servisa koji se bave ponudom proizvoda i usluga po posebnoj cijeni (Groupon14, Kolektiva15 i
drugi) jača dvojba treba li se obraćati samo stalnim ili i povremenim klijentima. Autor
najpopularnijeg marketinškog blog-a na svijetu i najprodavanijih knjiga, Seth Godin, nakon
analize zaključuje: potrebno je smisliti način za unapređenje neke ponude koja nije u startu na
razini koju bi kupci očekivali jer takvih uvijek ima („lako“ je prodavati ono što se „samo“
prodaje). I najgora ponuda nekim ljudima može postati najbolja zbog načina na koji se
postupa sa potencijalnim klijentom ili kupcem (Godin, 2008, 72-73).
Ponašanje potrošača predstavlja proces pribavljanja i konzumiranja proizvoda, usluga i ideja
od potrošačke jedinice (Kesić, 1999). Ono također uključuje poslijeprodajne procese koji
obuhvaćaju vrednovanje i poslijeprodajno ponašanje. Treba uočiti da se pod potrošačkom
jedinicom podrazumijeva pojedinac ili obitelj (kućanstvo) koje donosi odluku. To može
također biti stručna grupa u poduzeću, institucija i sl. Moderne marketing teorije također rade
bitnu distinkciju vezano na rodne razlike. Novija istraživanja pokazuju da su žene u
razvijenim zemljama odgovorne za gotovo 80% svih odluka o kupnji16. Marketinški ih
stručnjaci stoga smatraju atraktivnima potrošačima čiji će utjecaj sve više rasti17. Novija
istraživanja pokazuju da žene u SAD utječu na kupnju računalne opreme u 66% slučajeva, na
kupnju automobila u 60% slučajeva, vlasnice su 89% svih novih bankovnih računa te 27%
žena u braku utječe na odluku o kupnji kuće i mjesta za život obitelji. Slične rezultate o rastu
značaja žene kao potrošača možemo vidjeti i u istraživanju kuće GfK u Hrvatskoj od 1995.
godine do 2010. godine18.
14 http://www.groupon.com/, 01.07.2011 15 http://hr.kolektiva.net/, 01.07.2011. 16 Poslovni dnevnik, „Marketing: Važne rodne razlike“, 22.-23.08.2008. ,str. 16 17 izvor: ranije portal kakoprodavati.com danas Facebook grupa kakoprodavati.com, 01.07.2011. 18 http://www.gfk.hr/public_relations/press/press_articles/006398/index.hr.html; 10.07.2011.
31
Definicija ponašanja potrošača upućuje na zaključak da je riječ o procesu. U tom se procesu
mogu izdvojiti tri faze a u okviru svake od njih postoji cijeli niz podfaza koje čine cjelinu
ponašanja potrošača (Kesić, 1999, 2):
- faza kupnje,
- faza konzumiranja,
- faza odlaganja.
U fazi kupnje razmatraju se čimbenici koji utječu na izbor proizvoda i usluga. Najveći dio
proučavanja ponašanja potrošača bavi se upravo ovom fazom ponašanja potrošača.
Faza konzumiranja bavi se procesom konzumiranja i stjecanja iskustvom koje ima značenje
za buduće ponašanje.
Faza odlaganja predstavlja odluku potrošača o tome što učiniti s iskorištenim proizvodom ili
onim što je ostalo od njega. Ovaj problem postaje sve aktualniji u suvremenim životnim
uvjetima i općoj brizi društva za zaštitu okoliša i stvaranju zdravih životnih uvjeta.
Pri proučavanju ponašanja potrošača istraživači polaze od pet osnovnih načela (Kesić, 1999,
2):
- potrošač je suveren,
- motivi ponašanja potrošača mogu se identificirati,
- na ponašanje potrošača može se utjecati,
- utjecaji na potrošača moraju biti društveno prihvatljivi,
- ponašanje potrošača je dinamičan proces.
Načelo suverenosti podržava zaključke teorije i prakse da se potrošačem ne smije
manipulirati, samo mu se može prilagođavati. Ponašanje potrošača uvijek je orijentirano cilju.
Potrošači cijelog svijeta postaju sve obrazovaniji i informiraniji o svemu što se događa i što se
nudi.
Proces kupnje sastoji se od više faza. U tom procesu postoji velik broj varijabli koje imaju
većeg ili manjeg utjecaja na pozitivan ili negativan rezultat kupovnog procesa. Istraživanje
usmjereno na pojedine elemente ponašanja potrošača i njihovu međusobnu povezanost ima za
cilj pojasniti sam proces donošenja odluke i načina, te jačinu utjecaja pojedinih varijabli u
32
tom procesu. Ono što je specifično za sva društvena istraživanja jest da se uvjeti stalno
mijenjaju pa s njima i intenzitet i smjer utjecaja pojedinih varijabli.
Iako je suvremeni potrošač suveren, moguće je utjecati na njegovo ponašanje
prilagođavanjem elemenata marketinškog spleta potrošačevim potrebama. Uspjeh se uvijek
postiže ako potrebe postoje ili ako su one latentne i ponuđač ih pokrene proizvodom koji
potrošači svjesno ili podsvjesno trebaju.
Potrebe i motivi potrošača stvarni su i stoga njihovo zadovoljenje pravim i korisnim
proizvodima predstavlja korist za potrošača kao i za društvo u cjelini stoga utjecaji na
potrošača moraju biti društveno prihvatljivi.
Ponašanje potrošača dinamičan je proces. Pojedinac, grupe s kojima je u neprestanoj
interakciji i društvo u trajnom su procesu promjene. Ovo je od krucijalnog interesa za
proučavanje potrošača kao polazišta za donošenje marketing strategija. To znači da su
generalizirani zaključci o ponašanju potrošača limitirani u odnosu na vrijeme, proizvod i
usluge.
3.2. Model ponašanja potrošača
Modeli ponašanja potrošača stvoreni su kao ilustracija procesa donošenja odluke o kupnji s
ciljem isticanja varijabli koje utječu na donošenje odluke i njihovu međusobnu povezanost.
Složenost modela varira među autorima no složeni modeli se u osnovi razlikuju po tome
odnose li se na prvu kupovinu ili rutinsku kupovinu. Razlika zapravo ne postoji u broju
čimbenika i faza već u stupnju psihičke uključenosti i vremenu koje se posvećuje analizi
pojedinih faza.
33
SLIKA 3.2.1. Složeni model ponašanja potrošača (Enge et al, 1995, 53)
Ponašanje potrošača pod utjecajem je velikog broja čimbenika koji su međusobno povezani a
mogu se grupirati u tri skupine:
- društveni čimbenici,
- osobni čimbenici
- psihološki procesi.
Društvene čimbenike čine: kultura, društvo i društveni staleži, društvene grupe, obitelj,
situacijski čimbenici i osobni utjecaji.
Osobne čimbenike čine: motivi i motivacija, percepcija, stavovi, obilježja ličnosti vrijednosti i
stil života, znanje.
Psihološki procesi su: prerada informacija, učenje, promjena stavova i ponašanja, osobni
utjecaji.
Složenost procesa donošenja odluke o kupnji ovisi o mnogim utjecajima što dodaje težinu na
zadatak prediktivnog modela, odnosno uvećava vrijednost pronalaženja mogućih zakonitosti.
spoznaja potrebe
traženje interno pretraživanje
utjecaji okruženja: kultura socijalne grupe osobni utjecaji obitelj situacija
indidualne razlike: potrošačevi resursi motivacija i
uključenost znanje stavovi obilježja ličnosti vrijednsoti i stil
života
alternativno vrednovanje
kupnja
rezultati
nezadovoljstvo zadovoljstvo
stimulansi
tržišno orjentirani
vanjsko traženje
memorija
izloženost
pažnja
razumjevanje
prihvaćanje
zadržavanje
ulaz
podataka
prerada informacija
proces donošenja odluke
varijable koje utječu na donošenje odluke
34
3.3. Donošenje odluke o kupnji tekstilnih proizvoda
Pri donošenju odluke o kupnji tekstilnih proizvoda potrošači su izloženi i nekim, za tu vrstu
proizvoda, specifičnim utjecajima. Premda se ti utjecaji mogu svrstati u teoretski model koji
je izložen ranije, posebno se opisuju obzirom na važnost koju imaju u promatranom procesu.
Ono na što želim skrenuti pažnju jest priroda tekstilnih proizvoda koja u kontekstu donošenja
odluke o kupnji može: pobuditi kod potrošača tradicionalni proces prikupljanja informacija
nakon čega slijedi odabir prema odgovarajućim karakteristikama ili pobuditi iracionalnu
odluku o kupnji modnog proizvoda kako bi se zadovoljili afiniteti koji ne moraju nužno biti
vidljivi.
Istraživanja danas pokazuju da potrošači ne slijede jednu strategiju već da posjeduju cijeli
skup različitih strategija koje završavaju kupnjom (Solomon & Rabolt, 2004, 353).
35
SLIKA 3.3.1. Faze u modnom i tradicionalnom procesu donošenja odluka (Solomon &,
Rabolt, 2004, 353)
3.3.1. Vrste odluka potrošača
Jedan od zahvalnih načina karakteriziranja procesa donošenja odluka je mjerenje uloženog
truda u donošenje odluke. U ovom kontekstu tzv. kontinuum donošenja odluke o kupnji
omeđen je s jedne strane svakodnevnim, rutinskim odlukama o rutinskim problemima te
složenim odlukama/problemima na suprotnoj strani. Većina odluka pada u sredinu, područje
nazvano ograničeno rješavanje problema (Solomon & Rabolt, 2004, 354).
Modni proizvod (neki proizvod je atraktivno
izložen, predstavljen)
Uočavanje (spoznaja) proizvoda
(uočili smo proizvod)
Zanimanje (pokazujemo zanimanje i
gledamo proizvod)
Procjena (isprobavamo proizvod i
trenutno počinjemo uživati u njemu)
Odluka (kupujemo proizvod)
Rezultat (uživamo u kupljenom
proizvodu)
Prepoznavanje problema (shvaćamo potrebu za
odijelom za neku prigodu)
Prikupljanje informacija (raspitujemo se o mogućim
rješenjima)
Procjena alternativa (uspoređujemo nekoliko stilova i marki u trgovini
vezano uz sastav, porijeklo, ciujenu i dodatne pogodnosti)
Odabir proizvoda (odabiemo proizvod jer ima odgovarajuće karakteristike)
Rezultat (kupujemo proizvod i
uživamo u njemu)
DONOŠENJE ODLUKE AKO JE U
PITANJU MODNI PROIZVOD
TRADICIONALNO DONOŠENJE
ODLUKE
36
SLIKA 3.3.1.1. Kontinuum donošenja odluka o kupnji (Solomon & Rrabolt, 2004, 354)
Razna istraživanja danas bave se pojedinim skupinama potrošača te proučava stilove
donošenja odluka. Kao neke od najzanimljivijim za trgovce u maloprodaji izdvojene su neke
skupine čije nazive prenosim u originalu u svrhu lakšeg razumijevanja (Solomon & Rabolt,
2004, 356):
- shoppers – karakterizira ih visok stupanj zanimanja za trgovine i planiranje izleta u
kupovinu,
- loyals – uključeni u kupnju, raznovrsnost i vrijednost,
- late bloomers – slično prethodnima ali manje uključeni znanjem o proizvodima,
važan je faktor uvjerenja
- narrowers – nezainteresirani za proces kupovanja,
- apathetics – mlađi, nemaju želju ili mogućnost uključenja u kupnju,
- avoiders – najnegativniji prema procesu kupnje, imaju malo vremena na raspolaganju.
3.4. Čimbenici koji utječu na potrošače u trgovini tekstilnim proizvodima
Obzirom su kroz rad predstavljene sve posebnosti tekstilnih proizvoda u smislu atributa koji
ih određuju a mogu biti od većeg ili manjeg značenja u procesu odluke potrošača ovaj
odjeljak osvrće se na još jedan važan pojam koji do sada nije napomenut – modu.
rutinske odluke ograničeno rješavanje problema
rješavanje složenih problema
proizvodi niske cjene
redovite kupnje
neznatan utjecaj
potrošača
poznati proizvodi
(vrsta, brand)
skuplji proizvodi
rijetke kupnje
veliki utjecaj
potrošača
nepoznati proizvodi
(vrsta, brand)
37
Modna industrija zapošljava milijune ljudi diljem svijeta, profiti se mjere u milijardama eura.
Nedvojbeno utječe na gotovo sve potrošače današnjeg svijeta. Moda se odražava na naše
društvo i kulturu te na neki način utječe na to kako ljudi doživljavaju sebe. Utječe na
promjenu garderobe, namještaja, automobila koje vozimo. Poslovna praksa također je
podložna modnim utjecajima. Moda je svuda oko nas.
Zamislimo običnu t-shirt majicu koju zasigurno svatko posjeduje u vlastitom ormaru.
Istraživanja vlakana od kojih je sačinjena, projekcije boja i kretanja modnih trendova,
istraživanja tehnoloških rješenja u proizvodnji i tkanju, uključenost posrednika i dorađivača,
dizajneri, savjetnici, logistika, PR agencije, modni časopisi i, na kraju, maloprodajni dućan.
Svi su oni nekim dijelom zaslužni za navedenu kupnju.
Još neke važne karakteristike mode su slojevitost (masovna, visoka), ovisnost o veličinama i
cijeni (dobne skupine, skupine prema veličinama) te ukus kao posebno zanimljiv.
Razni autori upućuju i na vremensku dimenziju kao dodatni, do sada vrlo malo spominjani,
faktor utjecaja. Promatrajući vremensku dimenziju, jednostavno stupnjevanje, prema
teoretskom pristupu kojeg je razvio J. Laver, glasi (Solomon & Rabolt, 2004, 12):
- nepristojno 10 godina ispred svog vremena
- besramno 5 godina prije vremena
- hrabro 1 godinu prije vremena
- pametno sada
- neuredno 1 godinu nakon svog vremena
- strašno 10 godina nakon vremena
- apsurdno 20 godina nakon vremena
- smiješno 50 godina nakon vremena
- šarmantno 70 godina nakon vremena
- romantično 100 godina nakon vremena
- lijepo 150 godina nakon vremena
Također, dostupna detaljna istraživanja (Wang et al, 2002), provođena na tržištu tekstilnih
proizvoda u Kini, odnosno njihovi rezultati, definiraju osam mentalnih karakteristika koje
opisuju donošenje odluka u potrošača. One su redom:
- spoznaja o kvaliteti,
- spoznaja o brandu,
- spoznaja o modi,
- r
-
- t
- z
- l
Ovih os
su direk
potrošač
zemlji p
3.4.1. C
Ciklus
određen
Samo n
planiran
je znati
istraživa
Moda b
masovn
nemogu
(obzirom
(Solomo
imati is
rekreacijska
spoznaja o
tendencije i
zbunjenost
lojalnost br
sam stilova
ktno povez
či su najče
porijekla rob
Ciklus prihv
prihvaćanja
nog stila. Sli
SLIKA
neki od sti
nju nabave
koji od utje
anja te u skl
biva prihva
nog tržišta. M
uće je cjelo
m ih nije
on & Rabo
sti proizvod
a i hedonist
cijeni proiz
impulzivnom
prevelikom
randu.
opisuje osn
ane s pona
ešće posebnu
be.
vaćanja mo
a mode pom
ično nekim
3.4.1.1. Uo
lova postaj
ili prodaje,
ecaja mogu
ladu s tim in
aćena od s
Moda je slo
ovito obuh
bilo mogu
olt, 2004, 2
d), tickle-do
ička orijent
zvoda,
m i naglom
m ponudom i
novne menta
ašanjem pot
u pažnju po
ode
miruje dola
drugim pro
običajen mo
ju klasici,
proizvodnj
u biti prisutn
nterpretirati
strane malo
ožen proces
hvatiti no z
uće kvalitet
0): kolektiv
wn (neki br
tacija,
ponašanju,
i
alne karakte
trošača. Pre
osvećivali r
azak, prihva
oizvodnim c
odni ciklus (
oni koji b
je ili pokuš
ni kako bism
i zaključke.
og broja k
s koji funkc
za eventual
tno prevest
vnu selekcij
rand koji st
,
eristike don
ema istom
edom: bran
aćanje, vrhu
ciklusima i o
(Solomon &
ivaju prihv
šaju izgradn
mo prema n
klijenata pr
cionira na v
lna kasnija
ti neki su
ju (pojavu
tarta sa poz
ošenja odlu
istraživanju
ndu, stilu, di
unac te pre
ovaj je mog
& Rabolt, 20
vaćeni uvije
nje prediktiv
njima mogli
rije nego p
više razina.
istraživanj
nazivi nav
kada napro
zicije "ispod
uka u potroš
u pri kupnj
izajnu, boji
estanak prih
guće vizuali
004, 13)
ek i bilo g
vnog model
i korigirati r
postane pre
Različitosti
ja valja sp
vedeni u or
osto svi nos
d" drugoga
38
šača koje
i odjeće
, cijeni i
hvaćanja
izirati.
gdje. Pri
la važno
rezultate
edmetom
i pokreta
pomenuti
riginalu)
se i žele
trudi se
doći na
brand),
sposobn
naglo pr
Marketi
zrelost i
- u
p
v
- o
z
p
- o
r
a njegovu ra
tickle-acro
nih kao odr
robiti u tren
ing ciljevi t
i odbijanje.
upravljanje
pokrili troš
voditi račun
ograničena
zreloj fazi
profitabilno
oglašavanje
razlikovanj
azinu, po d
oss (širenje
raz statusa),
nd).
SLIKA 3
tijesno prate
Primjer stra
cijenom: u
škovi razvoj
na o ponudi
distribucija
uklanjanj
osti,
e: u ranijo
e od konkur
dolasku klij
trendova
, subkulturn
3.4.1.2. Uob
e životni ci
ategije uzim
u fazi uvođe
oja i uvođen
konkurenc
a u početn
e ograniče
oj fazi usm
rencije i slič
enti vjerni
unutar odre
ni ili tickle-
bičajen živo
iklus proizv
majući u obz
enja strateg
nja, u zrelo
ije,
noj fazi: mo
enja u dis
mjereno na
čno.
brandu koj
eđenih sku
up (origina
otni ciklus p
voda prema
zir sliku mo
giju postavit
oj fazi pri
ože stvoriti
tribuciji di
kreativnos
ji je bio "iz
upina bilo d
alni radovi s
roizvoda
kategoriza
ože biti na p
ti na dodatn
formiranju
i pozitivan
irektno utj
st, u zreloj
znad" napu
dobnih ili
subkulture m
aciji: uvođen
primjer:
ni profit čim
cijene potr
efekt potr
eče na po
oj fazi na
39
uštaju taj
platežno
mogu se
nje, rast,
me bi se
rebno je
ražnje, u
ovećanje
brand i
19 http://in
Karakteris
Prodaja
Troškovi
Profit
Klijenti
Konkurenc
Marketing
Strategije
Proizvod
Cijena
Distribucij
Oglašavanj
Promocija
SLIKA 3
nstruct1.cit.co
tike
N
V
cija
ciljevi
Sno
a
je
Nku
prodaje
3.4.1.3. Cilj
ornell.edu/cou
↓
Niska prodaja
Visok trošak po klijentu Negativan
Inovatori
Slaba
nažna svijest proizvodu i
iskustvu
Ponuditi osnovni proizvod
Dodatno povećana
Selektivna
Naglasak na upce koji rano
usvajaju novosti
Snažna
evi i strateg
urses/cuttinged
↓
Drastičan raprodaje
Visok trošak klijentu
Negativan
Inovatori
Slaba
Maksimizaciudjela na tržiš
Ponuditi dodatke i dodatne
vrijednostiCijena
usmjerena penetraciji
tržišta
Intenzivna
Naglasak namasovno trži
Ograničena nzahtjevne kup
gije marketi
dge/lifeCycle/
↓
st Vrhunac
po Nizak troklijeVis
Većina
Stabilopada
ija štu
Maksimprofit
zadržaudje
i
Osigurazličite
Cijeuspored
konkure
a Dodaintenz
a šte
Naglasbran
razlikovkonkur
na pce
Ograničzadržava
prelakonkur
inga i životn
/10.htm, 01.07
↓
prodaje Pro
ošak po entu
Niz
ok U
tržišta Zpr
lna, u anju U
mizacija ta uz avanje ela
Ot
isko
urati modele
Uk
ena diva sa encijom
R
atno zivna
Unepkan
sak na nd i vanje od rencije
Ograo
reana
čena na anje od aska renciji
Ogma
ni ciklus pro
7.2011., origin
↓
odaja opada
zak trošak po klijentu
U opadanju Zaostali u rihvaćanju
U opadanju
Ograničiti troškove i oristiti brand
kinuti slabe modele
Reduciranje cijene
Ukidanje profitabilnih nala, lokacija graničiti na azinu koja osigurava akciju samo ajvjernijih kupaca
graničena na minimalne aktivnosti
oizvoda19
nalno Kotler P
40
P.
41
SLIKA 3.4.1.4. Usporedba ciklusa prihvaćanja za klasične i modne proizvode ( Solomon &
Rabolt, 2004, 3)
Bez obzira radi li se o proizvodnji ili prodaji važno je skrenuti pažnju na oscilacije koje
različiti atributi koji opisuju tekstilni proizvod mogu uvjetovati. Ilustracija pokazuje kako
ciklusi prihvaćanja mogu utjecati na trendove u prodaji. Prema tome, dobro odmjeren odnos
između trendovskih, modnih i klasičnih proizvoda upravo je ono što tražimo. Tekstilni
proizvodi mogu se klasificirati na najrazličitije načine. Na primjer tzv. bazni proizvodi poput
majica kratkih rukava i traperica mogu se prodavati i nekoliko godina bez većih varijacija.
Poslovni model koji se bazira na prodaji baznih proizvoda mora planirati dug životni ciklus
proizvoda te stalne kupce koji kupuju više komada proizvoda u dužem periodu. Životni
ciklus modnog proizvoda traje kraće od onog baznih proizvoda. Prema definiciji, moda je stil
nekog vremena. Veliki broj ljudi prihvaća određeni stil u nekom trenutku. Kada više nije
prihvaćen od većine, modni ciklus završava. Privremeni proizvodi imaju najkraći životni
ciklus. Tipično to su proizvodi prihvaćeni od određene sub-kulture ili grupe u kratkom
vremenu. Slično navedenoj klasifikaciji u npr. prehrambenoj industriji grupiranje je moguće
izvršiti prema roku trajanja neke namjernice ili sezoni. U npr. trgovini elektroničkim
uređajima u kojoj razvoj tehnologije gura stare proizvode sa polica također je moguće
govoriti o ciklusu prihvaćanja.
3.5. Ponašanje potrošača i rudarenje podataka
Ranije je spomenuto da općenito možemo reći da se ponašanje potrošača odnosi na aktivnosti
potrošača na tržištu. Istraživanjem ponašanja potrošača nastoje se naći odgovori na slijedeća
pitanja (Panian, 2003, 14):
- što potrošači na tržištu čine?
- zašto to čine?
42
- kako to čine?
Kao i mnoge druge pojave u svijetu u kojem živimo, i ponašanje potrošača s vremenom se
mijenja. Razlozi tome su mnogobrojni, a među najvažnije svakako spadaju opći društveni i
ekonomski napredak, promjene u političkom ustrojstvu svijeta, povećan standard i kvaliteta
života ljudi, obitelji i društvenih zajednica, kumuliranje individualnoga, organizacijskog i
kolektivnog znanja te tehnologija.
Među svim čimbenicima posebno je potrebno istaknuti tehnologiju i to poglavito
informacijsku tehnologiju. Poboljšane metode, tehnike, sredstva i alati kakve donosi i stvara
ta tehnologija omogućuju temeljitije i obuhvatno istraživanje ponašanja potrošača što
tvrtkama i njihovu managementu otvara mogućnosti pronalaženja boljih načina
uspostavljanja, održavanja i unapređenja odnosa s potrošačima odnosno njihovim klijentima.
Pokušaji da se zakonitosti prirode egzaktno izraze i prikažu kroz vrijeme je izazov mnogim
istraživačima. Rudarenje podataka bazirano je na raznim znanstvenim disciplinama pa su
stoga potrebne razne vještine kako bi se došlo do upotrebljivih rezultata.
"Ljudi će Vam reći da vole odreske. No, kada pripremaju prazničnu zabavu kupuju
hamburgere. Postoji odmak između onoga što ljudi kupuju i onoga što žele20". Slijedeći ovu
izjavu možemo konstatirati da će jedan od najvećih izazova rudarenju podataka biti
istovremeno i nerješiv. Naime, rudarenjem podataka možemo doći do predviđanja ponašanja
potrošača baziranog na ponašanju u prošlosti (kojim navikama teže na temelju ranije
učinjenih transakcija, demografskih informacija itd.). Može li se zaista predvidjeti što ljudi
žele kupiti?
Rudarenjem podataka utvrdit ćemo da je 34-godišnjak, član obiteljskog domaćinstva sa
suprugom i dvoje djece sklon kupnji npr. zimske jakne od perja svake tri godine. Ono što ne
znamo jest da li bi ta osoba kupila vuneni zimski kaput (koji je znatno skuplji proizvod), ako
bi kombinacija čimbenika koji utječu na kupnju na čelu s cijenom bila odgovarajuća.
Zasigurno, svjedoci smo utjecaja kojeg ovakve analize imaju na tržište, na ponudu i na
ponašanje ponuđača, doživljavamo ih općenito i u pozitivnom kontekstu nas kao potrošača.
No, jesmo li zaista svjesni kako ovakve analize mogu rezultirati npr. usklađivanjem cjenovnih
politika pri čemu spoznaja da je neki proizvod popularan, i shodno tome ponuđač odluči
podići/zadržati određenu cijenu, negativno djeluje na nas kao potrošača?
20 http://news.com.com/Behind+the+numbers/2009-1017_3-252162.html, navod Johnstone K. direktor BI odjela tvrtke Emerald Solutions, 20.10.2004.
43
Može li se ciljanim marketingom djelovati na potrošače određene životne dobi i tome ih
pridobiti da u kasnijim razdobljima života ostanu vjerni određenim proizvodima? Moguće je
da ako istraživanja pokažu slijepu vjernost nekim proizvodima trgovci odluče upravo na
njima ostvarivati dodatnu zaradu. U budućnosti nas očekuje sve veća penetracija rudarenja
podataka u domenu marketinga i ostalih, u osnovi ne-statistički orijentiranih, područja. Hoće
li se i u kojoj mjeri to negativno odraziti na potrošače ostaje da se vidi.
Jedno je očito: strogo kategoriziranje potrošača nikada ne treba shvatiti doslovno. Različite
kupnje mogu inicirati različite obrasce, mogu na različite način utjecati na kupca da potraži
dodatne informacije jednako kao što iskustvo može, bez posebnog razloga za kupca, utjecati
na promjenu odluke o kupnji. Ponašanje potrošača prvenstveno ovisi o proizvodu a tek nakon
toga o ostalim čimbenicima.
Dostupnost informacija svakog dana postaje sve veća no na pojedincima ostaje da svjesnošću
usmjere tehnološke prednosti u vlastitu prednost. Kombiniranjem prodajnih kanala uz
kvalitetnu i jasnu strategiju marketinga koja je podržana analitičkim izvještajima moguće je
doprijeti do potrošača.
Vezano na proučavanje ponašanja potrošača odnosno analitičko promišljanje pri donošenju
odluka i povezivanje sa metodama umjetne inteligencije potrebno je spomenuti Herberta
Simona21 začetnika mnogih danas znanih tehnika u područjima, među ostalima, umjetne
inteligencije, teorije odlučivanja, rješavanja problema, teorije organizacije. Autor preko tisuću
radova i dobitnik Nobelove nagrade 1978. godine22 već kao mladi istraživač fokusira svoj rad
oko ponašanja i kognitivnih procesa pri evaluaciji izbora i donošenju (racionalnih) odluka.
Prema njemu svaka odluka uključuje izbor više alternativa usmjerenih organizacijskom cilju
ili podcilju. Stvarne opcije imat će stvarne posljedice kroz aktivnosti ili ne-djelovanje
prilagođene činjenicama i vrijednostima. U praksi neke alternative mogu biti svjesne ili
nesvjesne, neke svjesne mogu biti neočekivane ili očekivane te se sam smisao aktivnosti može
razlikovati, biti usmjeren ili površan.
Aktivnosti racionalnog donošenja odluka usmjerene su odabiru alternative koja dovodi do
najprihvatljivijeg rezultata od svih opcija. Postupak se može podijeliti u tri koraka (Herbert,
1976, 67):
- identifikacija i sastavljanje liste svih alternativa,
- definiranje svih posljedica do kojih može doći odabirom bilo koje alternative,
21 http://en.wikipedia.org/wiki/Herbert_Simon; 10.08.2011. 22 http://nobelprize.org/nobel_prizes/economics/laureates/1978/; 10.08.2011.
44
- usporedba preciznosti i efikasnosti svake posljedice.
Organizacija ili osoba koja pokuša implementirati ovaj model u stvarnim okolnostima neće
nikada biti u mogućnosti ostvariti sva tri parametra. Pitanje koje se pri tome postavlja je koje
drugačije pristupe, tehnike i/ili procese pri donošenju odluka osoba ili organizacija mora
upotrijebiti a kako bi dosegla približno najbolje rješenje. Odgovor po Simonu je da „čovjek
teži racionalnosti te je uz ograničenost znanjem koje posjeduje djelomično nadišao spomenuta
ograničenja na način da uspijeva sagledavati pojedine probleme izolirajući tek dio varijabli i
ograničen broj posljedica koje u datom trenutku smatra važnim (Herbert, 1976, 82)“. Na tim
je načelima bazirano i ovo istraživanje.
3.6. Vjernost potrošača kao prednost ili nedostatak
U ovom dijelu potrebno je spomenuti i pojam vjernosti potrošača. Razne dodatne pogodnosti,
kartice članstva u privilegiranim klubovima, posebne ponude vežu nas uz osjećaj privrženosti
nekom brandu. U novijoj literaturi sve se više pojam „vjernost“ zamjenjuje pojmom
„pripadnost“. Pripadnost brandu, nekoj skupini tržišta, identifikacija s proizvodom ili
načinom života koji taj proizvod propagira. Na primjeru naše zemlje (iako se ovo može lako
navesti i za druge zemlje) i tekstilne industrije možemo navesti američki brand odjeće
Abercrombie&Fitch23. Tvrtka u portfoliu ima četiri branda tekstila za mlade i rublja od kojih
je najpoznatiji Abercrombie&Fitch. Tvrtka je završila poslovnu 2010. godinu sa 1.069
prodajnih mjesta24 od kojih samo šest izvan SAD-a od kojih je pet otvoreno u posljednjih tri
godine. Dugi niz godina osim prodajnog mjesta u Londonu prezentacija se odvijala isključivo
kroz prodajnu mrežu u SAD-u i prodajno mjestu u Londonu (uz naravno prodaju putem
interneta). To nije spriječilo prodor na tržište i interes za brandom, upravo suprotno. Čak i
danas u Hrvatskoj moguće je u pojedinim prodavaonicama pronaći neki od proizvoda
obzirom postoji potražnja i interes a uslijed nedostupnosti i identificiranja potrošača sa stilom
koji brand propagira posebno među mlađom populacijom.
Vezano na klubove vjernosti u domaćim okvirima važno je spomenuti PremiumClub tvrtke
Lantea Grupa (Mršić, 2008) iz Zagreba koji je prvi klub uveden u takvu vrstu mreže a koji
danas broji gotovo 500.000 članova. Komunikacija sa članovima kluba odvija se putem
mobilnih telefona te su članovi u mogućnosti ostvariti razne dodatne pogodnosti i
23 http://www.abercrombie.com/anf/investors/investorrelations.html, 10.07.2011. 24 http://www.abercrombie.com/anf/investors/investorrelations.html - Store Count History, 10.07.2011.
45
istovremeno biti informirani o svim novostima na lak i personaliziran način. Klub je u
mnogočemu ispred svog vremena te jedinstven u načinu izvođenja sa vrlo respektabilnim
brojem članova.
Općenito vezano na vjernost uvijek se postavlja pitanje u kojoj se mjeri obraćamo vjernom a
u kojoj mjeri novom kupcu. Da li kupac kojeg privučemo akcijom ili popustom ima „snagu“
vjernog kupca koji će se vratiti i sa kojim je moguće ostvariti odnos ili time umanjujemo
vrijednost vjernog kupca koji je s nama duži period. Iako novi smjerovi koji se pojavljuju u
prezentaciji ponude (društvene mreže, servisi za kuponsku prodaju) bilježe velik uspjeh taj je
uspjeh kratkog vijeka i ide na najčešće na teret prodavača (robe ili usluge) a kupac koji na taj
način ostvari benefit dobiva veću vrijednost nego bi to bilo moguće na drugi način čime se
stvara percepcija koju je teško zadržati na duži period25.
Umjesto zaključka u ovom dijelu, obzirom se i ovo područje stalno razvija, navest ću
odabrane smjernice iz iskustva a vezano na zadržavanje kupaca26:
- osigurati dugotrajan osjećaj zadovoljstva kroz uslugu i brigu o klijentu,
- održavati aktivan kontakt s klijentom,
- nagrađivati vjernost kroz dodatne pogodnosti,
- raditi na razumijevanju potreba klijenta,
- tražiti povratnu informaciju od klijenta o kvaliteti usluge,
- personalizirati odnos,
- osigurati kontinuitet kvalitete (neka 50-ta posjeta klijenta bude jednako zadovoljstvo
kao i prva),
- stalno educirati vlastito osoblje,
- dobro poznavati konkurenciju i što nude,
- povremeno (pozitivno) iznenaditi klijenta nečim novim.
U svakom slučaju u razumijevanju odnosa s klijetima pitanje vjernosti i/ili pripadnosti važno
je područje kojem treba posvetiti pažnju.
25 http://www.evancarmichael.com/Marketing/3973/The-Pro--Con-of-Groupon.html, 20.07.2011. 26 http://www.hotelnewsnow.com/Articles.aspx/6068/10-tips-for-retaining-loyal-guests, 10.07.2011.
46
3.7. Smjernice razvoja istraživanja u ovom području
Zamislimo neku uslugu i pružatelja te usluge. Ukoliko sve prođe kako treba zadovoljni smo
izvršenom uslugom i preporučit ćemo uslugu dalje. Ukoliko nas u tom procesu iznenade
nekim ugodnim poklonom ili drugim pozitivnim iznenađenjem postići će oduševljenje. U
ekonomskoj metrici razvio se pojam koji zbunjuje one koji se još uvijek drže klasičnih
modela koji se pak oslanjaju na statistička označavanja, matematičke pristupe i slično. Novi
val kojeg antropolozi u posljednjih nekoliko godina nazivaju doživljajno društvo, upućuje na
povezane pojmove doživljajna ekonomija, doživljajni marketing (Globe, 2001). Europsko
udruženje za marketing27 (ESOMAR) u posljednjih nekoliko godina stavlja na svojim
kongresima u središte pozornosti neuromarketing. Najopsežnija istraživanja na tom području
proveo je Martin Lindstrom (Lindstrom, 2010a) koji je tijekom tri godine analizirao nekoliko
tisuća ispitanika koji su se podvrgli neuro testovima. Nakon izdavanja knjige Buyology
(Lindstrom, 2010b) svrstan je među stotinu najutjecajnijih ljudi na svijetu u 2008. godini
prema časopisu Time28. Istraživanja na temu sveukupnog doživljaja kao odmak od
tradicionalnog pristupa sve se više pojavljuju. Eksperti neuromarketinga tvrde da se te pojave
mogu mjeriti točno kao i tjelesna temperatura. Podražaji se prate iz sekunde u sekundu a u
svrhu utvrđivanja efekata primjenjuju se dva testa: funkcionalna magnetska rezonancija
(fMRI) i elektroencefalografija (EEG). To su tehnologije kojima se mjeri aktivnost
specifičnog područja u mozgu od kojeg zavise reagiranja i akcije te psihološka stanja iz kojih
proizlaze promjene u otkucajima srce, znojenjima, pokretima, trzajima i disanju. Uz tek
poneku referencu u domaćoj literaturi (Pavlek, 2009, 24-27) ovo područje se tek razvija i bit
će predmetom istraživanja u vremenu koje slijedi. Iako neki radovi već ranije upućuju na
istraživanja ponašanja u svrhu povećanja efikasnosti (Choi & Gaskill, 2000, 15-24) razvojem
tehnika oni danas imaju bitno drugačiju podlogu i rezultate. Uglavnom se izvode u području
marketinga sa naznakama primjene u trgovini.
27 http://www.esomar.org/; 15.07.2011. 28 http://www.martinlindstrom.com/index.php/cmsid__buyology_TIME100; 15.07.2011.
47
4. TEORETSKA OSNOVA ZA FORMIRANJE MODELA
4.1. Analiza i predviđanje kao proces
Predviđanje je sveprisutno, svatko u gotovo svakom aspektu svakodnevnog života predviđa
određene pojave i efekte. Predviđanje je vjerojatnosna procjena buduće vrijednosti (Frank et
al, 2003, 107-125). Bitna pretpostavka većine metoda predviđanja je da će se obrasci iz
prošlosti ponoviti i u budućnosti. Uvriježen je termin da je za dobru procjenu potrebno imati
kvalitetne povijesne podatke29, naime povijesnim se podacima formira model koji se koristi
za prijekciju budućih kretanja. Za mnoge organizacije investicije u sustave predviđanja imaju
istovremeno izravan i dugoročan utjecaj na profitabilnost, uslugu kupcu, produktivnost i
slično. Dobar sustav analize i predviđanja osnova je u sprečavanju problema poput manjka
zaliha, propuštanja rokova, izgubljena prodaje, izgubljenih klijenata te propuštanja strateških
prilika.
Sam proces može biti više ili manje složen ovisno o situaciji. Karakteristična procedura
uključuje slijedeće faze:
- identifikacija problema (važno je jasno odrediti ciljne varijable kao npr. potražnju za
nekim proizvodom u vremenu),
- prikupljanje podataka (podaci se moraju pažljivo odabrati i prenijeti u model),
- formiranje modela (nastavno na analizu stvara se hipotetički model sa faktorima
ovisno o postavljenom cilju analize npr. potražnja za konkretnim proizvodom može
biti sezonska ili trenutna u funkciji cijene a pod utjecajem marketing kampanje itd.),
- izvođenje modela (bazirano na hipotezama formira se jedan ili više modela u koje se
prenose stvarni podaci),
- analiza rezultata (provodeći statističke testove model može biti prihvaćen, prilagođen
ili odbačen),
- dalje izmjene i unapređenja (model mora biti konstantno nadziran i podložan
prilagodbama).
29 engleski „good forecast requires good „backcast““
Uobičaj
- u
- m
- k
Univarij
drugih v
spomen
serije i
zakonito
su nasta
Uvjetne
sustavu
„uzrok
procjene
ekonom
jeno, metod
univarijantn
multivarijan
kvalitativna
jantne tehn
varijabli što
nuti u ovoj
i Box Jenk
osti no oni
ali.
e/multivarija
kao na prim
– posljedic
e. Od važni
metrijske me
SLIKA 4.1
de predviđan
na (jedne va
ntna (više v
a.
nike uobičaj
o se često
kategoriji s
kins dijagr
isključuju u
antne meto
mjer prodaja
ca“ vezama
ijih modela
etode multiv
1.1. Proced
nja dijele se
arijable),
varijabli) i
eno koriste
naziva mod
su: pomični
rami. Ovi
uvjetne veze
ode koriste
a kao funkc
a njihov je
za spomenu
varijantne A
dura tijekom
e u tri katego
e vrijeme ka
deliranje vr
i prosjeci, e
modeli mo
e te ih je ne
se za form
cija cijene. I
e primarni
uti u ovoj k
ARIMA met
m procesa pr
orije:
ao ulaznu v
remenskih
eksponencij
ogu pomoć
emoguće ko
miranje uz
Iako su ove
fokus najč
kategoriji su
tode.
redviđanja
varijablu (D
serija. Od v
alno izglađ
ći u identi
oristiti izvan
zročno pos
metode ug
češće na u
u: višestruki
DeLurigo, 19
važnijih mo
đivanje, Fou
ificiranju p
n konteksta
ljedičnih o
lavnom baz
utvrđivanju
i regresijski
48
998) bez
odela za
urier-ove
pojedinih
u kojem
odnosa u
zirane na
točnosti
i pristup,
49
Kvalitativne metode uključuju Delphi metodu, istraživanja tržišta, panel diskusije, povijesne
podatke itd. Ove sugestivne kvantitativne metode najčešće se koriste za izradu dugoročnih
predviđanja pri čemu nema dovoljno podataka iz kojih je moguće izvoditi direktne zaključke.
Kvalitativne metode su korisne u situacijama kada na raspolaganju postoji vrlo malo ili uopće
nisu dostupni minimalni podaci na kojima bi se izvela neka od kvantitativnih metoda. U
poslovanju ove se metode koriste za predviđanje efekata uvođenja novih proizvoda, novih
tehnologija, najbolje strategije i slično.
U današnje vrijeme sve industrije moraju se prilagoditi na promjenjivu okolinu u ranije više
puta spomenutom kontekstu globalizacija tržišta. Kako bi odgovorilo na sve veće zahtjeve
tržišta vezano na svestranost proizvoda i njihovu dostupnost tvrtke razvijaju razne modele
poput „just-in-time“ sustava ili sustava brzog odaziva (Panian, 2007). Kako bi reagirali na
zahtjeve koje postavlja kompetitivnost u globalnom pristupu donosioci odluka moraju
donositi mudre odluke u kratkom vremenu. U stvarnosti, moraju uzimati u obzir i one
okolnosti koje „bi mogle“ utjecati na njihovu industriju. Više od 80% tvrtki koje se bave
tekstilom u SAD pokazale su interes za sustave predviđanja i analize te su uvele jednu ili više
tehnologija iz tog područja u poslovanje (Cassill et al, 1993, 147-155). U svrhu donošenja
odluka uz pomoć modela manageri se moraju oslanjati na rezultate metoda. Bolja analiza i
predviđanje proizvodnje i potražnje za proizvodom uz uvažavanje transportnih i skladišnih
kapaciteta kroz vrijeme najvažniji su faktori za uspješnost poslovanja.
4.2. Korelacija i uzročnost
Često u životu opažamo da dvije pojave pokazuju međusobnu zavisnost ili povezanost.
Znamo da postoji određena povezanost između visine i težine (viši ljudi su u prosjeku teži od
nižih), starosti i krvnog tlaka i slično. Engleski matematičar Karl Pearson razradio je osnovni
računski postupak za izračunavanje stupnja povezanosti i izrazio stupanje povezanosti brojem
koji nazvao koeficijentom korelacije (Petz, 2007). Čak i prije tih radova znanstvenik po
imenu Francis Galton razradio je osnovnu logiku takvog računanja zanimajući se pitanjima
poput odnosa visine očeva i njihovih sinova i odnosa inteligencija očeva i sinova. Zaključio je
da je po pitanju visine ta povezanost znatno veća nego po pitanju inteligencije.
Da li je moguće izvoditi zaključke iz podataka o korelaciji? Korelacija ne znači uzročnost
(Kenny, 1979) ali korelacija omogućava povezivanje na drugi način teško povezivih atributa.
50
U radovima koji prate ova područja moguće je pronaći velik broj kontraverzi i nedorečenosti
vezano na ove pojmove. Korelacija govori o efektu ali ne i o uzroku (Tepeš, 2008).
Korelacijom se podrazumijeva statistička povezanost između varijabli na koje nije utjecano
eksperimentom. Iako se korelacija i kovarijanca30 mogu izračunati iz eksperimentalnih
podataka, termin korelacija se najčešće koristi za varijable koje dolaze iz stvarnih uvjeta, na
kojim nisu rađene prilagodbe. Vrlo često tretirajući podatke nemoguće je doći do konačnih
zaključaka no moguće je doći do podataka o korelaciji između promatranih atributa što
navodi na uvjetni zaključak.
Koeficijent korelacije izračunava se slijedećom formulom:
∑ ∑ ∑∑ ∑ ∑ ∑
pri čemu je:
∑ ž ,
N – broj parova,
∑ , ∑ - suma kvadriranih rezultata varijable X i varijable Y
Obzirom zaključak podrazumijeva potvrdu ili opovrgavanje hipoteze korištenjem podataka.
Kako bi se interpretirali podaci mora postojati razuman broj pretpostavki kako će se podaci
agregirati. Set pretpostavki te set pravila kako će se isti agregirati uobičajeno se naziva model
a podaci su agregirani statističkim metodama. Zaključak nije moguće potpuno iskoristiti za
potvrdu hipoteze iz najmanje dva razloga. Prvi, jer je zaključak dobiven statistički dakle za
dobivanje je korišten točno određeni model stoga nema sigurnosti već samo vjerojatnost.
Drugi, važniji, model ili pretpostavke na kojima se gradi zaključak mogu uvijek biti pod
znakom pitanja. Svaki zaključak je baziran na pretpostavkama pri čemu nije moguće
istovremeno utvrđivati relevantnost pretpostavke i zaključka. Stoga se u znanosti često
izbjegavaju termini „istina“ i „dokaz“ no uvijek se imaju na umu. Nastavno, snaga zaključka
razlikuje se ovisno da li se radi o potvrdi ili opovrgavanju. Opovrgavanje je najčešće
uvjerljivije od potvrde. Opovrgavanje ukazuje da su podaci nekompatibilni sa hipotezama.
30 kovarijanca pokazuje koliko se dvije varijable mijenjaju zajedno, na taj način se vrijednost kovarijace razlikuje od vrijednosti varijance koja opisuje promjene u vrijednosti jedne varijable (njezino osciliranje oko srednje vrijednosti). Kovarijanca postaje sve više pozitivnom za svaki par vrijednosti koji se razlikuje od njihovih srednjih vrijednosti u istom smjeru (zejdničkom pozitvnom ili negativnom odstupanju od svojih aritmetičkih sredina), te postaje više negativna za svaki par vrijednosti koji se razlikuje od njihovih srednjih vrijednosti u suprotnim smjerovima.
51
Potvrda najčešće ukazuje upravo suprotno, da su podaci kompatibilni sa hipotezom.
Uobičajeno, podaci potvrđuju razne zaključke. Potvrda zaključka snažnija je tada ukoliko
nema mogućih alternativnih objašnjenja efekta koji se promatra. Uvjetni zaključak potrebno
je tretirati zasebno i ne miješati ga sa stvarnim zaključkom odnosno potrebno je shvatiti da on
nema snagu ni prirodu zaključka. Pojedine varijable koje proizlaze iz istraživanja korelacije
uopće nemaju kvalitetu zaključka no svejedno se koriste. Generalno, statistika se može
koristiti za potrebu formiranja zaključka no, za potrebe npr. složenih tržišnih uvjeta, statistika
je vrlo pasivan alat. Zaključivanje ide korak dalje no oslanja se na istraživača a ne na
računalo.
Jedan je karakterističan tip zaključka koji najčešće želimo izvesti iz podataka o korelaciji:
uvjetni zaključak. Dugi niz godina znanstvenici i statističari zazirali su od riječi „uvjetno“.
Autor Judea Pearl (Pearl, 2000) vratio je 2000. godine svojim radovima koncept kaulaznosti u
fokus. Uvjeta izjava ima dva dijela: uzrok i događaj. Tri opće prihvaćene pretpostavke moraju
se uzeti u obzir kako bi se moglo reći da „X uzrokuje Y“:
- protok vremena,
- odnos među varijablama,
- istinitost (isključenje manipulacije).
Da bi X uzrokovao Y, X se mora dogoditi ranije u vremenu. Takva vremenska pretpostavka
dovodi do zaključka da je uvjetan odnos asimetričan. Za bolje razumijevanje uzmimo da X
uzrokuje Y sa nekim odmakom u vremenu.
Xt uzrokuje Yt+k pri čemu je t vrijeme a k > 0
Potrebno je napomenuti da Yt+k ne može uzrokovati Xt jer bi to bila povreda pravila
vremenskog odmaka. Uvjetne veze su u osnovi asimetrične nasuprot mnogim statističkim
mjerama koje su simetrične. Implikacija je u rječniku uvjetne vjerojatnosti aktivan, dinamičan
proces koji se mora dogoditi tijekom vremena. Analizirajući spomenuto postavlja se pitanje
može li se veza odnositi na isti način i na događaje unatrag u vremenu. Uzmimo primjer u
kojem osoba analizira ekonomsku situaciju te analizom primijeti da dolazi do pada kojeg nije
moguće izbjeći. Ta osoba tada izvede niz ekonomskih mjera kako bi se zaštitio od dolazećeg
pada (u mjeri u kojoj je to moguće). Mogli bismo diskutirati da li je pad nakon provedenih
odluka uzrokovao same odluke. Iz ove rečenice vidljiv je pogreška u načinu razmišljanja.
52
Odluke nije uzrokovao pad jer se još nije niti dogodio, odluke je uzrokovala percepcija onoga
što će se dogoditi (pada). Prejudiciranjem događaja onemogućujemo empirijsko povezivanje
unatrag.
Drugi tip zaključka koji izvodimo iz podataka o korelaciji jest postojanje funkcionalne veze
između uzroka i posljedice. Implikacija u ovom uvjetu je potreba da su uzrok i posljedica
varijable te da i jedna i druga mogu poprimiti najmanje dvije ili više vrijednosti. Kako bismo
izmjerili odnos između dviju varijabli najprije moramo definirati situaciju ili uvjete u kojima
ne postoji odnos što se često naziva nezavisnost varijabli. Dvije su varijable nezavisne
ukoliko znamo da vrijednost jedne varijable ne daje nikakve podatke o vrijednosti druge
varijable. Formalnije iskazano, X i Y su nezavisne ukoliko uvjetna distribucija X ne prelazi
Y. Ako varijable nisu nezavisne tada su u odnosu ili vezi. Kada se provjerava da li su dvije
varijable u vezi potrebno je utvrditi da li je do veze moglo doći slučajno. Obzirom su
promatrači događaja najčešće loši procjenitelji odnosa postoje statističke metode kojima se
utvrđuje postojanje odnosa ili veza. Statističke metode najčešće se provode na uzorku a
rezultati te provjere primjenjuju se na cijelu populaciju.
Treći tip zaključka koji izvodimo iz podataka o korelaciji jest izvorna veza (Suppes, 1970) .
Za odnos između dvije varijable X i Y kažemo da postoji ukoliko postoji Z koji utječe na X i
Y ali takav da taj utjecaj nestaje ukoliko je Z kontroliran. Važno je napomenuti razliku
između izvorne veze među varijablama te intervenirajuće ili posredničke varijable. Varijabla
Z intervenira između X i Y ako X uzrokuje Z a Z unatrag uzrokuje Y. Kontrolirati izvornu
varijablu ili interventnu varijablu uzrokuje da nestaje odnos između X i Y. Izvorna varijabla
pojašnjava uzročnu vezu, interventna varijabla samo nastavlja odnosno povezuje uzročni
lanac. Mnogi znanstvenici vide ovaj problem kao najveću prepreku u analizi uzročnosti te ga
nazivaju problemom treće varijable. Najčešće citiran primjer ovog slučaja je korelacija
veličine stopala i razvoja govora u djeci. Veza je izvorna jer rast djeteta uzrokuje rast veličine
stopala i razvoj govora.
Pored tri navedena formalna zahtjeva za uzročnost u vremenu potrebno je spomenuti i četvrti
koji nije moguće jednostavno jasno definirati. Sastoji se u tome da uzročnost implicitno
navodi na aktivan proces. Problem u definiranju mogao bi se svesti na problem sličan
definiranju prostora ili vremena.
Iako analiza uzroka prevladava u našem svakodnevnom životu, kontraverzno je da li je
ispravno davati joj značaj u proučavanju socijalnih znanosti pored drugih zadataka kao što su
53
promatranje, mjerenje, prilagodba podataka i formulacija raznih teorija. Najmanje su tri
razloga zbog kojih analiza uzorka treba biti dio istraživanja socijalnih znanosti:
- obzirom znanstvenici implicitno i eksplicitno grade modele, formalna metoda može
samo biti od pomoći
- uvjetno modeliranje može pomoći razvoju, prilagodbi i proširenju mjerenjima i
tradicionalnom pristupu,
- uvjetno modeliranje može dati socijalnim znanostima snažniju bazu za primjenu
teorija na rješavanje socijalnih problema.
Uvjetno modeliranje važan je doprinos socijalnoj znanosti no ima i neka ograničenja:
- istraživanje i podaci moraju biti bazirani na čvrstoj osnovi i detaljnom opažanju,
- osnovne ideje za izgradnju modela nisu najčešće pravila u odnosima već ideje, slike ili
strukture,
- uvjetno modeliranje pogodno je za zlouporabe.
Možemo zaključiti da će uvijek biti poticaja da se statističke analize nazivaju „uvjetnim
analizama“ no iako termin uvjetna vjerojatnost zvuči impresivno potrebno je isticati da taj
pristup zahtjeva od istraživača značajniji napor kako bi postigao kvalitetu i snagu zaključaka
koji iz takvog modela proizlaze.
Konačno, možemo definirati uvjetni zakon u općoj formi kao:
za sve Q, X uzrokuje Y
Pojam Q odnosi se na set objekata ili osoba na koje se odnosi zakon, X označava uzrok a Y
događaj. U mnogim uzročnim modelima zanemareno je određivanje pojma Q. U društvenim
znanostima Q je obično neki podskup osoba, iako Q također može biti skup
riječi, situacija, generacije, ili naroda. Ako je Q skup osoba obično mu se dodaju dodatne
karakteristike (na primjer pretpostavka da je osoba odrasla, budna i slično). Obzirom su uzrok
X i događaj Y varijable odnos među njima moguće je funkcionalno izraziti na način Y = f(x)
često nazivan strukturnom jednadžbom. Karakteristična forma za izražavanje je linearna:
Y = b0 +b1X
54
Termin b1 naziva se uzročni parametar i njegova interpretacija je usmjerena. Ako se varijabla
X poveća za jednu jedinicu varijabla Y povećat će se za b1 jedinica. Umjesto „jednog“ X koji
„uzrokuje“ Y može ih biti više te se mogu kombinirati na razne načine:
Y = b0 + b1X1 + b2X2 + b3X3 + . . . + bnXn
Svaka uzročna varijabla množi se uzročni parametrom koji se na kraju sumiraju.
4.3. Lorenzova krivulja i Gini indeks
Lorenzova krivulja (Šošić & Serdar, 2002) specifičan je grafički prikaz koncentracije, koji
pokazuje raspodjelu totala numeričkog niza na njegove članove. Konstruirana u prvom
kvadrantu pravokutnog koordinatnog sustava, ova krivulja se sastoji od točaka koje imaju
koordinate određene članovima kumulativnih nizova proporcija (to je jedan od načina
računanja koordinata). Početna točka ima koordinate 0T (0; 0), a svaka iduća
( ))();(( iTixi TFxFT , za i=1,2,...,N, pri čemu posljednja točka za i=N svakako ima koordinate
NT (1; 1). Koordinate točaka određene su vrijednostima članova odgovarajućih kumulativnih
nizova. Za niz podatka poredanih po veličini, tj. za:
1x ≤ 2x ≤...≤ ix ≤...≤ Nx ,
i to uz pretpostavku da su sve vrijednosti varijable x veće od nule. Apscise ove krivulje
računaju se kao vrijednosti kumulativne funkcije pomoću slijedeće formule:
NiNixF ix ,...,2,1,)( == ,
dok se ordinate, koje su članovi kumulativnog niza proporcija podtotala za jedinicu i,
računaju pomoću izraza:
Nix
xTF N
ii
i
jj
iT ,...,2,1,)(
1
1 ==
∑
∑
=
= ,
Ginijev
krivulja
raspolag
ovog ko
gdje je
Ginijev
4.4. M
Obzirom
varijabi
svake o
skupljaj
vrijedno
podatak
indeks (B
a zatvara s p
ganja s neg
oeficijenta:
N broj pod
indeks pop
Mjere pros
m se u okv
lnosti uzork
od njih. Ko
ju oko jed
osti nekog
ka na način
SLIK
Barrow, 199
pravcem jed
grupiranim v
ataka, a ix
prima vrijed
sjeka i mj
viru deskrip
ka ovdje će
od mjerenja
dne srednje
niza uz z
da govore o
IKA 4.3.1. P
96) G, pre
dnolike rasp
vrijednostim
G=∑=
N
i 12
su pojedina
dnost nula, a
ere varija
ptivne anali
e ukratko bi
a mnogih p
e vrijednost
zadane uvje
o stupnju g
Primjer Lore
edstavlja om
podjele i čit
ma podatak
∑
∑
=
+−
N
ii
i
xN
Nix
1
(
ačne vrijedn
a pri maksim
abilnosti
ze uzoraka
iti navedene
pojava mož
ti. Mjere p
ete. Mjere
rupiranja od
entzove kriv
mjer izmeđ
tave površin
ka, koristi se
∑=
N
iix
1)1
,
nosti varija
malnoj konc
najčešće k
e najpopula
žemo zapaz
prosjeka da
varijabilno
dnosno razl
vulje
đu površine
ne ispod tog
e slijedeća
able. Kada n
centraciji on
koriste mjer
arnije mjere
ziti da se r
aju inform
osti predsta
ličitosti i di
e što je Lo
ga pravca. U
formula za
nema konce
n je jednak j
re prosjeka
sa kratkim
rezultati gru
maciju o pr
avljaju opis
isperzije po
55
orenzova
U slučaju
a izračun
entracije,
jedan.
i mjere
m opisom
upiraju i
rosječnoj
s uzorka
dataka u
56
uzroku. Ta se disperzija najčešće računa kao odstupanje od nekog prosjeka ili srednje
vrijednosti koji se pak može računati na različite načine.
4.4.1. Aritmetička sredina
Najčešća i najpoznatija mjera prosjeka aritmetička sredina. Ona pripada u jedan od najčešće
izvođenih računa za statističke potrebe.
č
…
4.4.2. Raspon
Najjednostavnija ali i najnetočnija mjera oko neke srednje vrijednosti je raspon odnosno
razlika između najvećeg i najmanjeg rezultata. Raspon je vrlo nesigurna i varljiva mjera
varijabilnosti rezultata jer bilo koji usamljeni ekstremni rezultat (outlier) znatno povećava
raspon a da se grupacija rezultata oko aritmetičke sredine ipak nije bitno promijenila. Osnovni
nedostatak raspona sastoji se u tome što je on obično to veći što je veći broj mjerenja neke
pojave.
4.4.3. Srednje odstupanje
Prosječnu veličinu pojedinačnih odstupanja (bez obzira na smjer odstupanja) moguće je
izračunati prema formuli:
∑ |
gdje | | znači apsolutnu veličinu odstupanja bez obzira na predznak.
4.4.4. Varijanca i standardna devijacija
Promatrajući prosječno odstupanje u ovisnosti o predznaku uvijek bismo kao sumu dobili
nulu. Razlog tome je što je aritmetička sredina kao težište rezultata suma odstupanja iznad i
ispod nje što uvijek iznosi nula. Jedan od načina da se izbjegnu predznaci odstupanja jest taj
da se odstupanja kvadiraraju. Na taj način odstupanje će više doći do izražaja. Ako tako
kvadrirana odstupanja zbrojimo i izračunamo im aritmetičku sredinu dobit ćemo mjeru
varijabiliteta koja se naziva varijanca.
∑
1
57
Varijanca je prosječna suma kvadiranih odstupanja. Iako se često koristi u praksi ovaj pojam
nije moguće grafički predočiti te osim za razumijevanje povezanih pojmova i varijabiliteta
nije prikladan za druge svrhe.
Varijanca omogućava da se iz nje izračuna defacto standardna mjera za mjerenje varijabiliteta
rezultata standardna devijacija. Računa se kao korijen iz varijance.
∑1
4.4.5. Koeficijent varijabilnosti
Da bi bilo moguće međusobno uspoređivati varijabilnosti različitih pojava i svojstava postoji
još jedna mjera tzv. koeficijent varijabilnosti koji pokazuje koliki postotak vrijednosti
artimetičke sredine iznosi vrijednost standardne devijacije. 100
4.5. REFII model31
Osnovna karakteristika REFII modela je jednoznačnost opisa vremenske serije pomoću
parametara modela. Matematička jednoznačnost implicira mogućnost provođenja temeljnih
matematičkih operacija nad vremenskim odsječcima poput jednakosti, različitosti i sličnosti
(Klepac, 2001).
U uvjetima kada krivulju, ili neki njen segment možemo komparirati sa drugom krivuljom
odnosno nekim njenim segmentom matematički precizno, tada dolazimo do snažnog alata na
kome se može temeljiti čitav sustav analize vremenskih serija što je koncepcija REFII
modela.
Ova koncepcija zadovoljava još jedan kriterij, a to je kriterij povezanosti sa algoritmima koji
se primjenjuju u data miningu. Do sada poznate metode za analizu vremenskih serija davale
su određene pokazatelje koji se kasnije nisu mogli procesirati posredstvom nekog od poznatih
algoritama u cilju ekstrahiranja dodatnog znanja. REFII model teži ka otvorenosti, odnosno uz
svoj matematički dio koji služi kako za opis, tako i za generiranje znanja koje se krije u
vremenskoj seriji, daje modalitete rješenja povezivanja sa ostalim algoritmima rudarenja
31 definicije i ilustracije preuzete iz Klepac G. „Otkrivanje zakonitosti temeljem jedinstvenog modela transformacije vremenske serije“, doktorska disertacija, FOI Varaždin, 2004. gdje nije drugačije navedeno
58
podataka. Na taj način možemo iskoristiti snagu provjerenih algoritama na području
vremenskih serija, u sklopu standardnih programskih rješenja.
U skupinu klasičnih data mining algoritama ubrajamo neuralne mreže, klasteriranje, stabla
odlučivanja, analizu potrošačke košarice, link analizu, i slično, kao i sve mutacije i izvedenice
ovih algoritama.
REFII model se koncentrira se na tri osnovna segmenta kojima se jednoznačno može opisati
krivulja, to su :
- oblik krivulje (opis izgleda vremenske serije)
- površina ispod krivulje (kvantifikacija vremenske serije)
- koeficijent kutnog nagiba pravca unutar vremenskog odsječka (“jačina” trenda)
Odnosi ovih triju elemenata koji čine REFII model prikazani su na slici.
SLIKA 4.5.1. Komponente REFII modela (Klepac, 2004, 21)
U REFII modelu za opis oblika krivulje zadužen je REF model (Klepac, 2001). Njegova
karakteristika je dijagnosticiranje i modeliranje oblika krivulje. Ovaj model ne može
jednoznačno definirati krivulju, te se s toga služimo i sa ostala dva spomenuta elementa
modela. Površina ispod krivulje daje kvantitativnu dimenziju određenoj pojavi. Krivulja može
imati jednaki oblik u odnosu na neku drugu krivulju, ali to ne znači da ima istu kvantitativnu
vrijednost, iz čega prolazi pojam nejednakosti krivulje. Površina ispod krivulje nam može
pomoći u dobivanju tog pokazatelja.
REF model
Površina ispod
krivulje
Koeficijent kutnog otklona pravca
59
Sa ova dva elementa možemo vrlo precizno, gotovo jednoznačno opisati vremensku seriju.
REFII model je jedinstveni model transformacije koji jednoznačno opisuje empirijsku
krivulju (a sadrži diskretne vrijednosti), čija je zadaća povezati niz kako tradicionalnih, tako i
ad hoc analitičkih postupaka.
Teoretski krivulje mogu imati i jednak oblik opisan REF modelom, i jednaku površinu a da
ne budu u potpunosti jednake što se vidi iz slike (pri čemu je P1 = P2, O1 = O2, krivulja 1
slična krivulji 2 dok su različiti kutovi i dužina kraka). To objašnjava korištenje sva tri
elementa u modelu.
SLIKA 4.5.2. Uloga koeficijenta kutnog nagiba pravca u REFII modelu (Klepac, 2004, 22)
U pojedinim slučajevima ove dvije krivulje mogu zadovoljavati kriterij sličnosti. Ponekad je
apsolutno nerealno očekivati potpunu jednakost krivulja za određene pojave. Ako spoznamo
da je recimo petkom povećana prodaja neke grupe roba, to ne znači da ćemo odbiti tvrdnju o
povećanju prodaje petkom ako krivulje u potpunosti nisu identične. Spoznaja o sezonskoj
oscilaciji dostatan je indikator za poduzimanje akcija po pitanju ove problematike. Da bismo
u potpunosti uspjeli jednoznačno definirati vremensku seriju matematičkim modelom
potrebno je uvesti i treći element, a to je kut unutar vremenskog odsječka, kojeg izražavamo
koeficijentom kutnog nagiba.
X1
Vrijeme
X2
Vrijeme
Površina (P1)
Površina (P2)
Oblik1=O1=(R,F,R,F,F)
Oblik2=O2=(R,F,R,F,F)
Razlika u kutevima i dužini kraka
60
Prilikom procesa analize vremenske serije možemo no ne moramo uzeti sva tri elementa kao
temelj za analizu. Ovaj model sam po sebi ne daje gotova rješenja već je polazišna osnova za
kompleksnije modele. S tim u skladu i REF model i površina ispod krivulje i koeficijentima
kutnog nagiba pravca mogu biti korišteni zajedno kod modeliranja rješenja složenijih
problema, ali isto tako i parcijalno, što ovisi o karakteru problema koji rješavamo. Kada
govorimo o primjeni klasičnih data mining algoritama u vremenskoj seriji, tada govorimo o
transferu pretprocesiranih vrijednosti opisanog modela u algoritme. S obzirom na prirodu
problema kojeg rješavamo, u algoritme možemo transferirati vrijednosti proizašle iz svih
segmenata REFII modela, ili samo određene vrijednosti.
U algoritme tako možemo prosljeđivati podatke o oblicima krivulja, površinama ispod
krivulja, jačini trendova krivulja, te na osnovu toga možemo ekstrahirati nova znanja o
vremenskim serijama. Ponekad će nam u analizi biti bitan samo obrazac trenda kretanja bez
kvantitativnog aspekta i jačine nagiba, pa ćemo procesuirati podatke o obliku. U nekim
slučajevima kvantitativni aspekt može igrati dominantnu ulogu te će on biti predmet
razmatranja i tako redom. Naredna tablica daje orijentacijske odnose između tipa analize i
elemenata REFII modela.
TABLICA 4.5.1. Orijentacijski odnosi između tipa analize i elemenata REFII modela (Klepac,
2004, 23)
Vrsta analize Segment REFII modela Analiza oblika krivulje REF i/ili koeficijent kutnog otklona Kvantitativna analiza Površina ispod krivulje Traženje pravilnosti u vremenskoj seriji REF i površina ispod krivulje Jednoznačna definicija krivulje REF, koeficijent kutnog otklona, površina i. krivulje Otkrivanje epizoda i scenarija u vremenskim REF i /ili koeficijent kutnog otklona i/ili površina
Koncepcije poput otkrivanja epizoda i scenarija u vremenskim serijama isto je tako moguće
realizirati primjenom REFII modela. Osnovni zadatak i cilj REFII modela je uspješno
modeliranje rješenja problema iz domene analize vremenskih serija. Kao što će biti prikazano
kroz tekst REFII model je dobra polazišna osnova i temelj rješavanja problema iz poslovne
prakse. Njegova primjenjivost leži u činjenici što može ući u svaki detalj vremenske serije, te
je na osnovu konkretnog problema moguće dijagnosticirati analogiju između elementa
vremenske serije i konkretnog problemskog prostora. Vremenska serija na kojoj smo
61
primijenili model može se primjerice transformirati u niz objekata koji kao vrijednosti sadrže
upravo vrijednosti proizašle iz REFII modela.
TABLICA 4.5.2. Transformacija vremenske serije u objekte (Klepac, 2004, 24)
Indeks prostorne lokacije u remenskoj seriji (oznaka pozicije) Oznake/oznaka REF sintakse Vrijednost površine segmenta koju označava pozicija Vrijednost kutnih koeficijenata promatranog segmenta
Niz vrijednosti opisane prethodnom tablicom čine osnovu REFII modela. Kao što je vidljivo
iz tablice vrijednosti se mogu odnositi na odsječak vremenske serije ( npr. t0-t4, t4-t8,t8-t12,..,tn-
tn+4), a isto tako i na odsječak između dva promatrana stanja vremenske serije (t0-t1, t1-t2,t2-
t3,..,tn-tn+1).
Različiti modaliteti rješenja determiniraju različite strukturalne formalizacije modela. U
određenim situacijama ta će se vremenska serija morati lomiti u manje segmente s ciljem
traženja reprezentativnih uzoraka i znanja. Vrlo rijetko će ovako transformirana serija biti u
originalnoj dužini. Za potrebe sofisticiranijih analiza bit će potrebno segmentirati seriju kako
bi se olakšao proces analize.
4.5.1. Princip REFII modela
Kako se u rudarenju podataka, i području analize vremenskih serija iz domene otkrivanja
tržišnih zakonitosti susrećemo sa vremenskim nizovima predstavljenih nizom tabličnih
vrijednosti, funkcije koje ulaze u proces data mining analize vremenskih serija su
diskontinuirane funkcije. Naime, za razliku od kontinuiranih funkcija poput kvadratne
funkcije, tržišne pojave se na razini podataka promatraju u vremenskim razmacima i to
najčešće jednolikim vremenskim razmacima. Isto tako, poslovni događaji i tržišne aktivnosti
odvijaju se u diskontinuiranim vremenskim intervalima. S obzirom na to, REFII model i
modeli rudarenje podataka analiza vremenskih serija baziraju se na diskontinuiranim
funkcijama, kao što je to i prikazano na slici.
62
SLIKA 4.5.1.1. Prirast diskontinuirane funkcije (Klepac, 2004, 28)
REF komponentu unutar REFII modela definiramo kao :
TABLICA 4.5.1.1. Definicija REF oznaka na temelju prirasta diskontinuirane funkcije
dx / dt REF oznaka= 0 E >0 R<0 F
Prilikom korištenja REFII modela REF oznake označuju trendove prirasta. Unutar REFII
modela diskontinuirane vrijednosti se normiraju u intervalu <0,1>. Koeficijenti kutnog
otklona računaju se prema formuli:
tt normiranoxnormiranoxdtdx __ 1 −= +
Na temelju koeficijenta kutnog otklona kreira se REFII model kao što je to prikazano u
tablici.
x
t
dx/dt x1
x2
x3 x4
x5
63
TABLICA 4.5.1.2. Primjer nadopune REF modela sa na temelju koeficijenata kutnog otklona
Pri navedenom vrijedi da ako je t > 0 to znači da funkcija raste, ako je t< 0 to znači da
funkcija pada te ako je t= 0 funkcija ne raste niti ne pada odnosno ima istu vrijednost za
vremenski pomak
Rastući trend (t>0) dijela funkcije proizašlog iz ove formule na određenom odsječku možemo
prezentirati oznakom R. Padajući trend (t<0) dijela funkcije proizašlog iz ove formule na
određenom odsječku možemo prezentirati oznakom F. Neutralan trend (t=0) dijela funkcije
proizašlog iz ove formule na određenom odsječku možemo prezentirati oznakom E.
Upotrebom ove notacije, kompletnu vremensku seriju možemo prezentirati sa ove tri oznake.
Za funkciju (R, R, F, F, F, R) možemo reći da raste za dvije vremenske, da nakon toga pada
za tri vremenske jedinice i raste za jednu vremensku jedinicu.
SLIKA 4.5.1.2. Prikaz vremenske serije kroz REFmodel (Klepac, 2004, 36)
REF dx / dt REF oznaka Koeficijent kutnog otklona dx / dt
Razred temeljem koeficijenta kutnog otklona
= 0 E 0 Jednako
>0
R
0-0.2 Slab rast 0.2-0.6 Srednji rast 0.6-1 Oštar rast
<0
F
0-0.2 Slab pad 0.2-0.6 Srednji pad 0.6-1 Oštar pad
R F F F R
Vrijeme
R
64
Slika prikazuje kako REF model transformira vremensku seriju u svoju notaciju. Ovakva
transformacija vremenske serije i matematički instrumentarij koji će biti prikazan može biti
korisna za različite tipove analiza vremenskih serija, koje ovise o zadanim ciljevima.
Ilustrativni primjer primjene REF modela bit će prikazana metodologija otkrivanja sezonskih
oscilacija na temelju oblika krivulje. Za tu namjenu potrebno je vremensku seriju razlomiti na
vremenske odsječke (npr. po danima), transformirati je na osnovu prikazane notacije te
provoditi analize metodom usporedbe.
4.5.2. Površina ispod krivulje
Kod kontinuiranih funkcija prilikom proračuna površine ispod krivulje koristimo integraciju
funkcija. Kako je REFII model baziran na diskontinuiranim vrijednostima, za proračun
površine ispod krivulje koristimo metode numeričke integracije.
SLIKA 4.5.2.1. Numerička integracija (Klepac, 2004, 31)
Površina odsječka računa se prema formuli numeričke integracije metodom pravokutnika:
2))(*())(*( 111 nnnnnn ttxttx
p−+−
= +++
x
t
x1
x2
x3 x4
x5
t0 t1 t2 t3 t4
Površina odsječka
65
Ovako izraženu površinu možemo interpretirati kao prosječnu vrijednost neke pojave između
dva promatrana intervala. Tako primjerice površina unutar odsječka uzorka između dva
intervala (npr. dva dana) gdje se promatra primjerice stanje tekućeg računa možemo
interpretirati kao prosječnu prodaju između ta dva perioda promatranja (npr. ponedjeljka i
utorka). Površina ispod krivulje na intervalu <ta.. tb> računa se kao zbroj površina odsječaka
prema formuli:
∑=a
apP
Pri čemu je vremenska distanca izražena formulom tn+1- tn jednaka za sve vremenske
odsječke u modelu i predstavlja mjeru vremena koja može biti izražena u mjesecima, danima,
satima, minutama i slično. Površinu na razini vremenskog odsječka također možemo
normirati. Kada u REFII model uvedemo površinu ispod odsječka kao treći element
dobijemo slijedeću tablicu.
TABLICA 4.5.2.1. Primjer nadopune REF modela sa površinom ispod krivulje
REF dx / dt
REF oznaka
Koeficijent kutnog otklona dx / dt
Razred temeljem koeficijenta kutnog otklona
Površina ispod odsječka (normirana)
Razred površine
= 0 E 0 Jednako 0-0.3 Mala
0.3-0.6 Srednja 0.6-1 Velika
>0 R
0-0.2 Slab rast 0-0.3 Mala
0.3-0.6 Srednja 0.6-1 Velika
0.2-0.6 Srednji rast 0-0.3 Mala
0.3-0.6 Srednja 0.6-1 Velika
0.6-1 Oštar rast 0-0.3 Mala
0.3-0.6 Srednja 0.6-1 Velika
<0 F
0-0.2 Slab pad 0-0.3 Mala
0.3-0.6 Srednja 0.6-1 Velika
0.2-0.6 Srednji pad 0-0.3 Mala
0.3-0.6 Srednja 0.6-1 Velika
0.6-1 Oštar pad 0-0.3 Mala
0.3-0.6 Srednja 0.6-1 Velika
66
Istaknute vrijednosti u tablici pokazuju primjer definicije elementarnog uzoraka na temelju
numeričkih vrijednosti. Tablica je ujedno i prikaz elementarnih uzoraka koji čine REFII
model i koji povezuje otklon diskontinuirane funkcije sa površinom sa svrhom izgradnje
elementarnih uzoraka. Elementarni uzorci se mogu za potrebe analiza promatrati zasebno i
ulaziti u obradu kao zasebne vrijednosti, ili se mogu promatrati kao niz spojenih vrijednosti.
REFII model objedinjava trendove diskontinuiranih funkcija i površine na razini vremenskog
odsječka, čineći pri tome elementarni uzorak. Elementarni uzorak je predstavljen sa najviše tri
osnovne vrijednosti :
- oznakom trenda rasta (REF)
- koeficijentom kutnog otklona koji možemo klasificirati u razrede
- površinom ispod odsječka koji možemo klasificirati u razrede
Važno je napomenuti da klasifikacija u razrede unutar REFII modela ovisi o prirodi problema
koji se rješava, te je u procesima analize moguće koristi i izvorne vrijednosti koeficijenata
kutnih otklona, kao i površina. Elementarni uzorci također mogu tvoriti kompleksnije
strukture nizova uzoraka, te kao takvi mogu ulaziti u procese analize. Elementarni uzorak
definiran kroz REFII model, njegov je temeljni element. U podatkovni niz punimo vrijednosti
površina odsječaka vremenske serije. kao što je to prikazano na slici.
SLIKA 4.5.2.2. Grafička interpretacija numeričke integracije u REFII modelu (Klepac, 2004,
50)
x
t0 t1 t2 t3 t4 t5 tn
...
P(P1, P2, P3, P4, P5 ... Pn)
P1 P2 P3 P4 P5
67
Nakon transformacije vremenske serije kao što je to prikazano na slici u ovisnosti o željenom
cilju primjenjujemo metode rudarenja podataka na dobivene vrijednost, ali u koordinaciji sa
svim vrijednostima proizašlima iz REFII modela. Kao i transformacija posredstvom REF
modela, vrijednosti površina podsegmenata krivulje, također su nositelji informacija koji tek
trebaju ući u proces obrade. Cilj analize determinira metodu koja će se primijeniti nad ovim
vrijednostima. Značajka ovog pristupa leži u činjenici što ovim pristupom kvantificiramo
vremensku seriju, dajemo joj kvantitativnu dimenziju kako u njenim pojedinačnim
segmentima, tako i u cjelini.
4.5.3. Područje efikasnosti/neefikasnosti proračuna površine ispod krivulje
Unutar REFII modela proračun površine ispod dijela krivulje ima osnovni zadatak dati
kvantitativnu dimenziju cjelokupnome modelu. Površina ispod krivulje daje nam kvantitativni
pokazatelj, ali nam ništa ne govori o obliku krivulje za koju smo izračunali površinu. Što se
odsječak predprocesirane krivulje za koju računamo površinu sastoji od većeg broja manjih
odsječaka to je prognostika o svojstvima iste na osnovi površine nepreciznija.
Procesuiranje vrijednosti koje predstavljaju niz površina ispod krivulja u slučaju obrade
pretprocesiramo i klasificiramo na osnovu njihova oblika, te ima pridodjeljujemo indekse.
Upravo vrijednost površine ispod krivulje nakon indeksiranja vrlo je podesna za obradu
posredstvom algoritama poput stabla odlučivanja, klasteriranja i slično.
Osnovni zadatak proračuna površine ispod krivulje unutar REFII modela je pridodjeljivanje
karakteristika voluminoznosti cjelokupnom modelu elementarnim uzorcima. Teoretski
gledano dvije krivulje mogu imati isti oblik, ali mogu biti različite s obzirom na površinu
ispod krivulje. Ako je voluminoznost vremenskog odsječka jedan od elemenata važnih za
analizu, tada u proces analize uključujemo i komponentu površine.
4.5.4. Proračun koeficijenta kutnog otklona
Element koji upotpunjuje REFII model je proračun koeficijenta kutnog nagiba. U situaciji
kada imamo vrijednost površine ispod krivulje i definiran oblik krivulje, REF model nam
može dati konceptualni oblik krivulje sa stupnjem vjerojatnosti kada procjenjujemo sličnost
krivulja. Precizno određivanje odstupanja sa egzaktnim numeričkim pokazateljima moguće je
posredstvom ovog podmodela. On je u osnovi vrlo precizan, i daje egzaktne matematičke
pokazatelje, što upućuje na određeni stupanj "krutosti". Korištenje isključivo ovog modela
prilikom analize vremenskih serija može rezultirati potrebom za vrlo visokim stupanjem
68
sličnosti oblika krivulje, što podrazumijeva vrlo visoku sličnost kutova svih pravaca, odnosno
dužine pravaca koji reprezentiraju krivulju.
Stupanj očekivane preciznosti kod ovog modela je krajnje precizan. Rast nekog trenda u
vremenskom odsječku definiramo sa R, dok se on može izraziti koeficijentom kutnog otklona
0.234. U REFII modelu oznaku R dobiva kutni otklon vrijednosti koeficijenta kutnog otklona
0.234, i koeficijent kutnog otklona 0.876, dok između njih postoji velika razlika. Prednost
proračuna koeficijenata kutnog otklona manifestira se kroz mogućnost definiranja razreda
otklona pomoću koeficijenata kutnog otklona. Tako generalne trendove izražene sa
oznakama „R“ i „F“ možemo svesti na niži stupanj granulacije kao npr. „Slab rast“, „Srednji
rast“, „Oštar rast“ i slično.
SLIKA 4.5.4.1. Model proračuna nagiba pravca i duljine kraka u vremenskoj seriji
U prvom koraku pretprocesiranu vremensku seriju t=( y1,..,yn) transformiramo u vremensku
seriju T=( t1.. tn) na temelju izraza
minmaxmin−−
= ii
yt
gdje je ti element niza T=( t1,..,tn)
gdje min predstavlja minimalnu vrijednost na cijelom intervalu vremenske serije t, a max
predstavlja maksimalnu vrijednost na cijelom intervalu vremenske serije t
Daljnji korak se svodi na računanje koeficijente kutnog otklona prema izrazima
iij ttk −= +1 za 01 >−+ ii tt ;
y2
y3
x2 x0 x1
y1
69
1+−= iij ttk za 01 <−+ ii tt ;
0=jk za 01 =−+ ii tt
Vrijednost koeficijenata kutnog otklona kreće se u rasponu od 0-1. Ako bismo hipotetski
željeli imati krajnje precizan model za procjenu oblika krivulje, tada bismo u analizama
koristili vrijednosti koeficijenta kutnog otklona direktno bez dodatnih transformacija poput
lingvističkih varijabli. Naravno, ovakav pristup povlači čitav niz tehničkih pitanja, ali je
hipotetski u modelima moguće baratati i izvornim vrijednostima koeficijenta kutnog otklona.
U tom slučaju moramo biti svjesni činjenice da će algoritam za primjerice procjenu
jednakosti, vrijednost koeficijenata koji pripadaju odsječcima T1 i T2, a iznose 0.231 i 0.232
interpretirati kao različite.
Alternativni pristup za potrebe analiza svodi se na korištenje intervalnih vrijednosti gdje se
primjerice otklon u intervalu <0.0001-0.3> deklarira kao interval niskog rasta. Na taj način će
algoritam za procjenu jednakosti vrijednost koeficijenata koji pripadaju odsječcima T1 i T2, a
iznose 0.231 i 0.232 interpretirati kao jednake. Naredna tablica prikazuje primjer definicije
intervalnih vrijednosti otklona kutova.
TABLICA 4.5.4.1. Intervalne vrijednosti otklona kuteva
Raspon koeficijenata
kutnog otklona
Trend odsječka (REF)
Lingvistička varijabla
0.6 - 1.0 R Visok rast 0.2 - 0.6 R Srednji rast 0.01 - 0.2 R Nizak rast
0 E Bez promjene 0.01 - 0.2 F Nizak pad 0.2 - 0.6 F Srednji pad 0.6 - 1.0 F Oštar pad
Ovisno obrađivanoj problematici, rasponi intervalnih vrijednosti varijable mogu varirati.
Definicija intervalnih vrijednosti kako za koeficijente kutnog otklona, tako i za površinu ispod
krivulje, temelj je za definiciju pojmovnih struktura intervalnih jednakosti, intervalnih
nejednakosti i sličnosti.
70
4.5.5. Algoritamska interpretacija proračuna koeficijenata kutnog otklona
Algoritamska interpretacija ovog podsustava svodi se na primjenu prikazanih formula.
Primjenom ovih formula dobivamo niz vrijednosti koje korespondiraju sa koeficijentima
kutnog otklona između pravaca.
Daljnja prednost primjene koeficijenta kutnog otklona u ovom modelu očituje se u lakoj
vizualnoj predodžbi nagiba na osnovu vrijednosti kuta. Algoritamski postupak možemo
opisati na slijedeći način:
m= broj odsječaka vremenske serije
brojač = 1
ZA m > brojača
Tr > 0 (R) koeficijent = (normiraj(y2,min,max)- normiraj(y1,min, max))
Tr < 0 (F) koeficijent = (normiraj(y1,min,max)- normiraj(y2,min, max))
Tr = 0 (E) koeficijent = 0
niz(brojač)=koeficijent
brojač = brojač +1
KRAJ
Funkcija normiraj (v,minimum, maximum)
n=(v-minimum)/(maximum-minimum)
return n
Ovaj algoritam puni vrijednosti koeficijenata kutnog otklona u niz. Isto tako, ovaj element
modela prati pravilnosti ostalih dijelova modela s ciljem postizanja kompatibilnosti i
istovremene primjenjivosti svih njegovih segmenata, te se uklapa u matricu transformacije
REFII modela. Svakom odsječku vremenske serije pripada niz pokazatelja koji
korespondiraju sa elementima modela, u koje između ostalih spada i proračun koeficijenta
kutnog otklona.
4.5.6. Prednosti i nedostaci proračuna koeficijenta kutnog otklona
Prednost ovog modela očituje se u njegovoj egzaktnosti i preciznosti, što doprinosi
jednoznačnom opisu vremenske serije. Ova preciznost isto tako može biti i nedostatak, jer
zahtijevani stupanj preciznosti može rezultirati odbacivanjem određenih hipoteza, koje se za
potrebe analize mogu protumačiti kao prihvatljive.
71
Spomenuti problem možemo riješiti definicijom raspona vrijednosti otklona u razrede, što
ovisi o cilju i željenom karakteru same analize. Osnovni fokus ovog modela je jednoznačan
opis oblika krivulje i to u situacijama kada očekujemo vrlo visoki stupanj sličnosti. Model
baziran na koeficijentima kutnog otklona između vremenskih odsječaka zahtjeva egzaktnost i
preciznost.
Metodu baziranu na otklonima kutova možemo “ojačati” matematičkim instrumentarijem koji
proračunava stupnjeve tolerancije. Na taj način možemo dobiti “hibridni model” koji dopušta
određena odstupanja, gdje analitičar određuje stupnjeve slobode, ili pak možemo uvesti
kategorije razreda. Ovaj pristup je determiniran određenim problemskim prostorima.
Cjelokupni REFII model fokusiran je na dva osnovna pokazatelja koja determiniraju
vremensku seriju, a to su oblik i površinu krivulje.
Postoje i drugi načini jednoznačnog opisa vremenske serije, ali su ovi modeli kao i pokazatelji
izabrani s ciljem što efikasnijeg rješavanja problema baziranih na vremenskim serijama. Cilj
je bio naći balans između efikasnog matematičkog instrumentarija, postojeće tehnologije,
primjenjivosti sa ostalim algoritmiziranim postupcima koji se primjenjuju u analizi podataka i
otkrivanju znanja, što kraćem vremenu procesuiranja algoritmiziranih postupaka, i ono što je
najvažnije uspješnoj primjeni modela na vremenskim serijama s ciljem pronalaženja
zakonitosti prema različitim konceptualnim postavkama. Upravo ovaj zadnji element
detereminira postojanje cijelog modela i njemu je podređen kompletan matematički
instrumentarij.
4.5.7. Shematski prikaz REFII modela
Prikazana shema REFII modela objedinjava sve njegove glavne elemente. Kao što je
prikazano navedeni pokazatelji su nositelji cjelokupnog modela, ali isto tako uz glavne
pokazatelje možemo koristiti i izvedene pokazatelje, što ovisi o karakteru analize. Prikazani
model pokazuje konceptualno objedinjenje i vezu između elemenata modela pomoću kojih
analiziramo vremenske serije. Vremensku seriju za potrebe analize možemo promatrati bilo
na razini pojedinačnih odsječaka, bilo kao niz grupe odsječaka.
72
REF - trend odsječka
Pn - površina odsječka
Kn -koeficijent kutnog otklona vremenskog odsječka
SLIKA 4.5.7.1. Shema REF II modela (Klepac, 2004, 56)
4.5.8. Algoritamska interpretacija REFII modela
Krajnji algoritam mora objediniti sve tri spomenute cjeline i stvoriti temelj za primjenu
analitičkih postupaka. Algoritam za transformaciju vremenske serije u REFII model odvija se
u nekoliko koraka kako slijedi.
Vremensku seriju možemo deklarirati kao niz vrijednosti Vs=(X1,..,Xn)
1. Korak- Vremenska interpolacija
Formiranje samostalnog vremenskog niza Vi na intervalu <1..n> (Dani, tjedni, mjeseci,
kvartali, godine) sa vrijednostima 0. Na temelju tako formiranog niza potrebno je provesti
interpolaciju nedostajućih vrijednosti u Vs-u sa 0 na temelju formiranog niza Vi. Rezultat
ovakve obrade je niz Vs sa interpoliranim vrijednostima niza Vi.
2. Korak - Vremenska granulacija
P1
R
R
R F
t1 t2 t3 t4 t0
y
k1
k2
dy
t
f(x) k3
R
dx
k4
P2 P3 P4
73
U ovom koraku definiramo stupanj sažimanja vremenske serije Vs koja se nalazi u
elementarnoj vremenskoj jedinici (dan, tjedan, mjesec…). U drugom koraku elemente
postojeće vremenske serije sažimamo korištenjem statističkih funkcija poput AVG(),
SUM(), MOD() na razini granuliranog odsječka. Na taj način vremensku seriju možemo
svesti na veći stupanj granulacije (dani u tjedne, tjedni u mjesece …), te dobivamo vremensku
seriju Vg sa većim stupnjem granulacije.
Na ovaj korak možemo se vračati tijekom procesa analize s obzirom na ciljeve analize, što
podrazumijeva obavezno ponovno provođenje procesa opisanog u narednim koracima
3. Korak - Normiranje
Postupak normiranja podrazumijeva transformaciju vremenske serije Vg u Ns pri čemu je
svaki element niza podvrgnut postupku min-max normizacije na intervalu <0,1> i to
a) Ns se sastoji od elemenata (Y1,.., Yn), dok se Yi računa kao
Yi=((Xi- min(Vs))/(max(Vs)-min(Vs)) , gdje su min(Vs) i max(Vs) kao minimalni i maksimalni
elementi niza Vs
b) Vremenski pomak između elementarnih uzoraka (mjerilo vremenske kompleksnosti)
odsječka na X osi određen je sa d(Yi,Yi+1)=a
4. Korak - transformacija u REF notaciju
Prema formuli Tr=Yi+1- Yi Tr > 0 =>R; Tr< 0 =>F; Tr=0 =>E , gdje su Yi elementi niza
Ns
5. Korak – Proračun nagiba pravca na osnovu kuta
Koeficijent kutnog otklona=>
Tr > 0 (R) Koeficijent =y i+1-y i
Tr < 0 (F) Koeficijent =y i -y i+1
Tr = 0 (E) Koeficijent = 0
6. Korak – Proračun površine ispod krivulje
Numerička integracija metodom pravokutnika
p= ((y i*a)+(y i+1*a))/2
74
7. Korak - Kreiranje vremenskih indeksa
Građenje hijerarhijskog stabla indeksa ovisno o karakteru analize, gdje element
strukturiranog indeksa može biti i atribut poput šifre klijenta
8. Korak - Kreiranje razreda
Kreiranje izvedenih vrijednosti atributa na temelju površine ispod krivulje i otklona kutova.
Moguće je kreirati razrede primjenom klasične crisp logike, ili primjenom fuzzy logike.
9. Korak - Povezivanje tablice transformacije REFII modela sa relacijskim tablicama koje
sadrže atribute koji nemaju vremensku dimenziju
Ovih devet osnovnih koraka temelj su algoritmiziranog postupka na kojem se temelji REFII
model čiji je krajnji rezultat formiranje matrice transformacije. Matrica transformacije je
temelj za provođenje daljnjih analitičkih postupaka s ciljem analize vremenske serije.
4.5.9. REFII model – područje efikasnosti / neefikasnosti
Opisana koncepcija prvenstveno je zadužena za definiciju oblika krivulje, i podatkovno
gledajući krivulja transformirana posredstvom opisanog modela predstavlja niz R,E,F oznaka.
Kako toj podatkovnoj strukturi pristupiti, ovisi o konkretnom problemu, pa se u skladu s tim
formiraju algoritmizirani postupci koji u sebi sadrže modificirane formule za procjenu stupnja
pouzdanosti. Ovakva podatkovna struktura polazišna je osnovica, za obradu svih onih
problema koji se mogu uspješno razriješiti analizom oblika krivulje.
Jedna od glavnih karakteristika REFII modela svodi se na mogućnost generiranja tvrdnji
primjenom adekvatnih algoritama nad modelom u formi AKO – ONDA, što je veoma
interesantno ako problematiku analize vremenskih serija promatramo iz perspektive
generiranja znanja.
Pozitivne strane modela:
- sposoban je izgenerirati dobivene rezultate u obliku AKO- ONDA
- orijentiran je prvenstveno pronalaženju zakonitosti
- bliži je koncepciji metoda data mininga nego klasične statističke metode
- fleksibilniji je jer uvažava stanovita odstupanja od bazičnih uzoraka
- generira tvrdnje uz faktor sigurnosti
75
4.5.10. Kako analizirati vremenske serije posredstvom REFII modela
REFII model u osnovi je koncepcija sastavljena iz tri opisane podcjeline, kojoj je prvenstveni
cilj transformacija vremenske serije u niz pokazatelja koji jednoznačno definiraju vremensku
seriju. REF, površina ispod krivulje, te koeficijent kutnog otklona su pokazatelji koji
jednoznačno opisuju odsječak vremenske serije, a niz takvih odsječaka zajedno čine
transformiranu vremensku seriju. Ovakav niz pokazatelja poredani su redoslijedom
pojavnosti u jedinici vremena i objedinjeni u zajedničku koncepcijsku strukturu
transformirane vremenske serije koju nazivamo matricom transformacije. Takva struktura
gledano sa perspektive dinamičke memorije može biti matrica reda 4x tn-1 , odnosno gledano
sa perspektive trajnog zapisa na disku datoteka sa 4 atributa i dužine tn-1.
TABLICA 4.5.10.1. Matrica transformacije
Indeks vremenskog odsječka I1 I2 … In
REF oznaka REF(I1) REF(I2) … REF(I n)
Koeficijent kutnog otklona
Koeficijent kutnog otklona
(I1)
Koeficijent kutnog otklona
(I2) …
Koeficijent kutnog otklona
(In) Površina vremenskog odsječka
P(I1) P(I2) … P(In)
Pokazatelji vremenskog odsječka izračunati su na temelju koordinata dvije susjedne
vrijednosti u vremenskoj seriji. Tako je primjerice odsječak sa indeksom I1 formiran na
osnovu vrijednosti koordinata vremenske serije t0 i t1. Indeks vremenskog odsječka služi za
jednoznačnu identifikaciju vremenskog odsječka s ciljem njegove analize, odnosno kreiranje
bazičnog uzorka. Indeksi mogu biti složeno strukturirani te mogu u sebi sadržavati
hijerarhijske elemente, ako i elemente pripadnosti, te vezne elemente prema ostalim izvorima
podataka. Elementi obuhvaćeni u prethodnoj tablici temeljni su elementi REFII modela, sa
kojima je moguće jednoznačno opisati krivulju i izvršiti sve analize kroz model. Osim
opisanih pokazatelja moguće je obuhvatiti i izvedene pokazatelje prikazane kroz razvoj
modela, ali to je opcionalni pristup koji ovisi o karakteru analize. Pokazatelji navedeni u
prethodnoj tablici temelj su za sve analize zbog kojih je ovaj model razvijen.
Nakon transformacije vremenske serije posredstvom REFII modela dobiva se transformirana
vremenska serija u obliku prikazanom u tablici. Ovako transformirani podaci procesuiraju se
76
algoritmiziranim metodama s ciljem rješavanja konkretnih problema iz domene vremenskih
serija. Algoritmizirane metode i postupci koji služe za rješavanje konkretnih problema
spadaju u širi pojam REFII modela. O samom karakteru analize ovisi kako će se tako
transformiranoj vremenskoj seriji pristupiti po pitanju "lomljenja" ovako formirane strukture
u manje logičke cjeline. Ako na primjer promatramo tjedne, a vremenska serija sadrži
podatke za svaki dan u tjednu kroz cijelu godinu, tada logički razlomimo seriju na tjedne i
analiziramo vremenske odsječke posredstvom konkretnog algoritma. Ovaj postupak
"lomljenja" vremenske serije na manje analitički usporedive logičke odsječke vežemo uz
pojam vremenske kompleksnosti. Ova mjera određuje točku logičkog loma vremenske serije s
obzirom na cilj analize, a dio je algoritmiziranog postupka analize. Tako primjerice ovaj
koeficijent za tjedan može imati vrijednost 7, ili 5 (radni dani u tjednu), pri čemu treba voditi
računa o nepostojanju vrijednosti u određenoj vremenskoj točci, sa čim se ova mjera također
mora nositi.
REFII model je, u užem smislu, model transformacije vremenske serije dok je u širem
smislu skup algoritmizranih postupaka nad tako transformiranim podacima koji omogućuju
otkrivanje raznih zakonitosti. Važno je napomenuti da se svaki od tri navedena elementa
REFII modela međusobno nadopunjuju, ali da su nekim situacijama neki od elemenata
irelevantni. To ovisi o cilju analize i analitičkom pristupu. Na prikazanu tablicu moguće je
djelovati različitim algoritmiziranim postupcima koji u konačnici daju željene rezultate. Isto
tako je moguće nad istom tablicom primjenjivati i uspoređivati efikasnost primjene različitih
vrsta algoritama s ciljem rješavanja istog problema. Redoslijed i prioritet analize s obzirom na
problematiku ovise od slučaja do slučaja. Osim kvantitativnog elementa i elementa oblika
krivulje pristup analizi i algoritmiziranom postupku determinira i željeni stupanj preciznosti.
Što je stupanj preciznosti i analitičkih zahtijeva veći to će više biti iskorišteni svi mogući
pokazatelji koji proizlaze iz modela.
Ovaj transformacijski model, polazišna je točka za niz različitih vrsta analiza koje se provode
nad vremenskim serijama, a koje ova koncepcija uspješno rješava. Kao što će biti vidljivo
kroz daljnji tekst elementi prikazani u tablici proceduralno procesuirani kroz različite vrste
algoritama mogu otkriti različite vrste znanja iz vremenskih serija.
77
4.6. Bayesova logika i Bayesove mreže
4.6.1. Pojam vjerojatnosti
Iako je pojam vjerojatnosti prvenstveno matematički pojam te se problemima iz tog područja
najčešće pristupalo na matematički način, statistički pristup istom području drugačije je
prirode. Osnovni pojmovi vjerojatnosti stoga mogu se razlikovati ovisno o točki gledanja te
isto tako rezultati i interpretacije rezultata mogu biti različite. Zakoni vjerojatnosti nisu uvijek
jednostavni i razumljivi. Svakodnevno iskustvo i logika koju u životu koristimo često nisu u
skladu sa zakonima koje nam daje statistika. Pojam poznat pod imenom „subjektivna
vjerojatnost“ kojim se opisuju spomenute razlike u pristupu pripada među psihološke a ne
statističke pojmove i stoga sa matematičkom vjerojatnosti često nema mnogo zajedničkoga
(Petz, 2007). Ljudi često vjeruju da će možda ipak dobiti glavni zgoditak na lutriji a praktički
ne vjeruju da im se može dogoditi neka prometna nesreća iako je vjerojatnost nesreće daleko
veća nego ona za dobitak na lutriji.
Najosnovnija pravila vjerojatnosti mogu se sažeti u nekoliko rečenica:
- ako je potpuno sigurno da će se nešto dogoditi onda je vjerojatnost tog događaja
maksimalna (i bilježi se sa p=1), na primjer potpuno je sigurno da će čovjek koji je
rođen danas jednoga dana umrijeti,
- ako je potpuno sigurno da se nešto neće dogoditi vjerojatnost tog događaja nije
nikakva (i bilježi se sa p=0)
- vjerojatnost da će se između N događaja koji su jednako vjerojatni a međusobno
nezavisni dogoditi jedan određeni među njima je 1/N
- vjerojatnost da će se dogoditi bilo koji od nekoliko mogućih nezavisnih događaja
suma je vjerojatnosti svakog pojedinačnog događaja,
- vjerojatnost da će se zajedno dogoditi dva ili više nezavisnih događaja produkt je
vjerojatnosti svakog od tih događaja.
SLIK
Bayesov
između
naveden
radova
mreže, m
razvoju
4.6.2. O
Pretpost
utjecaj n
nekog o
ili nega
zaključa
za prora
bude po
Pretpost
Na prim
bronhiti
naveden
KA 4.6.1.1.
ve mreže p
velikog br
ne varijable
i relevantn
mreže bazir
spoznaje o
Osnove uvje
tavimo situ
na neku dru
oblika boles
ativan. God
aka o spome
ačunavanje
ozitivan.
tavimo dalj
mjer, ima li
is ili da bo
nih bolesti i
Svi slučajev
apso
predstavljaj
roja varijab
e (atribute).
nih istraživa
rane na uvj
primjenjivo
etne vjeroja
uaciju u koj
ugu karakte
sti u čovjeku
dinama se
enutoj i slič
uvjetne vje
e situaciju
pojedinac n
oluje ili ne
ima direkta
vi vjerojatno
olutne nemog
ju grafičke
bli (atributa)
Tijekom 80
anja vezano
etnoj vjeroj
osti raznih a
atnosti
joj neka ka
eristiku te is
u ima direkt
Bayes-ov
čnim situaci
erojatnosti d
u kojoj je v
naviku puše
e boluje od
an utjecaj n
osti nalaze
gućnosti (p
e strukture
) te donoše
0-tih godina
o na Bayes
jatnosti). T
algoritama t
arakteristika
ste varijable
tan utjecaj n
teorem kor
ijama. U na
da li je poje
više obilježj
enja ima dir
d raka pluć
a to da li je
se između a
=0) (Petz, 2
za predsta
enje uvjetov
a prošlog st
sove mreže
ijekom 90-t
treniranja B
a jedne zam
e. Na primj
na to hoće l
ristio kako
avedenom p
edinac zara
ja povezano
ektan utjeca
ća. Nadalje
e pojedinac
apsolutne si
2007)
avljanje uvj
vanih zaklj
toljeća nagl
(dijagrami
tih godina s
Bayesovih m
mišljene var
jer, prisutno
i test na tu b
bi se doš
rimjeru, kor
ažen bolešću
o kroz lance
aj na činjen
e postojanje
c lakše ili te
igurnosti (p=
jetnih vjero
učaka a ve
lo se poveć
i utjecaja, k
svjedočimo
mreža iz pod
rijable ima
ost ili ne po
bolest biti p
šlo do uvje
ristili bismo
u ako test n
e takvih zak
nicu da ima
e ili ne po
eže umara.
78
=1) i
ojatnosti
ezano na
ćava broj
kauzalne
o naglom
dataka.
direktan
ostojanje
pozitivan
etovanih
o teorem
na bolest
ključaka.
ili nema
ostojanje
Jednako
79
tako ukoliko pojedinac boluje ili ne boluje od raka pluća ima direktan utjecaj na izgled
rendgenskog nalaza pluća. U ovakvim i sličnim situacijama želimo doći do spoznaja i donijeti
uvjetovane zaključke koji nisu posljedica direktnih utjecaja. Želimo, na primjer, izračunati
uvjetnu vjerojatnost da pri kojoj pojedinac boluje od bronhitisa i raka pluća istovremeno pri
spoznaji da je pušač, da se lako umara i ima pozitivne markere na rak pluća na rendgenskoj
snimci. Bronhitis pri tome nema nikakvog utjecaja na rendgenski snimak. Slijedom toga
željene uvjetne vjerojatnosti nije moguće proračunati izravnom primjenom Bayes-ovog
teorema. U želji za rješavanjem ovakvih problema razvijene su Bayes-ove mreže.
Istraživanjem uvjetnih zavisnosti putem lanaca odnosa u mogućnosti smo Bayes-ovom
mrežom predstaviti velika područja na malom prostoru te smo istovremeno vrlo često u
mogućnosti izvoditi uvjetovane zaključke između karakteristika atributa u prihvatljivom
vremenu. Dodatno, mogućnost vizualnog prikazivanja Bayes-ovih mreža pruža daleko
kvalitetniji i intuitivan pregled odnosa između varijabli.
Teoretske postavke koje definiraju vjerojatnost a koje se koriste kao matematička osnova za
promjenu vjerojatnosti postavio je A. N. Kolmogorov (Kolmogorov, 1933) 30-tih godina
prošlog stoljeća. Teorija vjerojatnosti bazira se na eksperimentima koji kao rezultat daju
setove različitih ishoda. Kao primjer takvog eksperimenta možemo navesti izvlačenje karte s
vrha špila karata koji broji 52 karte.
4.6.3. Bayesova logika
Bayes je bio engleski svećenik koj se strastveno bavio problemima vjerojatnosti (prema
nekim podacima živio je 250 godina) te je pronašao neke zakone koji se ponešto razlikuju od
klasičnog pristupa pitanju vjerojatnosti. Konkretno on je izradio matematičke postupke
(formule) koji omogućuju mijenjanje vjerojatnosti nekog ishoda pod utjecajem novih
informacija. Bayesovi principi danas zauzimaju ključno mjesto u teoriji odlučivanja.
Bayesove metode pripadaju obitelji uvjetnih klasifikacijskih modela. Tim metodama
eksplicitno se izračunava a posteriori vjerojatnost P(a|b) promatranog događaja jednom kada
su a priori vjerojatnost i uvjetne karakteristike P(a|b) poznate (Vercelis, 2009). Bayesova
logika podrazumijeva korisničku procjenu vjerojatnosti P(a|b) da se određeni događaj desi
pod određenim uvjetima. Faza početnog učenja parametara može se izvršiti analizom seta
podataka, korištenjem ekspertnog znanja i slično.
80
Za neki događaj koji promatramo i označavamo ga sa a čija ciljna varijabla y može poprimiti
H različitih vrijednosti označenih sa H = {v1, v2, … vh} Bayesov teorem koji se koristi za
izračunavanje a posteriori vjerojatnosti P(b|a) (vjerojatnost događaja y po uvjetima x) bilježi
se kako slijedi:
||
∑ ||
S ciljem da uvede novu instancu a Bayesov klasifikator primjenjuje princip najveće
(maksimalne) a posteriori pretpostavke (hipoteze) (MAP) koja uključuje izračun a posteriori
vjerojatnosti P(b|a) te dodjeljuje uzorku x vrijednost maksimuma P(b|a):
arg | arg|
Obzirom je P(a) nezavisan od y kako bi se maksimizirala a posteriori vjerojatnost dovoljno je
maksimizirati prethodni operator. Sukladno tome događaj a dio je vh ako i
samo ako je:
| | , 1, 2, … ,
A priori vjerojatnost P(b) moguće je izraziti koriteći promjenu mh pri čemu se za svaku
vrijednost vh ista pojavljuje u uzorku D:
Uz dovoljno velik uzorak procjene dobivene kroz ovakav pristup mogu biti vrlo precizne.
Ovaj pristup na žalost nije moguće u potpunosti primijeniti u praksi obzirom na složenost
sustava i utjecaja te posljedično događaja koje je potrebno promatrati. Za ilustraciju
zamislimo set podataka od 50 binarnih varijabli. Iz takvog uzorka izvodi se 250 ili otprilike
1015 kombinacija vrijednosti atributa. Za relevantnu procjenu potrebno je promatrati najmanje
10 događaja po kombinaciji čime bi polje D bilo veliko najmanje 1016 događaja. U slučaju da
se ne radi o binarnim varijablama već numeričkim ili opisnim taj broj raste eksponencijalno.
Kako bi se prevazišlo ograničenja ovakvog pristupa a iskoristile prednosti metode koriste se
dva principa pojednostavljenja polja rješenja: naive (osnovni) Bayesov klasifikator i Bayesove
mreže.
4.6.4. Osnvni (naive) Bayesov klasifikator
Osnovni Bayesov klasifikator baziran je na pretpostavci da su promatrane varijable neovisne
o događaju. Ta nam hipoteza dopušta izražavanje vjerojatnosti P(a|b) kao:
Vjerojat
atributa
Dok za
4.6.5. B
U prote
zanimlji
modela
vjerojatn
što se m
Uvjetna
reducira
SLI
32 http://w
tnost P(aj|b)
a. Tako za d
kontinuiran
Bayesova m
eklih nekol
ivije širem k
prepreka je
nosti. Uvjet
može interpr
a vjerojatno
ajući pri tom
IKA 4.6.5.1.
www.ai.mit.ed
), j je eleme
iskretne var
ne varijable
mreža (kauz
liko godina
krugu istraž
e češćem ko
tnu se vjeroj
etirati kao "
ost reducira
me stupanj n
Jednostava
du/~murphyk/
ent N može
rijable vrije
vrijedi:
zalna mreža
a metode r
živača. Na ž
orištenju. O
jatnost defin
"Vjerojatnos
a polje slu
neizvjesnost
an grafički p
/Bayes/bnintro
e se procijen
di:
a)
razlučivanja
žalost, zbog
Osnovni kon
nira kao32:
P(a\b) = m
st događaja
učajnih do
ti ishoda dog
prikaz Baye
o.html, 10.10.
niti koristeć
a temeljene
g svoje priro
ncept Bayes
m
a iznosi m u
gađaja, te
gađaja.
esove mreže
.2004.
ći set podata
na vjeroja
ode složenos
ovih mreža
uz dani uvje
donosi do
e (Panian &
aka ovisno o
atnosti pos
st procesa i
a počiva na
et b".
odatnu info
& Klepac, 20
81
o prirodi
taju sve
zgradnje
uvjetnoj
ormaciju
003)
82
Ovakvi grafički sustavi pogodni su modeli za automatizirano razlučivanje pod nepotpuno
uređenim uvjetima.
Temeljno pravilo vjerojatnosti događaja a i b glasi:
P(a|b)P(b) = P(a,b)
Ako se događaji a i b promatraju u kontekstu događaja c, to se može izraziti kao:
P(a|b,c)P(b|c) = P(a,b|c)
Na osnovu temeljnog pravila proizlazi:
P(a|b)P(b) = P(b|a)P(a)
iz čega se izvodi Bayesova formula:
)()()|()|(
aPbPbaPabP =
odnosno gledajući u svjetlu događaja c:
)|()|(),|(),|(
caPcbPcbaPcabP =
Za složeniji prikaz Bayesove mreže potrebno je definirati distribuciju uvjetne vjerojatnosti
(Conditional Probability Distribution – CPD) za svaku točku. Ako su vrijednost varijabli
diskretne mogu se prikazati tablicom koja prikazuje vjerojatnosti da slijedeća točka niza
preuzima svaku od kombinacija vrijednosti roditelja, prethodnika.
Iz navedene ilustracije možemo raspraviti da izraz "trava je vlažna" (W=true/istina) ima dva
moguća uzroka: ili je prskalica uključena (S=true/istina) ili kiši (R=true/istina). Snaga odnosa
dana je u pripadajućim tablicama pa tako vjerojatnost da je trava vlažna (W=istina) pri
činjenici da radi prskalica (S=istina) i kiši (R= istina) iznosi 0.99 ili 99%.
Bayesove mreže predstavljene su tzv. usmjerenim acikličkim grafovima (kao prikazani na
ilustracijama). Jedna od karakteristika ovakvog pristupa jest što potpuna specifikacija
distribucije vjerojatnosti sadrži znatno manje vrijednosti. Za četiri varijable potpuna
distribucija sadržavala bi (2n-1) tj. petnaest vrijednosti za sve kombinacije. Spomenuti slučaj s
vlažnom travom sadrži ih devet. Za veći broj elemenata mreže značaj ovakvog pristupa
postaje još veći.
Elemen
strelice
linearne
33 ***, "Ahttp://ww
nti mreže pri
određuje sm
e, konvergen
SLIKA 4.6.
SLIKA 4
A Brief Introdww.cs.berkeley
A
B
C
ikazani su k
mjer odnosa
ntne ili dive
5.2. Grafičk
4.6.5.3. Tri
uction to Grapy.edu/~murph
kao ovisni o
a a vjerojatn
ergentne kak
ki prikaz Ba
vrste veza m
phical Modelshyk/Bayes/bay
A
B
o slijedu ko
nosti se prim
ko je prikaz
ayesove mre
među eleme
s and Bayesianyes.html, 02.1
C
oji je naznač
mjenjuju ov
zano na slici
eže i tablica
entima mrež
n Networks", 1.2004.
A
B
čen strelicam
visno o vez
i.
a uvjetne vje
že (Charnia
B
C
ma, pri čem
ama koje m
erojatnosti33
ak, 2004)
83
mu smjer
mogu biti
3
84
Vezama se zapravo unaprijed navodi na ovisnosti koje su definirane kao značajne ili ovisne
pri izgradnji modela. Elementi mreže putem vjerojatnosti prenose informacije, pri čemu se
moguća rješenja generiraju kao aproksimativne vrijednosti. Ovaj pristup, ovisno o mreži,
omogućava više putova do istog rješenja uz mogućnost evaluiranja rezultata tijekom analize.
Time nam se pruža mogućnost rješavanja problema na način koji ne mora nužno pratiti
eksponencijalni rast pravila porastom kompleksnosti modela kao što je slučaj pri
tradicionalnim metodama.
Osnova za određivanje uvjetnih vjerojatnosti jest strukturno učenje, odnosno, do navedenih
vrijednosti dolazi se učenjem putem algoritama razvijenih u tu svrhu. Alat Hugin koji je
korišten u ovom radu koristi tzv. NPC algoritam, unaprijeđenu inačicu PC algoritma koji pak
sličan IC algoritmu. Za detalje o svakom od njih upućujem na referentnu literaturu dok ću
ovdje izložiti osnove potrebne za razumijevanje primjenjene tehnike. Hugin prihvaća podatke
u obliku tablice te, uz odabir osnovnih kriterija, omogućuje formiranje mrežu putem
čarobnjaka (wizard).
PC algoritam se sastoji od sljedećih koraka:
- testira nezavisnost između svakog para varijabli,
- kreira kostur mreže putem pronađenih zavisno-nezavisnih veza,
- određuje kolizije,
- određuje smjerove ovisnosti.
U ovom radu za izradu mreža korišten je PC algoritam koji se razlikuje u tome što pri
formiranju veza mora biti definiran tzv. neophodni put što implicira mogućnost više
poveznica među varijablama. Svaka poveznica koja zadovolji kriterij ispravnosti se usvaja.
4.6.6. Učenje vjerojatnosti u Bayseovoj mreži
Model koji je predstavljen u ovom radu u primjerima se opisuje kroz Bayesove mreže koje su
izrađene ručnim postavljanjem odnosa između veza. Kroz alat koji je korišten (GeNIe) na
bazi tako izvedenog modela mreža je naučena na bazi pripremljenih podataka. Rezultat je
analitički model koji kombinira povijesne podatke kako bi proizveo unaprijeđeno znanje. Za
bolje razumijevanje na jednostavnom primjeru pojasnit ću kako se provodi učenje
vjerojatnosti u mreži na bazi pripremljenog seta podataka. Na kratkom primjeru biti će
85
prikazano kako se proračunavaju vjerojatnosti slijednih događaja uz pretpostavku zavisnosti
prema vršnim događajima kao preduvjet mreže.
Pretpostavimo distribuciju vjerojatnosti za X prikazanu strukturom mreže koju ćemo nazvati
S.
| , | , ,
pri čemu je θi vektor parametara distribucije, θS vektor parametara a Sh označava događaj
(hipotezu u statističkom slučaju) prema kojem se distribucija vjerojatnosti može izraziti
prema S. Dodatno, pretpostavimo da postoji slučajan uzorak D = {x1, … xn} distribucije
vjerojatnosti X. Tada označavamo element x1iz D kao slučaj (case). Problem učenja
vjerojatnosti u Bayesovoj mreži prema navedenom moguće je izraziti kao: za zadani slučajni
uzorak D izračunaj posteriori distribuciju vjerojatnosti p(θs|D,Sh). Ta se distribucija prikazana
kao funkcija od θ naziva funkcija lokalne distribucije (Hackerman, 1996). Analizirajući
funkciju možemo uvidjeti da se ona ne razlikuje od regresijske ili uvjetne funkcije. U većini
slučajeva sve njih je moguće iskoristiti za učenje vjerojatnosti u Bayesovoj mreži te su
uglavnom i dostupne tehnike za provođenje učenja. Modeli koji su najviše pristupni u
istraživanjima su neograničena multinominalna distribucija (Cooper & Herskovitts, 1992,
309-347), linearna regresija sa Gaussovim šumom (Hackerman & Geiger, 1996, 16-19) i
generalizirana linearna regresija (Saul et al, 1996, 61-76).
Kao ilustraciju u nastavku će biti pojašnjen koncept učenja vjerojatnosti (i strukture)
korištenjem neograničene multinominalne distribucije. Primjenjujući model pretpostavljamo
da je svaka varijabla Xi element X diskretna te da sadrži ri mogućih vrijednosti xi1, … , xi
ri te
je svaka lokalna funkcija distribucije set multinominalnih distribucija za svaki sustav Pai.
Nastavno pretpostavljamo slijedeće:
, , 0
gdje:
, … , ∏ )
opisuje Pai a θi predstavlja parametre. Koristeći lokalnu funkciju distribucije sada možemo
efikasno proračunati posterior distribuciju:
| ,
pod dvjema pretpostavkama:
- da ne postoje nedostajuće vrijednosti u uzorku D (da je slučajni uzorak D cjelovit),
86
- da su parametar vektori θij međusobno nezavisni.
Navedeno možemo prikazati sa:
| |
Ova se pretpostavka naziva nezavisnost parametara (Spiegelhalter & Lauritzen, 1990, 579-
605). Uzevši u obzir obe pretpostavke (cjelovit uzorak i nezavisnost) parametri ostaju
neovisni za zadani uzorak:
| , | ,
SLIKA 4.6.6.1. Struktura Bayesove mreže, učenje vjerojatnosti paramtetara mrežne strukture
X → Y
Prema tome moguće je mijenjati parametre vektora nezavisno kao da se radi o jednom stanju
varijable. Uz pretpostavku da za svaki vektor postoji priori distribucija posterirori distribucija
može se izraziti kao:
, , … ,
pri čemu je Nijk broj slučajeva D u kojima je Xi = xik i Pai = pai
j.
Ovi izračuni su jednostavni u izvođenju obzirom je neograničena multinominalna distribucija
eksponencijalne prirode.
θx
X
X
θy|x
Y
θy|x
Y
uzorak 1
uzorak 2
...
-
87
U pristupu razlikujemo niz problema koje je potrebno savladati pri učenju ovisno o tome da li
je struktura mreže poznata ili nepoznata, da li su podaci kompletni ili ne te da le postoje
skrivene varijable.
TABLICA 4.6.6.1. Pristupi pri učenju Bayesove mreže (Friedman & Goldszmit, 1998)
Poznata struktura Nepoznata struktura
Potpuni podaci Statistička parametarska
procjena (zatvorenog tipa)
Diskretna optimizacija kroz strukturu
(diskretno pretraživanje)
Nepotpuni podaci Parametarska optimizacija
(očekivani maksimum, stupnjevani pristup)
Kombinirani pristup (strukturni očekivani
maksimum, kombinacija modela)
U ovom radu bavit ćemo se situacijom u kojoj je struktura poznata te rabimo potpune
podatke.
4.5.7. Metode pretraživanja u Bayesovim mrežama
Nastavno na metode učenja za razumijevanje Bayesove mreže je važno spomenuti i metode
pretraživanja. One, uz razne parametre prilagodbe i ograničenja, se koriste za formiranje
mreže iz podataka. Iako je model koji će biti prikazan u primjeru kreirana na bazi ekspertnog
znanja važno je spomenuti metode pretraživanja za slučajeve:
- ukoliko nema dovoljno ekspertnog znanja za formiranje modela,
- ukoliko se želi provjeriti na drugi način odabrani model
- ukoliko je količina podataka toliko velika da nije moguće na drugačiji način formirati
efikasan model
Jednostavno rečeno metode pretraživanja identificiraju mrežne strukture sa visokim
rezultatima prema nekom kriteriju. Pri pretraživanju javljaju se razni problemi poput
kombinatorne eksplozije, ograničenja u pristupu pojedinim dijelovima mreže, opasnost da
pretraživanje stane u nekoj lokalnoj točki ne uspijevajući ostvariti globalni pristup mreži.
Nastavno na probleme postoje razne metode i heuristički algoritmi poput tzv. greedy searh
metode, greedy search sa nasumičnim restartom, best-first search, Monte Carlo metoda itd.
88
Prostor pretraživanja je pronaći sve moguće strukture usmjerenih acikličkih grafova (DAG)
prema zadanim varijablama. Broj mogućih grafova za n varijabli moguće je izračunati
slijedećom formulom (Robinson, 1973):
1 2
Očito je da sa većim brojem varijabli (povećavanjem složenosti sustava) snažno raste broj
mogućih grafova. Broj varijabli Ukupan broj mogućih grafova
1 1 2 3 3 25 4 543 5 29,281 6 3,781,503 7 1,138,779,265 8 78,370,2329,343 9 1,213,442,454,842,881
10 4,175,098,976,430,598,100
SLIKA 4.6.7.1. Broj mogućih grafova za zadani broj varijabli, kombinatorna eksplozija34
Kao ilustraciju navest ću jednostavan algoritam pretraživanja greedy search metode.
Prije primjene metode potrebno je definirati strukturu mreže. Nakon toga proračunavaju se svi
∆ za sve te se zamijeni sveki e za koji je ∆ maksimum pod uvjetom da je
pozitivan. Pretraga prestaje kad više nema e sa pozitivnom vrijednošću ∆ .
Generalno metodu (i druge metode) je moguće učiniti efikasnijom uzimajući u obzir da se
veze među atributom mogu odvojiti. Kažemo da je strukturu ili dio strukture moguće odvojiti
od ostatka mreže kada je
, , ,
gdje su Di podaci odvojeni od varijabli Xi i Pai.
34 http://www.bayesnets.com/, 01.08.2011.
89
Odvajanjem pojedinih veza proračunavanje postaje efikasnije jer se pri svakoj promjeni ne
proračunavaju dijelovi za koje se ispostavi da nisu pretrpjeli promjenu. Nastavno na rezultate
pretraživanja formira se struktura mreže (graf) koji je u svim alatima moguće ručno korigirati
(možemo reći da se radi o „prijedlogu“ strukture baziranom na podacima).
Nastavno na navedeno pristupe možemo podijeli na one bazirane na:
- ograničenjima odnosno vezama (pretraživanje i analiza odnosa, pretraživanje u
potrazi za mrežom koja je konzistentna sa promatranim odnosima i međuovisnostima)
te
- bazirane na scoring tehnikama (scoring i pretraživanje, definiranje score vrijednosti te
prolazak po strukturi s ciljem maksimiziranja te vrijednosti).
Ovdje je važno navesti najpopularnije metode definiranja score vrijednosti. Iste možemo
podijeliti na (Neapolitan, 2004):
- logaritamski bazirane (MLC Maximum Likehood Criterion),
- logaritamski bazirane s ograničenjem (BIC Bayesian Information Criterion, MDL
Minimum Description Length, AIC Akike's Information Criterion)
- score metodu baziranu na Bayesovim pravilima (naive Bayes, BDe, K2)
- metode predviđanja (k.Fold-CV, Prequential)
Za više podataka o svakoj od metoda upućujem na referentnu literaturu.
4.6.8. Primjena Bayesovih mreža
Bayesove mreže imaju vrlo širok raspon primjene u sustavima poslovne inteligencije. Neki su
primjeri i radovi ranije navedeni u ovom radu. Njihova glavna karakteristika odnosi se na
sposobnost učenja, temeljenog na probabilistici, direktno iz uzoraka podataka. Analitičar je
prvenstveno zadužen za kreiranje transparentnog modela, koji će obuhvatiti sve relevantne
atribute i njihove odnose, poštujući uzročno-posljedične veze među zadanim atributima. Vrlo
efikasna primjena je u interpretaciji znanja i odnosa, no model može biti vrlo složen za
postavljanje. Radovi na ovom području koji proučavaju aspekt primjene sve više se okreću
automatiziranim alatima za konstrukciju modela na podacima specifičnog područja na kojima
analitičar može dalje raditi.
Bayesove se mreže mogu promatrati u svjetlu ekspertnih sustava, i to onih ekspertnih sustava
zasnovanih na probabilističkoj teoriji. Ono što je svojstveno svim modelima zasnovanim na
Bayesovim mrežama, jest mogućnost procjene vjerojatnosti čak i onda kada neke informacije
nedostaju, primjerice one o inicijatoru šteta. Što je više informacija, to je procjena pouzdanija,
90
no u slučaju nepostojanja određene informacije, model je ipak sposoban predviđati
vjerojatnosti.
Bayesove mreže mogu se uspješno primijeniti u (Panian & Klepac, 2004):
- medicini (dijagnostika bolesti kao što su bolesti mišića i živaca, respiratorne bolesti i
slično),
- razvoju softvera (traženje pogrešaka u programu, programi za dijagnostiku problema
kod eksternih jedinica kao što su pisači, programiranje pomoći u programima),
- proizvodnji (praćenje proizvodnih procesa, te sugestije za optimizaciju i izbjegavanje
kvarova u sustavima),
- ekonomiji (procjena kreditnih rizika, segmentacija tržišta, analiza rizika općenito,
ponašanje klijenata),
- vojnom sektoru (planiranje operacija, planiranje logističkih aktivnosti),
- poljoprivredi i stočarstvu (selekcija i uzgoj bilja i životinja, planiranje bakteriološke
zaštite),
- farmaciji (istraživanje lijekova, istraživanje pojedinih sastojaka i njihovih kombinacija
kod otkrivanja novih vrsta lijekova za određene tipove bolesti),
- i naravno trgovini (analiza utjecaja, pokretanje novog proizvoda, prepoznavanje
zakonitosti)
Ovaj rad pokazat će primjenu Bayesovih mreža u analizi podataka o prodaji tekstilnih
proizvoda.
Poteškoće pri izgradnji ovakvih modela sastoje se u njihovoj složenosti i potrebnom
predznanju. Danas na tržištu postoji nekoliko alata kojima je moguće djelomično nadomjestiti
početno neiskustvo.
91
5. PRIJEDLOG MODELA ZA PODRŠKU ODLUČIVANJU U
TRGOVINI KORIŠTENJEM METODE TRANSFORMACIJE
VREMENSKE SERIJE (REFII) I BAYESOVE LOGIKE
5.1. Uvod
Otkrivanje uzoraka unutar vremenskih serija česta je tema znanstvenih radova iz domene
temporalanog dana mininga. Uz pojedinačne izuzetke (Williams et al, 2002, 221-231),
karakteristika svih navedenih radova, je da imaju autorski pristup ovoj problematici koja
premalo pažnje pridaje jedinstvenom modelu transformacije vremenske serije, te su ti radovi
fokusirani na rješavanje problematike otkrivanja uzoraka, bez velikih razmatranja kako
dobivene rezultate dalje obrađivati primjerice tradicionalnim metodama data mininga.
U prethodnim poglavljima pokazane su teoretske osnove komponenata modela koji će biti
predstavljen u nastavku. Do sada je pokazano kako se na temelju REFII modela mogu
izgraditi rješenja za otkrivanje sezonskih oscilacija, direktnog otkrivanja pravila iz
vremenskih serija, te otkrivanje sličnosti. Na temelju jedinstvenog skupa podataka vremenske
serije uz pomoć REFII modela, moguće je lančano provesti niz analiza, tako da izlaz iz jedne
analize postaje input u drugu analizu.
Obzirom da na raspolaganju imamo razne tehnike i metode postavlja se pitanje odluke o
korištenju određenih metoda i načinu ulančavanja. Dio radova i njihov sadržaj i napredak
spomenut je u poglavlju u kojem je bilo riječi o primjeni. Sa znanstvenog stanovišta potrebno
je spomenuti i istraživanja koja su za cilj imala provjeriti kako primijeniti različite metode u
različitim situacijama. Tako John Elder i Stephen Lee (Nisbet et al, 2009) još 1997. provode
istraživanje o efikasnosti primjene pet algoritama (neuralne mreže, logistička regresija,
vektorska kvantifikacija, ciljana regresija i stablo odlučivanja) na šest setova podataka (među
ostalima postavljanje dijagnoze u medicini, credit scoring, investiranje) te računaju prosječnu
pogrešku u rezultatima predviđanja modela. Pogreške variraju ovisno o različitim metodama i
setovima podataka od korisnog do neupotrebljivosti. Nadalje isti autori kroz istraživanje
ukazuju na značaj prilagodbe podataka namjeni, pri čemu se znatno smanjuje pogreška.
Obzirom na prirodu podataka koji su im bili na raspolaganju, provode i istraživanje s ciljem
da analiziraju pogrešku u predviđanju u slučaju slijednog kombiniranja različitih metoda te
utvrđuju da tim pristupom (ovisno o setu podataka i prirodi metoda) također povećavaju
efikasnost modela.
92
Ovo navodi na važnost odabira modela ovisno o primjeni. Pri tome u literaturi vezano na
rudarenje podataka često ćemo pronaći stav „više je bolje“ pri čemo se misli na podatke,
informacije, njihovu kvalitetu itd. Nastavno na razmatranja „više je bolje“ možemo dopuniti
na način:
- više jest bolje no
- potrebno se pri izradi modela odrediti između efikasnosti i dovoljno dobrog.
5.2. Paradigma efikasnosti i paradigma dovoljnosti
Efikasnost je uobičajeno definirana kao maksimiziranje outputa i minimiziranje inputa.
Najbolje rješenje uobičajeno se definira kao najefikasnije rješenje: ova se ideja u literaturi
naziva paradigma efikasnosti. Ona podrazumijeva da je cilj efikasnosti maksimizirati output
uz minimizaciju inputa (Nisbet et al, 2009). U statističkoj analizi paradigma efikasnosti
podrazumijeva efikasno rješenje kao ono koje ima malu varijancu. Neko se rješenje može
smatrati efikasnijim od drugoga ako matrica kovarijance drugoj oduzeta od iste prvog sadrži
velik broj pozitivnih vrijednosti. Ukoliko su sve vrijednosti pozitivne to se naziva pozitivna
(polu)definirana matrica. Najefikasnije rješenje je ono najbliže takvoj matrici. Iako statistički
dokazan taj pristup rijetko se može primijeniti u praksi obzirom se računa na bazi određenog
parametra izvan kontekst koji je vrlo važan za situacije u praksi. Tako poslovna praksa i,
često, pogled na situacije u praski općenito vodi prema pojmu paradigma dovoljnosti. Ova
paradigma osim samog cilja uključuje i kontekst odnosno sve procese koji vode k tom cilju.
Slijedeći paradigmu dovoljnosti ona će promijeniti način pristupa problemu, od formiranja
skladišta podataka do prihvaćanja onih rješenja koja su „dovoljno dobra“ u funkciji sinergije
u okviru poduzeća/poslovanja te koja mogu djelovati sa drugim procesima kako bi sse
ostvarila poveznica kroz cijeli profitni lanac. Prihvaćanje takvih akcija pružiti će kompaniji
mogućnost da bude proaktivna i prilagodljiva na promjene nasuprot pristupu u kojem
uglavnom reagira na njih.
5.3. Izgradnja modela
Kako je ranije navedeno, sam proces izrade modela može biti više ili manje složen ovisno o
situaciji. Karakteristična procedura uključuje slijedeće faze:
- identifikacija problema,
- prikupljanje podataka,
- formiranje modela,
- izvođenje modela,
93
- analiza rezultata,
- dalje izmjene i unapređenja.
SLIKA 5.3.1. Skica modela
Svaki model formira se sa jasno i definiranom svrhom. Svrha predloženog modela je na
promjenjivim uzorcima pratiti odnose između atributa važnog utjecaja na prodaju te njihov
zajednički i pojedinačni efekt na prodaju.
Algoritamski prikaz izgradnje konkretnog modela sastoji se od slijedećih faza:
- faza 1. definiranje problema (u primjeru analiza odnosa između promatranih i
varijabli, pronalaženje zakonitosti i predviđanje budućih kretanja na bazi povijesnih
odnosa),
- faza 2. odabir i prikupljanje podataka,
- faza 3. pretprocesiranje podataka (inicijalna provjera odnosa, transformacija u REFII
model, pretprocesiranje ostalih podataka, vrednovanje varijabli),
- faza 4. izvođenje rezultata na transformiranim podacima na ovoj razini (po potrebi
sezonske oscilacije, analiza veza, metode vizualizacije)
- faza 5. formiranje Bayesove mreže na transformiranim podacima
94
- faza 6. korištenje Bayesove mreže kao podloge za analizu i donošenje odluka,
izvođenje rezultata iz Bayesove mreže
- faza 7. analiza efikasnosti modela i unapređenja na modelu odnosno kombiniranje
setova podataka ovisno o promatranom području u okviru definicije problema.
Vrste modela možemo kategorizirati na različite načine. Ranije je pojašnjeno kako je
predloženi model deskriptivne prirode. Osim te karakteristike koristeći jednu od podjela iz
referentne literature (Pyle, 2003) možemo tvrdnju dopuniti istovremeno karakteristikama :
- deskriptivan,
- asocijativan ili kauzalan,
- dinamički,
- kvantitativan (iako koristi ekspertno znanje no ono je izraženo vrijednostima)
- te interaktivan.
Tijekom pojedinih faza korišteni su slijedeći programski paketi i/ili alati:
- alat za formiranje i korištenje Bayesovih mreža, Hugin, verzija lite 7.435
- alat za statističku analizu, IBM SPSS Statistics, verzija 19.036
- alat za statističku analizu, Orange for Python, verzija 2.0b37
- Oracle baza podataka verzija 9.2.0.8.0., PL/SQL jezik38
- alat za izradu Bayesivih mreža GeNIe verzija 2.039
- alat za nadzor baze podataka i razvoj PL/SQL programskog koda, Tool for Oracle
Apllication Developers (T.O.A.D.), verzija 9.040
- alat za analizu podataka Tableau verzija 5.141
5.3.1. Identifikacija problema
Problem definiramo kao potrebu za brzom, jednostavnom i dovoljno kvalitetnom analizom
raznih čimbenika koji utječu na tržište iz koje je moguće donijeti zaključke sa određenim
stupnjem sigurnosti koji će se koristiti u daljim poslovnim aktivnostima. Problem se naslanja
35 http://www.hugin.com/, 10.07.2011. 36 http://www-01.ibm.com/software/analytics/spss/products/statistics/, 10.07.2011 37 http://orange.biolab.si/, 10.07.2011. 38 http://www.oracle.com/us/products/database/index.html, 10.07.2011. 39 http://genie.sis.pitt.edu/, 01.07.2011. 40 http://www.quest.com/toad/, 10.07.2011. 41 http://www.tableausoftware.com/; 10.08.2011.
95
na poslovni aspekt i karakteristike djelovanja na tržištu no traži rješenja i izvan tradicionalnog
područja a s ciljem povećana efikasnosti.
Konkretno za primjer baziran na stvarnim podacima problem je analizirati tržišne zakonitosti i
utjecaje u trgovini tekstilnim proizvodima a s ciljem podrške odlučivanju.
5.3.2. Odabir i prikupljanje podataka
Kako je ranije pojašnjeno, sam model nastao je kao podrška odlučivanju u trgovini tekstilnim
i srodnim proizvodima. Inicijalni model modificiran je kako bi se mogao iskoristiti i u drugim
oblicima trgovine te je kao takav predstavljen u ovom radu. Primjeri koji su korišteni
najčešće se odnose na trgovinu tekstilnim proizvodima prvenstveno zbog toga što su
karakteristike tog tržišnog segmenta najsloženije te potvrda modela na takvom uzorku
garantira primjenjivost i u manje složenijim uvjetima. Prednost vezano na ovo istraživanje je
istovremeni i motiv a radi se o činjenici da je autor u svakodnevnom radu nailazio na
probleme u analizi i predviđanju kretanja tržišta.
Konačno, podaci odabrani za primjer modela sastoje se od:
- podataka o prodaji prema količinama i grupama roba na uzorku grada Zagreba u 120
prodajnih jedinica tijekom 2006. i 2007. godine,
- podataka o bruto marži ostvarenoj u prodaji na uzorku grada Zagreba u 120 prodajnih
jedinica tijekom 2006. i 2007. godine
- podataka o kretanju vremenskih prilika u Zagrebu na mjernoj postaji Maksimir od
2000. godine do danas
- posebno vezano na podatke o vremenskim prilikama podaci o srednjoj dnevnoj
temperaturi i promjeni vrijednosti formirani su na uzorku za period od 1949. godine
do uključno 2007. godine posebno procesirani za potrebe ovog istraživanja na bazi
uzorka sa mjerne postaje Maksimir Zagreb
- kalendarske podatke za promatrani period (dan u tjednu, broj tjedna, praznik)
96
Prikaz varijabli s pojašnjenjima nalazi se u slijedećoj tablici.
TABLICA 5.3.2.1. Varijable korištene u modelu
Naziv varijable u modelu Opis/značenje
DAN dan u tjednu (ponedjeljak, utorak, srijeda, četvrtak, petak, subota, nedjelja)
SEZONA sezona (proljeće, ljeto, jesen, zima)
SREDTEMP_POMAK numerički pomak srednje temperature u odnosu na prethodni dan
SREDTEMP_REFII kategoriziran pomak srednje temperature na mjernoj u REFII notaciji
TJEDAN_BROJ numerički broj tjedna u godini
PRAZNIK da li je određeni dan praznik (da/ne)
OBUCA_<spol>_POMAK numerički pomak prodaje/brtuo marže obuće u odnosu na prethodni dan u kojem je prodajna mreža imala status radnog dana
OBUCA_<spol>_REFII kategoriziran pomak prodaje/brtuo marže obuće u REFII notaciji u odnosu na prethodni dan u kojem je prodajna mreža imala status radnog dana
RUBLJE_<spol>_POMAK numerički pomak prodaje/brtuo marže rublja u odnosu na prethodni dan u kojem je prodajna mreža imala status radnog dana
RUBLJE_<spol>_REFII kategoriziran pomak prodaje/brtuo marže rublja u REFII notaciji u odnosu na prethodni dan u kojem je prodajna mreža imala status radnog dana
TRIKOTAZA_<spol>_POMAK numerički pomak prodaje/brtuo marže trikotaže u odnosu na prethodni dan u kojem je prodajna mreža imala status radnog dana
TRIKOTAZA_<spol>_REFII kategoriziran pomak prodaje/brtuo marže trikotaže u REFII notaciji u odnosu na prethodni dan u kojem je prodajna mreža imala status radnog dana
KONFEKCIJA_<spol>_POMAK numerički pomak prodaje/brtuo marže konfekcije u odnosu na prethodni dan u kojem je prodajna mreža imala status radnog dana
KONFEKCIJA_<spol>_REFII kategoriziran pomak prodaje/brtuo marže konfekcije u REFII notaciji u odnosu na prethodni dan u kojem je prodajna mreža imala status radnog dana
Uzorak seta podataka iz skladišta podataka, mjesečni klimatološki izvještaj te povijesne
podatke o promjeni temperature moguće je vidjeti u prilozima ovom radu. Razlog odabira
ovih varijabli krije se sa jedne strane u poslovnim zakonitostima prodaje tekstilnih proizvoda
te situacijama u kojima se može naći analitičar promatrajući utjecaje te sa druge strane u želji
da se popuni praznina prikazana u ranijim istraživanjima a koja se odnosi na analiziranje
podataka o vremenskim prilikama istovremeno sa podacima o prodaji odnosno drugim
zanimljivim podacima.
Uslijed velikog broja artikala različitih karakteristika sa vrlo malo ponavljanja potpuno istih
artikala iz sezone u sezonu (poput recimo boce nekog pića) tekstilna industrija razvila je razne
oblike agregiranja podataka oko grupa roba, namjene robe, materijala i slično. Takva
grupiranja omogućavaju praćenje na razini grupe roba pri čemu je najosjetljiviji dio takvog
pristupa za kasniju analizu ljudski faktor koji odlučuje o pripadnosti robe nekoj grupi pri
ulazu u informacijski sustav.
Kriterij za odabir poslovno zanimljivih varijabli bio je uzeti u obzir referentne grupe
proizvoda (trikotaža, konfekcija, obuća, rublje) za oba spola (muško, žensko) kako bi se kroz
97
heterogenost uzorka jasnije ukazalo na efikasnost primjene modela i veze među različitim
varijablama.
Za kvalitetniji prikaz mogućnosti podaci su izdvojeni u dva uzorka: podaci o količinama
prodaje te podaci o realiziranoj bruto marži (de facto bruto zaradi po proizvodu).
Analiziranjem pojedinih uzoraka moguće je uočavati zakonitosti povezane sa količinama
prodaje/realizacijom bruto marže i vezama prema promjenama vremenskih prilika odnosno
karakteristike sezonskih utjecaja te sa druge strane kombiniranjem oba uzorka moguće je
ukazati na zakonitosti koje upućuju na povećanje efikasnosti poslovanja (na primjer pod
kojim uvjetima sa prodajom manje količine proizvoda ostvarujemo veću bruto maržu).
Podaci su također podijeljeni u dvije godine (2006. i 2007.) kako bi se na praktičnim
primjerima mogle testirati hipoteze modela na dva odvojena uzorka.
Vezano na podatke o vremenskim prilikama, u obzir su uzeti srednja dnevna temperatura te
podatci o jačini vjetra sjevernog smjera dan prije promatranja pomaka kao utjecaj na ranije
spomenuti osjećaj vremenskih okolnosti.
5.3.3. Pristup i tehnike pretprocesiranja podataka
Jedna od okolnosti vezano na uzorke podataka je da je autor tijekom karijere imao priliku
utjecati na izgled i kvalitetu podataka koji su se prikupljali u uzorku iz prodajne mreže42 stoga
je kvaliteta podataka i razina granulacije na najvišoj razini, naravno koliko je to bilo moguće
ovisno o prirodi trgovine (npr. ukoliko prodajno mjesto ne radi nedjeljom nisu dostupni
podaci). Obzirom na ekspertno znanje podaci su harmonizirani na način da se kao kriterij
upotrijebio pristup izračuna na bazi radnih sati prodajnog mjesta pri čemu se vodilo računa da
uzorak prodajnih mjesta koja su radila na određeni dan bude u najvećoj mogućoj mjeri jednak
(više o tome u poglavlju analiza rezultata).
Prikupljanje podataka vršilo se iz skladišta podataka (podaci o prodaji, prodajnim mjestima)
te iz vanjskih izvora (podaci o vremenskim prilikama, kalendar, ekspertno znanje vezano na
kategorizaciju podataka o prodaji i vremenske prilike). Vezano na vanjske izvore podaci su
prikupljeni od Državnog hidrometeorološkog zavoda (mjesečni klimatološki izvještaj43 te
povijesni podaci o temperaturi).
42 vidi životopis autora 43 vidi priloge radu
98
Na podacima je izvršeno čišćenje, strukturiranje te su ETL obradom unošeni u Oracle bazu
podataka nakon čega su agregirani na grupe koje će se promatrati te su prilagođeni odabranoj
vremenskoj dimenziji za model. Prilikom obrade u obzir su uzeta ograničenja:
- prodajna mreža nekim danima ne radi,
- određene dane prodajna mreža na radi jednako dugo kao drugih dana (prije praznika,
povremeno subotom, moguće nedjeljom),
- intenzitet posjećenosti prodajnih mjesta veći je nekim danima (subota) i u nekim
periodima (sezonsko sniženje, razni događaji u gradu)
- u obzir su uzeta samo referentna prodajna mjesta u Zagrebu,
- uzorak u promatranim godinama (2006. i 2007.) u najvećoj mogućoj mjeri je jednak,
pomaci su rezultat kretanja tržišta i prilagodbe tvrtke na uvjete na tržištu
(raspoloživost roba, formiranje cijena).
Inicijalni cjelovit set podataka (za obe kalendarske godine) podvrgnut je standardnoj
deskriptivnoj analizi te su podaci navedeni u slijedećoj tablici.
TABLICA 5.3.3.1. Osnovna statistika seta podataka, uzorak bruto marža pomak
Srednja vrijednost Varijanca Standardna devijacija Minimum Maksimum Podataka
TJEDAN_BROJ 26.57 2.27E+02 15.06 1.00 53.00 730.00 SREDTEMP_POMAK 0.00 1.16E+01 3.41 -13.70 10.80 730.00 OBUCA_Z_POMAK 16.00 5.87E+07 7,661.67 -36,544.11 38,221.26 730.00 KONFEKCIJA_Z_POMAK 103.72 2.28E+09 47,737.16 -400,991.30 387,664.62 730.00 KONFEKCIJA_M_POMAK 106.58 1.23E+09 35,062.16 -205,234.49 117,284.34 730.00 TRIKOTAZA_Z_POMAK 91.13 2.22E+09 47,092.86 -508,692.00 499,040.61 730.00 TRIKOTAZA_M_POMAK 86.19 3.66E+08 19,124.26 -135,016.23 115,747.90 730.00 RUBLJE_Z_POMAK 44.25 5.07E+07 7,118.26 -36,309.09 41,117.82 730.00 RUBLJE_M_POMAK 18.22 1.22E+07 3,486.93 -25,476.48 29,115.21 730.00 OBUCA_M_POMAK 16.40 3.39E+07 5,820.95 -27,288.88 21,689.28 730.00 VJETAR_JACINA 0.84 6.38E-01 0.80 0.00 5.00 730.00
Nastavno na osnovne deskriptivne podatke u nastavku se nalazi tablica korelacija među
varijablama. Korelacija u ovom slučaju upućuje na odnose među varijablama te nam u
određenim slučajevima može poslužiti kako bi provjerili pretpostavke veza među varijablama
ili tek formirali stav prema odnosima na temelju vrijednosti iz matrice.
99
TABLICA 5.3.3.2. Matrica korelacije, uzorak bruto marža pomak44
SRE
DT
EM
P PO
MA
K
OB
UC
A_Z
PO
MA
K
KO
NFE
KC
IJA
_Z
POM
AK
KO
NFE
KC
IJA
_M
POM
AK
TR
IKO
TA
ZA
_Z
POM
AK
TR
IKO
TA
ZA
_M
POM
AK
RU
BL
JE_Z
PO
MA
K
RU
BL
JE_M
PO
MA
K
OB
UC
A_M
PO
MA
K
VJE
TA
R J
AC
INA
SREDTEMP_POMAK 1.000000 OBUCA_Z_POMAK 0.045900 1.000000 KONFEKCIJA_Z_POMAK 0.132030 0.582547 1.000000 KONFEKCIJA_M_POMAK 0.071040 0.515658 0.387346 1.000000 TRIKOTAZA_Z_POMAK 0.070211 0.641812 0.744391 0.434028 1.000000 TRIKOTAZA_M_POMAK 0.068771 0.474655 0.319505 0.684957 0.484860 1.000000 RUBLJE_Z_POMAK 0.063489 0.551416 0.399443 0.556513 0.543218 0.743228 1.000000 RUBLJE_M_POMAK 0.009001 0.400806 0.182871 0.547517 0.439143 0.740095 0.749789 1.000000 OBUCA_M_POMAK 0.054480 0.468951 0.292283 0.704197 0.362284 0.572730 0.526031 0.508046 1.000000 VJETAR_JACINA -0.176405 0.019397 -0.048068 0.016513 -0.024519 0.024426 -0.027229 0.008387 -0.009170 1.000000
Nastavno na opisano grupiranje uzorka slijede tablice deskriptivnih vrijednosti i matrica
korelacija za uzorak baziran na pomaku količina prodaje.
TABLICA 5.3.3.3. Osnovna statistika seta podataka, uzorak prodaja pomak
Srednja vrijednost Varijanca Standardna devijacija Minimum Maksimum Podataka
TJEDAN_BROJ 26.57 2.27E+02 15.06 1.00 53.00 730.00 SREDTEMP_POMAK 0.00 1.16E+01 3.41 -13.70 10.80 730.00 OBUCA_Z_POMAK 0.09 1.01E+03 31.80 -167.00 215.00 730.00
KONFEKCIJA_Z_POMAK 0.55 4.14E+04 203.48 -1,674.00 1,629.00 730.00 KONFEKCIJA_M_POMAK 0.42 1.45E+04 120.39 -552.00 508.00 730.00 TRIKOTAZA_Z_POMAK 1.26 2.23E+05 472.06 -3,981.00 3,905.00 730.00 TRIKOTAZA_M_POMAK 0.64 2.95E+04 171.86 -980.00 973.00 730.00
RUBLJE_Z_POMAK 1.07 5.52E+04 235.02 -1,043.00 1,184.00 730.00 RUBLJE_M_POMAK 0.70 2.27E+04 150.79 -997.00 1,083.00 730.00 OBUCA_M_POMAK 0.07 6.16E+02 24.81 -101.00 91.00 730.00
TABLICA 5.3.3.4. Matrica korelacije, uzorak prodaja pomak45
SRE
DT
EM
P PO
MA
K
OB
UC
A_Z
PO
MA
K
KO
NFE
KC
IJA
_Z
POM
AK
KO
NFE
KC
IJA
_M
POM
AK
TR
IKO
TA
ZA
_Z
POM
AK
TR
IKO
TA
ZA
_M
POM
AK
RU
BL
JE_Z
PO
MA
K
RU
BL
JE_M
PO
MA
K
OB
UC
A_M
PO
MA
K
VJE
TA
R J
AC
INA
SREDTEMP_POMAK 1.000000 OBUCA_Z_POMAK 0.010623 1.000000 KONFEKCIJA_Z_POMAK 0.079367 0.571657 1.000000 KONFEKCIJA_M_POMAK 0.092202 0.458669 0.404180 1.000000 TRIKOTAZA_Z_POMAK 0.010357 0.574973 0.850246 0.427486 1.000000 TRIKOTAZA_M_POMAK 0.083449 0.430264 0.424820 0.734953 0.566510 1.000000 RUBLJE_Z_POMAK 0.044715 0.511864 0.493065 0.646943 0.582272 0.719620 1.000000 RUBLJE_M_POMAK 0.011509 0.395763 0.235001 0.638952 0.418843 0.701546 0.741911 1.000000 OBUCA_M_POMAK 0.077321 0.495106 0.294579 0.616162 0.363918 0.517080 0.512668 0.538947 1.000000 VJETAR_JACINA -0.176405 0.009414 -0.037188 -0.004924 -0.022110 0.014653 -0.041417 0.002170 -0.026093 1.000000
44 vidi Prilog 16. ovom radu 45 vidi Prilog 16. ovom radu
100
Kroz razne alate postoje razne tehnike identifikacije ekstremnih i nedostajućih vrijednosti te
rad s njima odnosno prilagođavanje seta podataka kvaliteti potrebnoj da se podaci koriste u
istraživanju. Ovdje je važno spomenuti da je uzorak podataka o prodaji i bruto marži
harmoniziran prema satima rada prodajnog mjesta no ipak postoje neka ograničenja u
korištenju podataka posebno kod usporedbe kretanja vrijednosti u npr. ponedjeljak nakon
subote ili nedjelje. Obzirom je ovo karakteristika ove vrste trgovine podaci su prilikom
transformacije obrađeni na način da uzimaju u obzir ograničenja dok je kod usporedbe između
godina uzeto u obzir da sličan uzorak na bazi cijele godine usporediv u stvarnosti.
Također ovdje je osim promjena u tržišnim okolnostima potrebno napomenuti klimatološke
promjene. Konkretno za podatke o srednjoj dnevnoj temperaturi na mjernoj postaji Maksimir
uspoređujući podatke za 2006. i 2007. vidljivo je povećanje srednje temperature odnosno
podaci upućuju na topliji jesensko/zimski period što je važno za prodaju podložnu sezonskim
ovisnostima. Sukladno tome očekujemo efekte u rezultatima.
TABLICA 5.3.3.5. Deskriptivni podaci, usporedba uzorka srednje dnevne temperature sa
mjerne postaje Maksimir Zagreb za 2006. i 2007. godinu
Godina Srednja vrijednost Varijanca Standardna devijacija Minimum Maksimum Podataka
2006 11.82356 74.29593 8.619509 -10 28.3 365
2007 12.59863 61.52321 7.843673 -4.6 29.2 365
101
SLIKA 5.3.3.1. Kretanje srednje dnevne temperature tijekom 2006. i 2007.
Za detaljniji uvid u tehnike pretprocesiranja svakako je potrebno ukazati na referentnu
literaturu (Pyle, 1999) obzirom istraživači ne moraju imati pristup niti dostupnost podataka
kao slučaj opisan u radu.
5.3.4. Transformacija u REFII
Na pripremljenim podacima izvedena je posebno pripremljena PL/SQL skripta za
transformaciju podataka u REFII model. Procedura treba biti izvedena tako da dopušta
promjenu gradacije ovisno o ekspertnom znanju, periodu i grupi roba.
Transformacija je izvedena za svaku pojedinu grupu roba, za temperaturu na bazi uzorka te za
podatke o vjetru kako je opisano u dijelu koji opisuje razloge odabira varijabli.
Obzirom na specifičnosti prodajne mreže (prvenstveno neradne nedjelje) algoritam za
transformaciju podataka o prodaji uključivao je korekciju vrijednosti prodaje na način da ih
uključuje u model ukoliko je na određeni dan referentan broj prodajnih mjesta bio otvoren no
nije se dogodila prodaja odnosno da za referentan pomak uzima prvi prethodni dan koji je
referentan broj prodajnih mjesta bio otvoren već prema situaciji. Na taj način izbjegnute su
102
eventualne pogreške moguće zatvorenih prodajnih mjesta (preuređenje i slično) te nedjelja i
praznika kojima mreža radi na drugačijem režimu.
Transformacija je izvedena provjerom uzorka atributa te definiranjem kriterija pomaka (nema
promjene, blagi rast/pad, srednji rast/pad, snažan rast/pad). Za buduće radove u prilogu ovog
rada prikazan je primjer skripte u PL/SQL jeziku koja omogućava unos kriterija za
transformaciju te analizira uzorak. Na podacima u primjeru ovog rada korištena su ekspertna
znanja (obzirom na karakteristike prodajne mreže) dok je u skripti prikazan model preuzet iz
teoretskih osnova ovog rada (1% odstupanja od prosjeka nema promjene, do 20% blaga
promjena, do 60% srednja promjena, preko 60% odstupanja od prosjeka snažna promjena).
TABLICA 5.3.4.1. Podaci transofmirani u REFII notaciju
Datum Pomak prodaja ženske konfekcije
02.01.2006. SNAŽAN RAST
03.01.2006. BLAGI RAST
04.01.2006. NEMA PROMJENE
… …
Transformacija je izvedena na bazi kuta otklona vektora promjene te je takva prikladna za ovu
vrstu modela.
TABLICA 5.3.4.2. Rangiranje varijabli prema Gini indeksu46
Atribut Gini indeks Atribut Gini indeksRUBLJE_Z_REFII 0.217 KONFEKCIJA_M_REFII 0.263 SREDTEMP_REFII 0.200 DAN 0.213 DAN 0.175 TRIKOTAZA_M_REFII 0.183 RUBLJE_M_REFII 0.158 TRIKOTAZA_Z_REFII 0.180 OBUCA_Z_REFII 0.110 OBUCA_Z_REFII 0.180 OBUCA_M_REFII 0.108 SREDTEMP_REFII 0.163 VJETAR_JACINA 0.108 OBUCA_M_REFII 0.147 KONFEKCIJA_Z_REFII 0.108 RUBLJE_Z_REFII 0.130 SEZONA 0.108 RUBLJE_M_REFII 0.080 TRIKOTAZA_M_REFII 0.092 SEZONA 0.080
Uobičajena interpretacija vrijednosti Gini indeksa kao minimalno iskoristivu vrijednost
promatra indeks > 0.100. U promatranom slučaju iako su vrijednosti prema tom kriteriju 46 transformirani uzorak količina prodaje (lijevo, ciljna varijabla ženska trikotaža) i transformirani uzorak bruto marža (desno, ciljna varijabla ženska konfekcija); Orange modul za Python, modul Rank
103
relativno male obzirom na strukturu uzorka one su referentan pokazatelj različitosti uzorka te,
naravno, ovise uvelike o varijabli cilja.
5.3.5. Formiranje modela (Bayesove mreže)
Na konačno formiranom uzorku kreira se Bayesova mreža. Ovisno o broju atributa na
konačnom modelu moguće je za izgradnju mreže koristiti automatske metode odnosno
moguće je ručno izgraditi model. Za izgradnju mreže korisno je sastaviti tablicu odnosa
(temeljem iskustva, istraživačkog motiva) za daljnje referenciranje i eventualne korekcije
odnosno dokumentiranje modela.
Tri su glavna postupka povezana za zaključivanjem u Bayesovoj mreži (Neapolitan, 2004):
- analiza zakonitosti nepromatranih varijabli (koje proizlaze iz modela),
- učenje parametara u mreži i
- učenje strukture mreže.
U konkretnom primjeru struktura mreže je formirana putem ekspertnog znanja uz provjeru
snage veza među varijablama dok su parametri u mreži istrenirani putem podataka iz uzorka.
Vezano na analizu zakonitosti ista je navedena na primjerima u dijelu interpretacije rezultata.
Struktura mreže, ovisno o predmetu istraživanja, dostupnom ekspertnom znanju i potrebi
može biti stvorena i kroz alat a na bazi podataka i neke od spomenutih metoda pretraživanja.
Ukoliko se mreža formira na takav način važno je voditi računa o mogućem zanemarivanja
odnosa od strane alata a ovisno o primijenjenom algoritmu. U svakom slučaju kombiniranje
numeričkih metoda provjere veza te ekspertnog znanja uvijek pruža najbolje rezultate.
Za konkretan slučaj baziran na podacima o prodaji tablica odnosa izgleda kako prokazuje
slijedeća tablica. Obzirom je odnose moguće formirati samo u jednom smjeru tablicu je
moguće čitati sa bilo koje strane atributa pri čemu strelica na presjecištu označava smjer veze
(npr. Dan Žensko rublje, interpretacija: dan u tjednu utječe na prodaju rublja).
U definiranju odnosa važno je napomenuti na podjelu na osnovne tržišne grupe roba
(konfekcija i trikotaža) te dodatne grupe roba (obuća i rublje). Pri tome priroda trikotaže je da
se radi o artiklima manjeg fizičkog volumena i manje prosječne cijene stoga su prikladni za
ciljnu varijablu pri analizi količina dok je konfekcija zbog svojih karakteristika (sezonska
ovisnost, fizički veći i skuplji artikli) pogodne za ciljnu varijablu u analizi realizirane bruto
marže. Grupe obuća i rublje dodatne se grupe koje se nadovezuju na osnovne iako imaju i
vlastita tržišna pravila. Na taj su način formirane veze koje je moguće vidjeti u tablici veza u
nastavku.
104
TABLICA 5.3.5.1. Prikaz veza u Bayesooj mreži, prodaja količine
Žensko Muško
Dan
Sezo
na
Sred
nja
tem
pera
tura
Vje
tar j
ačin
a
Rub
lje
Obuća
Trik
otaž
a
Kon
fekc
ija
Rub
lje
Obuća
Trik
otaž
a
Kon
fekc
ija
Dan Sezona Srednja temeperatura Vjetrar jačina
Žens
ko
Rublje
Obuća
Trikotaža
Konfekcija
Muš
ko
Rublje
Obuća
Trikotaža
Konfekcija
Za primjer modela korišten je alat GeNIe u koji su učitani setovi podataka te je na bazi njih
sastavljena Bayesova mreža prema pravilima u tablici. Problem koji se pojavljuje pri analizi
velikog broja atributa i veza (u ovom slučaju 12 atributa, selektivne veze) je broj podataka
odnosno kombinacija s kojima model mora operirati.
TABLICA 5.3.5.2. Prikaz veza u Bayesovoj mreži, ostvarena bruto marža
Žensko Muško
Dan
Sezo
na
Sred
nja
tem
pera
tura
Vje
tar j
ačin
a
Rub
lje
Obuća
Trik
otaž
a
Kon
fekc
ija
Rub
lje
Obuća
Trik
otaž
a
Kon
fekc
ija
Dan Sezona Srednja temeperatura Vjetrar jačina
Žens
ko
Rublje
Obuća
Trikotaža
Konfekcija
Muš
ko
Rublje
Obuća
Trikotaža
Konfekcija
105
Za ilustraciju modeli izrađeni prema tablicama spremljeni u datoteku veličine su oko 150MB
te je za pokretanje analize potrebno osigurati dovoljnu procesorsku snagu što danas ne bi
trebao biti problem.
Po formiranju odnosa (relacija) u fazi izgradnje modela na bazi učitanih podataka alat „uči“
zakonitosti te formira mrežu. U promatranom slučaju to je učinjeno PC algoritmom uz
korisničku interakciju oko strukture mreže kako je prikazano u tablicama veza. Pretpostavke
korištenja ove metode su da nema dilema oko veza koje su savršeno interpretirane
usmjerenim acikličkim grafovima te sa testovima na podacima ne ukazuju na anomalije
odnosno da su tretirane nedostajuće i ekstremne vrijednosti u uzorku. Algoritam na bazi
podataka traži optimalnu strukturu nakon koje korisnik dodatno prilagođava istu a prema
željenom poslovnom modelu koji se promatra.
Algoritam (Spirtes et al, 2000) je baziran na pretraživanju vjerojatnosti , pri čemu je
A set varijabli. Na bazi ovog pravila metoda može raditi sa bilo kojim uzorkom. Ako je
nadalje X slučajna varijabla a P i Q dvije distribucije vjerojatnosti proračunavaju se tzv.
Kullback-Leibler (Cruz-Perez, 2008) distance između Q i P.
|| log
Ako su X i Y slučajne varijable sa zajedničkom distribucijom vjerojatnosti njihova entropija
računa se formulom
, , log,
,
,
Ako su X, Y i Z varijable zajednička entropija X i Y za dani Z računa se formulom
, | , | log, |
| |
,
Taj izraz potvrđuje da je CE(X,Y|Z) = H(X|Z) – H(X|Y,Z) te se također naziva zajednička
informacija. Pri tome Z može predstavljati i set varijabli. Kako bi se provjerilo da li su X i Y
uvjetno nezavisni od A računamo zajedničku entropiju CE(X,Y|A) pri čemu su vjerojatnosti
maksimalno očekivane iz seta podataka (relativne frekvancije). Statistička provjera vrši se
izračunom
2 , |
pri čemu je M veličina uzorka. Poznato je da, pod uvjetom neovisnosti, G2 prati X2
distribuciju sa određenim stupnjem slobode jednakim
106
1 1
pri čemu rw predstavlja broj vrijednost varijable W.
Struktura algoritma:
- pronađi uzorak na grafu (neusmjereni graf)
- pronađi veze između članova testirajući nezavisnosti
- orjentiraj se na ostale veze bez formiranja ciklusa
Za matematičku interpretaciju i detaljnu razradu algoritamskog postupka upućujem na
referentnu literaturu (Moral, 2003). Algoritam provjerava parove te odlučuje o zavisnostima i
konačnom prijedlogu strukture. Nastavno na opisani algoritam važno je spomenuti i njegovo
unapređenje u obliku NPC algoritma. Oba se koriste u alatu koji je de facto standard za ovo
područje, Hugin-u. NPC algoritam razlikuje se u odnosu na PC prvenstveno u tome što uvodi
koncept nužnog puta pri čemu se u fazi provjere testiraju samo ovisnosti koje su definirane
putevima. Provjerom određenog dijela mreže ovim algoritmom moguće je ukloniti veze do
neke točke do koje smo izračunali ovisnosti nakon čega se dodatno smanjuje polje rješenja a
zadržava znanje koje je zabilježeno na promatranoj točki. Ovo zahtjeva dodatnu interakciju
između analitičara i alata no omogućava analize velikih setova podataka na isti način kao one
manje. Za više podataka upućujem na referentnu literaturu (Steck, 2001). Također, više o ovoj
tematici moguće je pronaći u priručnicima Hugin alata (Jensen et al, 2005).
Za uzorke u ovom radu PC algoritam učenja u alatu GeNIe na dvojezgrenom CentrinoPro
procesoru takta 2.2Ghz i 4,0GB radne memorije proces „učenja“ traje oko jedne minute.
Model spreman za analizu izgleda kako prikazuje slika u nastavku.
Uobičajeno, model se osim topološki te ovisno o alatu prikazuje i putem tablica izvedenih
vjerojatnosti za svaki atribut koje se pak mijenjaju prema tome na koji način definiramo
okolnosti u modelu i/ili cilj modela. Ovisno o alatu moguće je pratiti određene okolnosti i
ciljeve te prema njima analizirati ostale dijelove mreže i ovisnost među varijablama. Alat koji
je korišten u ovom radu spada u besplatne alate te ga je moguće preuzeti sa web mjesta
navedenog u prilogu ovog rada. Referentni alat za ovu svrhu je Hugin međutim on je bez
naknade dostupan samo u ograničenoj verziji koja ne dopušta rad sa ovako velikim brojem
odnosa i atributa no važno ga je spomenuti za eventualne buduće istraživače.
Prikazom putem veza i tablica uvjetne vjerojatnosti formiran je model i spreman je za
provođenje analiza. Ovisno o prirodi istraživanja model je moguće dopunjavati te prikazivati
107
njegove dijelove i odnose među atributima. Za ilustraciju model na podacima o prodaji za
godinu 2006. ima 12 atributa, 73 stanja i 5.147.555 parametara u modelu.
SLIKA 5.3.5.1. Bayesova mreža, prodaja količine
Prikaz modela sa tablicama uvjetnih vjerojatnosti proračunatih za atribute dan je na slici u
nastavku. Svaki atribut prikazan je grafički te su unutar prikaza navedena sva stanja sa
tablicama vjerojatnosti i grafičkim prikazom istih. Promjenom stanja pojedinog atributa
mreža proračunava tablica vjerojatnosti te ih interaktivno prikazuje. Sustav dopušta
definiranje okolnosti/stanja i ciljeva pri čemu je moguće definirati stanje kao jednostruku
vrijednost ili kao kombinaciju vjerojatnosti više vrijednosti unutar atributa pri čemu suma
svih stanja unutar jednog atributa mora biti 100%. Za lakše snalaženje na raspolaganu su nam
mogućnosti vizualnog prilagođavanja (boje objekata, veličine objekata). Svaka od veza
(stralica) predstavlja slijednu ovisnost koju je moguće izraziti snagom veze i vjerojatnošću
rezultata o zavisnosti o zadanim okolnostima promatranja.
108
SLIKA 5.3.5.2. Prikaz modela u obliku grafikona vjerojatnosti (uzorak prodaja količine
2006.)
5.4. Model u primjeni
Formirana Bayesova mreža predstavlja i konačni model spreman za korištenje. Ovisno o alatu
koji se koristi za formiranje Bayesove mreže moguće je kombinirati setove podataka te na
modelu vršiti upite a kako bi se dala informacija o vezama između varijabli odnosno kako bi
se iz podataka dobilo znanje potrebno za razumijevanje promatranih situacija te donošenje
odluka u budućnosti.
Pokazanim pristupom u isti smo model uključili podatke različite prirode na način koji
omogućava analizu njihovih međuzavisnosti dok Bayesova mreža svojim karakteristikama
daje mogućnost jednostavne interakcije i korištenja rezultata i osobama koje ne moraju imati
predznanje vezano na metode korištene pri formiranju modela.
Korištenje modela vrlo je jednostavno jednom kad je isti formiran i postavljen. U poslovnom
svijetu analize koje se provode često su složene prirode te uključuju mnoge okolnosti što
upućuje na velik broj rezultata koje je potrebno sistematizirati. Kako bi se kvalitetno
109
sistematizirali potrebno je voditi računa o elementima modela a kako se pri interpretaciji
rezultata ne bi izgubilo na kvaliteti podataka za podršku odlučivanju.
Korištenjem raznih pogleda na podatke i njihove veze moguće je dobiti odgovore u obliku
tablica uvjetnih vjerojatnosti za događaje/ciljeve na jednostavna pitanja poput „kojeg dana u
tjednu je trend volumena prodaje najveći“ do složenijih „ukoliko se pojavi nagli pad
temperature uz snažan pad volumena prodaje ženskog rublja što se događa sa realiziranom
maržom u prodaji muške konfekcije“.
5.5. Posebnosti modela i analize u području trgovine
Promatrajući sa aspekta analize, područje trgovine sadrži mnoge posebnosti koje su na
različite načine spomanute u ovom radu no za bolje razumijevanje i daljnja istraživanja
potrebno ih je izdvojiti u zaseban kontekst. Osnovni čimbenici tržišta su svakako proizvod i
kupac bez kojih istog ne bi ni bilo. Slijedeće je važno spomenuti sve one čimbenike koji
opisuju platformu tržišta, platformu koja omogućava razmjenu inforamcija, roba i dobara te
novca. Nakon toga dolaze svi ostali: proizvođači, posrednici, analitičati i znanstvenici.
Zakoni ponude i potražnje te vizija budućnosti ključni su za stvaranje ideje o kreiranju novog
proizvoda. Slijedi proces evaluacije resursa i prozvodnih kapaciteta nakon čega se, ukoliko se
zavodolje svi preduvjeti, pristupa proizvodnji odnosno posljedično optimizaciji proizvodnog
procesa (proizvodne serije, povezani artikli). Proizvod(i) se nakon toga logističkim lancem
usmjeravaju prema tržištu, prema posrednicima i krajnjim kupcima. Nerijetko,proizvodi
bivaju prodani već unaprijed te uz određene posebnosti u vrlo kratkom vremenu dolaze na
raspolaganje kupcima. Nakon što je proizvod stavljen na raspolaganju kupcu (na polici, u
katalogu, na internet stranici) raznim promotivnim aktivnostima isti se oglašava i čini
poželjnim ciljanom tržišnom segmentu. Ukoliko ne ne uspije prodati proizvod doživljava
prilagodbe (sniženje prodajne cijene, izmjena karakteristika) nakon čega se očekuje da će uz
izmjenjene karakteristike pronaći svog kupca. U slučaju da ni nakon toga ne dođe do prodaje
proizvod na kraju životnog ciklusa postaje predmetom prodaje tržinim posrednicima koji se
bave prodajom robe koja je preostala iz prethodnih sezona tzv. outlet ili stock robe47. Nakon
čega ulaze u drugi sličan ciklus.
Tijekom cijelog perioda životnog ciklusa proizvoda bilježe se podaci o njegovom stanju te se
isti analiziraju ovisno o prirodi proizvoda, sezoni o drugim karakteristikama. U svakoj od
47 mađu najpoznatijima tvrtka McArthurGlen, http://www.mcarthurglen.com/; 15.08.2011.
110
brojnih faza teži se optimizaciji resursa (vrijeme, kapital) te što efikasnijem planiranju
budućih ciklusa što je predmet i ovog istraživanja.
Proizvod mora biti na raspolaganju kupcu na vrijeme (npr. akcije tijekom početka školske
godine ili kupaći kostimi tijekom ljeta), po odgovarajućoj cijeni (utjecaj konkurancije,
očekivanja tržišta, primjer: cijena i opremljenost automobila u SAD i Europi – u SADu su
opremljeniji i prosječno niže cijene za sličan model no u SADu su kupci skloniji prihvaćanju
novih tehnologija) i u odgovarajućem okruženju (masovno tržište nasuprot specifičnim
nišama poput na primjer prodavaonica odjeće za ljude krupnije građe ili provaonice cipela za
ljude sa velikim stopalima).
Povratna veza odnosno inforamcije o tome što je prodano, što se tražilo te što je ostalo
neprodano na kraju sezone izmjenjuju se sve brže tako da neki proizvođači modenih kolekcija
na početku sezone izrade kolekciju koju kasnije dopunjavaju najbolje prodajnim artiklima. Za
takav pristup potrebna je snažna logistička podrška uključivo planiranje svih resursa u lancu
proizvodnje, opskrbe i skladišnih kapaciteta.
Poput sezone u prehrambenoj industriji specifičan pritisak očituje se kroz vijek trajanja robe
(istek valjanosti) i specifičnosti logistike i prodajnihi kapaciteta (npr. skladištenje lako
pokvarljivih proizvoda). Porastom dostupnosti tehnologije sličan efekt ima i tržište
elektronice gdje se u okviru jedne kalendarske godine izmijeni više serija istog proizvoda
kroz nove i unaprijeđene inačice.
Veliko područje primjene navodi na širok opseg potreba te velik broj mogućih istraživanja
koja su primjenjiva u praksi. Otvoreni modeli poput opisanog ostim prikazanog područja
mogu se primijeniti i u drugim nišama obzirom većina nailazi na iste probleme u analizi poput
velikog broja čimbenika koje treba obuhvatiti i kratkog vremena za raspolganju za reakciju.
Pojedini radovi čak se bave analizom ponašanja posrednika na tržištu kako bi smanjili prostor
između očekivanja kupca i proizvođača (Da Silvaa et al, 2002, 241-252). Za očekivati je dalji
napredak u razvoju i primjeni sličnih sustava.
111
6. PRIKAZ I ANALIZA REZULTATA PREDLOŽENOG
MODELA
U ovom će poglavlju biti predstavljen model na stvarnom primjeru te iskorišten za
ekstrahiranje znanja na jednom uzorku te provjeru pretpostavki (predviđanje) na drugom
uzorku.
U modelu su korišteni podaci o:
- vremenskim prilikama
o pomak srednje temperature na mjernoj postaji Maksimir Zagreb
o snaga vjetra sjevernog smjera u 21:00 sat prethodno danu promatranja pomaka
- količinskoj prodaji tekstilne robe na uzorku maloprodajnih mjesta u Zagrebu
o muške i ženke obuće
o muškog i ženskog rublja
o muške i ženske trikotaže
o muške i ženke konfekcije
- bruto marži ostvarenoj u prodaji tekstilne robe na uzorku maloprodajnih mjesta u
Zagrebu
o muške i ženke obuće
o muškog i ženskog rublja
o muške i ženske trikotaže
o muške i ženke konfekcije
Podaci su pripremljeni na dva uzorka za godine 2006. i 2007. Obzirom je postojala
mogućnost da se osigura kvalitetan uzorak podataka na kasnijim godinama (napredak
tehnologije, prilagodbe skladišta podataka) kriza koja je zahvatila tržište 2008. godine bitno je
utjecala na kvalitetu uzorka, količine u nabavi i prodaji te broj prodajnih mjesta stoga period
od 2008. godine nadalje nije uključen u istraživanje već su kao referentne godine uzete 2006.
i 2007.
6.1. Odabir varijabli, provjera odabira varijabli, analiza veza
Atributi koji su odabrani za prikaz modela u praksi označeni su oznakama „pomak“ za
numeričke vrijednosti te „REFII“ za podatke transformirane u REFII notaciju.
Provjeru kvalitete odabira varijabli moguće je izvesti na razne načine. Jedan od njih je ranije
spomenuto proračunavanje Gini indeksa, mjerenje snage veza, koeficijenata korelacije i
112
slično. Alternativno za analizu moguće je koristiti neku od metoda vizualizacije rezultati
takve metode ovise o promatraču i o prirodi podataka. U slučaju većeg broja varijabli
vizualizaciju je potrebno provoditi na pojedinačnim parovima odnosno na takvoj razini
granulacija koja omogućava kvalitetan pogled na podatke i odnose. Sukladno tome, numerički
indeksi su efikasniji no ponekad vizualizacija otkrije zanimljivosti koje nije moguće uočiti
primjenom indeksa.
SLIKA 6.1.1. Multigram prikaz veza svih varijabli, debljine linija označavaju snagu veza
(uzorak podaci o ostvarenoj bruto marži)
Ranking se koristi za potvrdu odabira varijabli te za potvrdu kriterija veza pri formiranju
modela (određivanje varijabli koje imaju veći utjecaj odnosno potvrda postojanja različitosti
varijabli u uzorku). Istovremeno vidljiva je kompleksnost odnosa.
6.2. Bayesova mreža
Na bazi izgrađenog modela izvedena je analiza prema unaprijed zadanim scenarijima sa
definiranim ciljevima i okolnostima. U tablicama koje slijede prikazani su rezultati analize pri
113
čemu su postavljene okolnosti označene sivo osjenčanim poljima dok su rezultati prikazani u
obojanim poljima. Ukoliko za postavljene okolnosti nije bilo snažnijeg utjecaja isti nije
naveden u tablici.
U svrhu korištenja rezultata za analizu zakonitosti ali i potvrdu modela analiza i izvršena na
dva odvojena uzorka za godine 2006. i 2007. te se usporedno prikazani podaci kako bi se kroz
njihovu interpretaciju pojasnio način na koji se model može upotrijebiti ali i potvrdile
pretpostavke u zaključivanjima.
Rezultati su podijeljeni u grupe prema setovima podataka:
- podaci o prodaji,
- podaci o realiziranoj bruto marži
- kombinirano prethodne dvije grupe s ciljem povećanja efikasnosti poslovanja
Nadalje, rezultati su podijeljeni su prema scenarijima kako slijedi:
- scenariji u kojima su okolnosti formirane „mekim“ ili „soft evidence“ pravilima (u
kojima zbroj stanja varijabli promatranog atributa iza sumu 1,0 (odnosno 100%) no
pravilo se sastoji od više od jednog stanja),
- scenariji u kojima su okolnosti formirane „čvrstim“ odnosno „evidence“ pravilima (u
kojim sae pravilo se sastoji jednog stanja atributa),
- „što ako“ analize za pojedine zanimljive poslovne pretpostavke neovisno o
formiranim pravilimate
- kombiniranim pristupu setovima podataka (u ovom slučaju o volumentu prodaje i
realizaciji bruto marže) s ciljem usporedne analize.
Za svaki pojedini scenarij i uzorak dani su numerički rezultati uključivo vjerojatnosti ishoda
(kod „scenarija sa „čvrstim“ pravilima) dok su za „što ako“ analize dani opisni rezultati kao
ilustracija mogućnosti. U tablicama su korištene skraćenice: BP/bez promjene, SNP/snažan
pad, BLP/blagi pad, SRP/srednji pad, SNP/snažan pad, BLR/blagi rast, SNR/snažan rast.
Polja rasta osjenčana su zelenom a pada crvenom bojom za lakše snalaženje.
114
6.3. Scenarij analiza utjecaji na količinu prodaje
6.3.1. Definiranje blagog utjecaja
TABLICA 6.3.1.1. Scenarij analiza utjecaji na količinu prodaje
Žensko Muško
God
ina
Dan
Sezo
na
Sred
nja
tem
pera
tura
Sjev
erni
vj
etar
jači
na
Rub
lje
Obuća
Trik
otaž
a
Kon
fekc
ija
Rub
lje
Obuća
Trik
otaž
a
Kon
fekc
ija
Scenarij 1: pad prodaje
2006
BLP 35% SRP 16% SNP 6%
BLP 42% SRP 13%
BLP 33,33%
SRP 33,33%
SNP 33,33%
BLP 47% SRP 12%
BLP 36% SRP 11% SNP 8%
BLP 28% SRP 19%
BLP 39% SRP 10% SNP 9%
BLP 29% SRP 10% SNP 9%
2007
BLP 39% SRP 21% SNP 7%
BLP 31% SRP 21% SNP 7%
BLP 33,33%
SRP 33,33%
SNP 33,33%
BLP 45% SRP 11% SNP 7%
BLP 27% SRP 17% SNP 8%
BLP 24% SRP 13% SNP 14%
BLP 42% SRP 14%
SNP 7%
BLP 30% SRP 12% SNP 12%
Scenarij 2: rast prodaje
2006
BLR 33,33%
SRR 33,33%
SNR 33,33%
BLR 35% SRR 12% SNR 7%
BLR 39% SRR 11% SNR 6%
BLR 45% SRR 12%
BLR 45% SRR 10%
BLR 24% SRR 19% SNR 9%
BLR 41% SRR 10% SNR 8%
BLR 36% SRR 11% SNR 9%
2007
BLR 33,33%
SRR 33,33%
SNR 33,33%
BLR 44% SRR 12% SNR 6%
BLR 49% SRR 8%
SNR 6%
BLR 46% SRR 7%
SNR 6%
BLR 41% SRR 10% SNR 6%
BLR 27% SRR 15% SNR 8%
BLR 42% SRR 10% SNR 6%
BLR 36% SRR 11% SNR 8%
Scenarij 3: utjecaj vjetra u prijelaznoj sezoni
2006 proljeće
BLP 7% SRP 7% SNP 40%
>=2 (od 5)
BLP 41% SRP 12%
BLP 37% SRP 10% SNP 10%
BLR 21% SRR 21% SNR 10%
BLP 31% SRP 12%
SNP 9%
2007 proljeće
BLR 15% SRR 15% SNR 31%
>=2 (od 5)
BLR 19% SRR 12% SNR 11%
BLR 24% SRR 11% SNR 11%
BLR 20% SRR 11% SNR 11%
BLR 20% SRR 11% SNR 11%
Scenarij 4: utjecaj snažnijeg pada temperature u ljetnoj sezoni
2006 ljeto
SRP 50% SNP 50%
BLP 29% SRP 14% SNP 12%
BLP 32% SRP 9%
BLP 21% SRP 12% SNP 8%
BLP 30% SRP 15%
BLR 29% SRR 9%
BLR 16% SRR 22% SNR 10%
BLP 28%
SRP 9% SNP 8%
BLP 34%
SRP 8% SNP 8%
2007 ljeto
SRP 50% SNP 50%
BLP 30% SRP 10% SNP 5%
BLP 31% SRP 5% SNP 5%
BLP 34% SRP 5% SNP 5%
BLP 27% SRP 9% SNP 6%
BLP 26% SRP 9% SNP 6%
BLP 29% SRP 11%
SNP 5%
BLP 34%
SRP 7% SNP 6%
Scenarij 5: utjecaj snažnijeg rasta temperature u zimskoj sezoni
2006 zima
SRR 50% SNR 50%
BLP 32% SRP 8%
BLR 30% SRR 11% SNR 4%
BLR 42% SRR 6%
BLR 40% SRR 6%
BLR 22% SRR 16% SNR 6%
BLR 42%
SRR 4% SNR 4%
BLR 35%
SRR 5% SNR 5%
2007 zima
SRR 50% SNR 50%
BLR 38% SRR 4%
SNR 4%
BLR 41% SRR 4%
SNR 4%
BLR 26% SRR 4%
SNR 4%
BLR 39% SRR 5%
SNR 5%
BLP 32% SRP 11% SNP 5%
BLR 24%
SRR 4% SNR 4%
BLP 33%
SRP 5% SNP 5%
115
Scenarij 1: pad prodaje
Okolnosti: pad prodaje ženske trikotaže (BLP, SRP, SNP = 100%)
Cilj: analizirati kretanje ostalih varijabli
Rezultat: pad prodaje ženske trikotaže povezan je sa ostalim varijablama koje su također
pokazale trend pada, također rezultati se podudaraju između godina što upućuje na pravilnost
u odnosima na nezavisnim uzorcima
Scenarij 2: rast prodaje
Okolnosti: rast prodaje ženskog rublja (BLR, SRR, SNR = 100%)
Cilj: analizirati kretanje ostalih varijabli
Rezultat: rast prodaje ženskog rublja povezan je sa ostalim varijablama koje su također
pokazale trend rasta, također rezultati se podudaraju između godina što upućuje na pravilnost
u odnosima na nezavisnim uzorcima
Scenarij 3: utjecaj vjetra u prijelaznoj sezoni
Okolnosti: sezonska ovisnost posebno je prisutna u prijelaznim sezonama koje uslijed
promjene vremenskih prilika u novije vrijeme često nemaju jasnu vremensku određenost već
su uslijed naglih klimatskih promjena „spojene“ sa redovnim sezonama, pojava snažnijeg
vjetra sjevernog smjera upućuje na promjenu temperature te utječe na faktor osjećaja
temperature (feels like faktor) koji može utjecati na kupca, godišnje doba proljeće, jačina
vjetra sjevernog smjera dan prije promatranja pomaka > 2 (od najviše 5)
Cilj: analizirati kretanje ostalih varijabli
Rezultat: u 2006. godini vidljiv je pad temperature koji prati utjecaj vjetra, također opada
prodaja ženske konfekcije te muškog rublja i trikotaže dok raste prodaja muške obuće. U
2007. godini vidljiv je rast temperature koji prati utjecaj vjetra te su rezultati u prodaji
suprotni trendovima u 2006. te rastu u grupama žensko rublje i obuća te muško rublje i
trikotaža. Zanimljivo je uočiti da se značajniji efekti u promatranim godinama primjećuju na
različitim grupama roba. Ranije je spomenut vidljiv utjecaj promjene klimatoloških prilika u
promatranim godinama. Tablica koja slijedi prikazuje odvojeno godišnje doba proljeće.
116
TABLICA 6.3.1.2. Deskriptivni podaci, usporedba uzorka srednje dnevne temperature sa
mjerne postaje Maksimir Zagreb za proljeće 2006. i 2007. godinu
Godina Srednja vrijednost Varijanca Standardna devijacija Minimum Maksimum Podataka 2006 14.84 23.78927 4.877425 3 26.5 93
2007 16.48 28.94732 5.380271 4.2 29.2 93
Možemo zaključiti da je promatranje prisutnosti sjevernog vjetra opravdano uključeno u
istraživanje no obzirom ovisi o raznim faktorima te se pojavljuje izvan obrasca potrebno ga je
sagledavati u vezi sa snažnijim padom temperature ili na nižim razinama temperature (pri
čemu pojava vjetra pojačava osjećaj hladnoće) dok je u situaciji natprosječno visokih
temperatura njegov utjecaj umanjen odnosno čak i suprotnog karaktera od očekivanja kao što
to prikazuju rezultati u 2006. godini.
Scenarij 4: utjecaj snažnijeg pada temperature u redovnoj sezoni
Okolnosti: sezonsku ovisnost prodaje posebno možemo promatrati na utjecajima promjena
temperature (npr. pad ljeti ili rast zimi) kada se očekuje reakcija na takve promjene, u ovom
slučaju godišnje doba je postavljeno na ljeto te je promatran snažniji negativan trend
temperature (SRP, SNP = 100%)
Cilj: analizirati kretanje ostalih varijabli
Rezultat: uočava se generalno negativan trend prodaje uslijed promjene temperature u svim
grupama i godinama. Tek blaga naznaka rasta muških proizvoda obuće i rublja u 2006. godini
na nižim temperaturama potvrđuju neovisnost kretanja tog tržišnog segmenta (muškarci
očekivano kupuju proizvode kada se za to pojavi potreba, u ovom slučaju niža prosječna
godišnja temperatura uz dodatni pad temperature). Simulirane okolnosti utječu negativno na
percepciju potrošača koji očekuje doživljaj kupnje (dominantno žena).
Scenarij 5: utjecaj snažnijeg rasta temperature u zimskoj sezoni
Okolnosti: godišnje doba zima, snažniji pozitivan trend srednje temperature (SRR, SNR =
100%)
Cilj: analizirati kretanje ostalih varijabli
Rezultat: zabilježen je rast prodaje u svim grupama roba.
117
TABLICA 6.3.1.3. Deskriptivni podaci, usporedba uzorka srednje dnevne temperature sa
mjerne postaje Maksimir Zagreb za zimu 2006. i 2007. godinu
Godina Srednja vrijednost Varijanca Standardna devijacija Minimum Maksimum Podataka 2006 0.73 15.32068 3.914164 -10 12.2 90
2007 6.08 20.50013 4.527707 -4.6 13.8 90
Iako u poslovnoj praksi iznimno topla zima i izostanak snažnijih promjena temperatura
(ujednačenost srednjih vrijednosti temperature tijekom godine) negativno utječu na prodaju,
snažniji temperaturni skokovi utječu na prodaju i to pozitivno ukoliko se radi o zimskim
mjesecima (ulazak u ljepše vrijeme, buđenje proljeća) odnosno, kako je na ranijem scenariju
prikazano, negativno ako se radi o temperaturnim šokovima ljeti kada je percepcija suprotna.
Također, vidljiva je pravilnost kretanja trendova između godina.
6.3.2. Definiranje utjecaja U svrhu analize logičnom se ukazuje potreba za određivanjem najefikasnijeg seta varijabli za
zadani cilj. Obzirom je ovaj model specifičan po tome da za okolnosti RAST i PAD ima tri
stanja potrebno je definirati čvrsti cilj (samo jedno stanje) da bi bilo moguće izračunavati
vjerojatnost takvog cilja odnosno moguće je primijeniti algoritam koji će za zadani cilj dati
kombinaciju faktora koji maksimiziraju posteriori vjerojatnosti. Referentni radovi (Yuan et al,
2004, 628-635) upućuju na tzv. Annealed MAP algoritam koji je ugrađen i u alat GeNIe te će
biti upotrijebljen u nastavku. Taj algoritam simulira lance unutar mreže koji se fokusiraju na
koncentraciju vjerojatnosti u čvorovima mreže te se kroz radove pokazao efikasnim uslijed
čega je uključen u neke alate kao standardni model. Potrebno je napomenuti da iako ovaj
algoritam drastično povećava mogućnosti ovakvog pristupa on je ipak približno rješenje te ga
treba tako i tretirati. U svrhu primjene u poslovnom okruženju koristit ćemo osnovne postavke
algoritma koji se mogu prilagođavati kako bi se optimizirao rezultat uz spomenuta
ograničenja. Kao rezultat algoritma izračunavaju se tri parametra:
- P(MAP | E) – vjerojatnost algoritma za zadan set ciljeva
- P(E) – vjerojatnosti postavljenog cilja
- P(MAP, E) – vjerojatnost algoritma i cilja zajedno
Pri čemu je MAP kratica od najoptimalnije kombinacije parametara (engl. most likely
parameter configuration). Rezultate je potrebno promatrati ovisno o uzorku i definiranom
cilju.
118
TABLICA 6.3.2.1. Primjena Annealed MAP algoritma na uzorku količina prodaje 2006.
Uzorak podataka
Cilj Razultat algoritma; MAP P(MAP) P(E) P(MAP,E)
2006
; kol
ičin
a pr
odaj
e
TRIKOTAZA_Z_REFII BLAGI_RAST
KONFEKCIJA_M_REFII
BLAGI_RAST KONFEKCIJA_Z_REFII
BLAGI_RAST OBUCA_M_REFII
BLAGI_RAST OBUCA_Z_REFII
BLAGI_RAST RUBLJE_M_REFII
BLAGI_RAST RUBLJE_Z_REFII
BLAGI_RAST TRIKOTAZA_M_REFII
BLAGI_RAST
0.05
1259
6308
1782
22
0.23
9436
8281
3714
8
0.01
2273
4434
1450
05
2006
; kol
ičin
a pr
odaj
e
TRIKOTAZA_Z_REFII BLAGI_PAD
KONFEKCIJA_M_REFII
BLAGI_RAST KONFEKCIJA_Z_REFII
BLAGI_RAST OBUCA_M_REFII
BLAGI_PAD OBUCA_Z_REFII
BLAGI_PAD RUBLJE_M_REFII
BLAGI_PAD RUBLJE_Z_REFII
BLAGI_PAD TRIKOTAZA_M_REFII
BLAGI_PAD
0.01
9850
1900
8790
02
0.27
5290
9596
1897
6
0.00
5464
5778
7791
712
2006
; kol
ičin
a pr
odaj
e
SEZONA JESEN
SREDTEMP_REFII
SNAZAN_PAD
KONFEKCIJA_M_REFII
BLAGI_RAST KONFEKCIJA_Z_REFII
BLAGI_RAST OBUCA_M_REFII
BLAGI_RAST OBUCA_Z_REFII
BLAGI_RAST RUBLJE_M_REFII SREDNJI_RAST
RUBLJE_Z_REFII SREDNJI_RAST
TRIKOTAZA_M_REFII BLAGI_RAST
TRIKOTAZA_Z_REFII BLAGI_RAST
0.06
8135
8931
4586
85
0.06
3013
6986
3013
7
0.00
4293
4946
3658
898
119
TABLICA 6.3.2.2. Primjena Annealed MAP algoritma na uzorku količina prodaje 2007.
Uzorak podataka
Cilj Razultat algoritma; MAP P(MAP) P(E) P(MAP,E)
2007
; kol
ičin
a pr
odaj
e
TRIKOTAZA_Z_REFII BLAGI_RAST
KONFEKCIJA_M_REFII
BLAGI_RAST KONFEKCIJA_Z_REFII
BLAGI_RAST OBUCA_M_REFII
BLAGI_RAST OBUCA_Z_REFII
BLAGI_RAST RUBLJE_M_REFII
BLAGI_RAST RUBLJE_Z_REFII
BLAGI_RAST TRIKOTAZA_M_REFII
BLAGI_RAST
0.04
3253
9778
2671
63
0.28
2253
3665
7462
9
0.01
2208
5808
5933
5
2007
; kol
ičin
a pr
odaj
e
TRIKOTAZA_Z_REFII BLAGI_PAD
KONFEKCIJA_M_REFII
SREDNJI_PAD KONFEKCIJA_Z_REFII
BLAGI_PAD OBUCA_M_REFII
BLAGI_PAD OBUCA_Z_REFII
BLAGI_PAD RUBLJE_M_REFII
BLAGI_PAD RUBLJE_Z_REFII
BLAGI_PAD TRIKOTAZA_M_REFII
BLAGI_PAD
0.02
1845
5704
4905
17
0.23
3993
4053
5613
8
0.00
5111
7194
2132
102
2007
; kol
ičin
a pr
odaj
e
SEZONA JESEN
SREDTEMP_REFII
SNAZAN_PAD
KONFEKCIJA_M_REFII
SREDNJI_PAD KONFEKCIJA_Z_REFII
BLAGI_PAD OBUCA_M_REFII
BLAGI_PAD OBUCA_Z_REFII
BLAGI_PAD RUBLJE_M_REFII
BLAGI_PAD RUBLJE_Z_REFII
BLAGI_PAD TRIKOTAZA_M_REFII
BLAGI_PAD TRIKOTAZA_Z_REFII
BLAGI_PAD
0.08
7671
3166
3051
83
0.03
5616
4383
5616
44
0.00
3122
5400
4437
463
Kao i kod analize postavljanjem „mekih“ pravila primjetne su podudarnosti ali i razlike u
okolnostima iako je ovdje potrebno napomenuti da poslovni kontekst PAD ima u promatrnom
slučaju tri stanja (BLAGI, SREDNJI, SNAZAN) te se analiza u praksi provodi u dvije razine:
provjera da li se radi o pozivinoj konotaciji (rast) ili negatovnoj (pad) a nakon toga se
promatra intenzitet. Kao mogućnost koja nije korištena u ovoj analizi mogu navesti opciju
120
ponderiranja stanja blago, srednje i snažno što je također moguće izvesti na modelu no otvara
neka druga pitanja o čemu će više biti riječi poglavlju o smjernicama budućih istraživanja.
6.3.3. „Što ako“ analiza utjecaja na količinu prodaje
Za ad hoc pogled na podatke i poslovne analize model omogućava formiranje ciljeva i
okolnosti na koje je moguće dati odgovore u obliku tablica vjerojatnosti a kako bi se podržale
određene aktivnosti (analiza sezone, uvođenje novog proizvoda, procjena potreba, kretanje
ponude/potražnje).
„Što ako“ analizom moguće je dati odgovore u obliku kratkih interpretacija rezultata što
ilustrira tablica u nastavku.
TABLICA 6.3.3.1. Primjeri ad hoc analiza i interpretaciaj rezultata, uzorak količina prodaje
Cilj Rezultat 2006 Rezultat 2007 kretanje trenda prodaje za dane petak i subotu (da li potrošači više preferiraju dane vikenda?)
muška trikotaža i konfekcija rastu muška konfekcija i obuća rastu
kretanje trenda prodaje za dane utorak, srijeda, četvrtak (da li potrošači više preferiraju dane u tjednu?)
ženska konfekcija i rublje rastu muško rublje raste
ženska trikotaža, konfekcija i rublje rastu muško rublje raste
kretanje trenda prodaje u uvjetima naglog pada temperature praćenog jačim sjevernim vjetrom večer ranije?
ženska konfekcija, trikotaža i obuća u padu muško rublje i trikotaža u padu muška obuća raste
ženska trikotaža i rublje u padu muška trikotaža i konfekcija u padu muško rublje i obuća rastu
kako rast prodaje muškog rublja utječe na ostale varijable?
žensko rublje, konfekcija i trikotaža rastu muška konfekcija i trikotaža rastu
ženska trikotaža raste muška konfekcija i trikotaža rastu
kako rast prodaje muške konfekcije utječe na ostale varijable?
ženska konfekcija, trikotaža i obuća rastu muško rublje, trikotaža i obuća rastu
ženska konfekcija, trikotaža i obuća rastu muško rublje, trikotaža i obuća rastu
ako je godišnje doba zima i dođe do značajnijeg rasta temperature kako se kretala prodaja?
ženska konfekcija i trikotaža rastu ženska obuća pada muško rublje, konfekcija i trikotaža rastu
ženska trikotaža, rublje i obuća rastu muško rublje raste muška konfekcija i obuća padaju
Kombiniranjem blago i čvrsto definiranih utjecaja te interpretacijom rezultata dolazimo do
spoznaja o odnosima te ih možemo koristiti za donošenje odluka ili kao input u dalje analize.
121
6.4. Scenarij analiza utjecaji na realiziranu bruto maržu
6.4.1. Definiranje blagog utjecaja
TABLICA 6.4.1.1. Scenarij analiza utjecaji na realiziranu bruto maržu
Žensko Muško
God
ina
Dan
Sezo
na
Sred
nja
tem
pera
tura
Sjev
erni
vj
etar
jači
na
Rub
lje
Obuća
Trik
otaž
a
Kon
fekc
ija
Rub
lje
Obuća
Trik
otaž
a
Kon
fekc
ija
Scenarij 1: pad bruto marže
2006
BLP 33% SRP 12% SNP 6%
BLP 37% SRP 14%
BLP 46% SRP 7%
BLP 33,33%
SRP 33,33%
SNP 33,33%
BLP 35% SRP 9% SNP 7%
BLP 34% SRP 13%
BLP 40% SRP 10%
SNP 5%
BLP 28% SRP 14%
SNP 5%
2007
BLP 34% SRP 17% SNP 6%
BLP 27% SRP 13% SNP 8%
BLP 40% SRP 7% SNP 7%
BLP 33,33%
SRP 33,33%
SNP 33,33%
BLP 32% SRP 10% SNP 7%
BLP 24% SRP 16% SNP 9%
BLP 32%
SRP 9% SNP 6%
BLP 28% SRP 12%
SNP 8%
Scenarij 2: rast bruto marže
2006
BLR 32% SRR 12% SNR 5%
BLR 29% SRR 13% SNR 6%
BLR 36% SRR 8%
BLR 39% SRR 10%
BLR 38% SRR 8%
BLR 34% SRR 20% SNR 7%
BLR 43%
SRR 9% SNR 5%
BLR 33,33%
SRR 33,33%
SNR 33,33%
2007
BLR 32% SRR 10% SNR 7%
BLR 31% SRR 14% SNR 7%
BLR 37% SRR 7%
SNR 6%
BLR 36% SRR 7%
SNR 6%
BLR 36% SRR 9%
SNR 6%
BLR 31% SRR 21% SNR 7%
BLR 36%
SRR 9% SNR 6%
BLR 33,33%
SRR 33,33%
SNR 33,33%
Scenarij 3: utjecaj vjetra u prijelaznoj sezoni
2006 proljeće
BLP 7% SRP 7% SNP 40%
>=2 (od 5)
BLP 25% SRP 13% SNP 9%
BLR 17% SRR 11% SNR 14%
BLR 31% SRR 12%
BLP 39% SRP 12%
BLR 20% SRR 18% SNR 10%
BLP 33% SRP 14%
SNP 9%
BLP 24% SRP 16%
SNP 9%
2007 proljeće
BLR 15% SRR 15% SNR 31%
>=2 (od 5)
BLR 20% SRR 12% SNR 11%
BLR 20% SRR 11% SNR 11%
BLR 20% SRR 11% SNR 11%
BLR 20% SRR 11% SNR 11%
BLR 19% SRR 11% SNR 11%
BLR 21% SRR 11% SNR 11%
Scenarij 4: utjecaj snažnjeg pada temperature u ljetnoj sezoni
2006 ljeto
SRP 50% SNP 50%
BLP 31% SRP 18% SNP 8%
BLR 31% SRR 9%
SNR 9%
BLR 34% SRR 10%
BLR 19% SRR 15% SNR 10%
2007 ljeto
SRP 50% SNP 50%
BLP 37% SRP 9% SNP 5%
BLP 29% SRP 8% SNP 5%
BLP 29% SRP 5% SNP 5%
BLP 29% SRP 5% SNP 6%
BLP 22%
SRP 8% SNP 5%
BLP 30%
SRP 5% SNP 5%
Scenarij 5: utjecaj snažnijeg rasta temperature u zimskoj sezoni
2006 zima
SRR 50% SNR 50%
BLR 26% SRR 11% SNR 4%
BLP 29% SRP 8%
BLR 30% SRR 13%
BLR 43% SRR 6%
BLP 30% SRP 8% SNP 5%
BLP 33% SRP 9%
BLR 32%
SRR 4% SNR 4%
BLR 46% SRR 11% SNR 4%
2007 zima
SRR 50% SNR 50%
BLR 25% SRR 14% SNR 4%
BLP 36% SRP 4% SNP 4%
BLP 25% SRP 6% SNP 6%
BLP 27% SRP 13% SNP 4%
BLP 37%
SRP 4% SNP 4%
BLR 38%
SRR 4% SNR 4%
122
Scenarij 1: pad realizirane bruto marže
Okolnosti: pad realizirane bruto marže u prodaji ženske trikotaže (BLP, SRP, SNP = 100%)
Cilj: analizirati kretanje ostalih varijabli
Rezultat: pad realizirane bruto marže u prodaji ženske trikotaže povezan je sa ostalim
varijablama koje su također pokazale trend pada, također rezultati se podudaraju između
godina što upućuje na pravilnost u odnosima na nezavisnim uzorcima
Scenarij 2: rast realizirane bruto marže
Okolnosti: rast realizirane bruto marže u prodaji muške konfekcije (BLR, SRR, SNR = 100%)
Cilj: analizirati kretanje ostalih varijabli
Rezultat: rast realizirane bruto marže u prodaji muške konfekcije povezan je sa ostalim
varijablama koje su također pokazale trend rasta, također rezultati se podudaraju između
godina što upućuje na pravilnost u odnosima na nezavisnim uzorcima
Scenarij 3: utjecaj vjetra u prijelaznoj sezoni
Okolnosti: godišnje doba proljeće, jačina vjetra sjevernog smjera dan prije promatranja
pomaka > 2 (od najviše 5)
Cilj: analizirati kretanje ostalih varijabli
Rezultat: kao i u slučaju scenarija s količinama vidljive su oscilacije između uzoraka. Razlike
se očituju kroz preferencije kupaca (koje će proizvode odabrati i kolika je ostvarena bruto
marža odabranim proizvodima). Vidljivo je da (na uzorku iz 2006.) i uz pad količina prodaje
nekih proizvoda realizirana bruto marža raste što upućuje na potrebu za daljim analizama
ovakvih pojava. Više o tome navedeno je u poglavlju u kojem se kombiniraju promatrani
setovi podataka (prodaja i realizirana bruto marža) u nastavku.
Scenarij 4: utjcaj snažnijeg pada temperature u redovnoj sezoni
Okolnosti: godišnje doba ljeto, promatran snažniji negativan trend temperature (SRP, SNP =
100%)
Cilj: analizirati kretanje ostalih varijabli
Rezultat: očekivano, trend kretanja realiziran bruto marže uglavnom prati kretanja volumena
prodaje. I kod kretanja realizirane bruto marže vidljiva je različitost u kretanjima između
godina.
123
Scenarij 5: utjecaj snažnijeg rasta temperature u zimskoj sezoni
Okolnosti: godišnje doba zima, snažniji pozitivan trend srednje temperature (SRR, SNR =
100%)
Cilj: analizirati kretanje ostalih varijabli
Rezultat: iako promatrane okolnosti u primjeru s volumenima prodaje pokazuju generalno
pozitivne trendove ovaj primjer otvara prostor za analizu koja slijedi a upućuje na pitanje što
prodajemo, kome prodajemo i po kojoj cijeni. Rezultati upućuju da volumen prodaje bez
kvalitetnog upravljanja politikom cijena i procjenama ciljanog tržišta ne mode donijeti
efikasan rezultat (povećanje realizirane bruto marže).
6.4.2. Definiranje utjecaja Ranije opisani algoritam primijenjen je i na uzorak podataka o realiziranoj bruto marži sa
rezultatima kako slijedi u tablici.
TABLICA 6.4.2.1. Primjena Annealed MAP algoritma na uzorkurealizirana bruto marža
2006.
Uzorak podataka
Cilj Razultat algoritma; MAP P(MAP) P(E) P(MAP,E)
2006
; bru
to m
arža
KONFEKCIJA_M_REFII BLAGI_RAST
KONFEKCIJA_Z_REFII
BLAGI_RAST OBUCA_M_REFII SREDNJI_RAST
OBUCA_Z_REFII BLAGI_RAST
RUBLJE_M_REFII BLAGI_RAST
RUBLJE_Z_REFII BLAGI_RAST
TRIKOTAZA_M_REFII BLAGI_RAST
TRIKOTAZA_Z_REFII BLAGI_RAST
0.01
2960
6284
8909
13
0.27
6074
5963
2379
2
0.00
3578
1002
7822
853
2006
; bru
to m
arža
KONFEKCIJA_M_REFII BLAGI_PAD
KONFEKCIJA_Z_REFII
BLAGI_PAD OBUCA_M_REFII
SREDNJI_PAD OBUCA_Z_REFII
BLAGI_PAD RUBLJE_M_REFII
BLAGI_PAD RUBLJE_Z_REFII
BLAGI_PAD TRIKOTAZA_M_REFII
BLAGI_PAD TRIKOTAZA_Z_REFII
BLAGI_PAD
0.01
9850
1900
8790
02
0.27
5290
9596
1897
6
0.00
5464
5778
7791
712
124
2006
; bru
to m
arža
SEZONA ZIMA
SREDTEMP_REFII
BLAGI_PAD
KONFEKCIJA_M_REFII
BLAGI_PAD KONFEKCIJA_Z_REFII
BLAGI_RAST OBUCA_M_REFII
BLAGI_PAD OBUCA_Z_REFII
BLAGI_PAD RUBLJE_M_REFII
BLAGI_RAST RUBLJE_Z_REFII
BLAGI_RAST TRIKOTAZA_M_REFII
BLAGI_RAST TRIKOTAZA_Z_REFII
BLAGI_RAST
0.06
3318
4553
0848
46
0.02
4657
5342
4657
53
0.00
1561
2769
8020
921
TABLICA 6.4.2.2. Primjena Annealed MAP algoritma na uzorkurealizirana bruto marža
2007.
Uzorak podataka
Cilj Razultat algoritma; MAP P(MAP) P(E) P(MAP,E)
2007
; bru
to m
arža
KONFEKCIJA_M_REFII BLAGI_RAST
KONFEKCIJA_Z_REFII
BLAGI_RAST OBUCA_M_REFII SREDNJI_RAST
OBUCA_Z_REFII BLAGI_RAST
RUBLJE_M_REFII BLAGI_RAST
RUBLJE_Z_REFII BLAGI_RAST
TRIKOTAZA_M_REFII BLAGI_RAST
TRIKOTAZA_Z_REFII BLAGI_RAST
0.03
1369
1519
2412
59
0.28
5559
5528
5096
2
0.00
8957
7609
9676
73
2007
; bru
to m
arža
KONFEKCIJA_M_REFII BLAGI_PAD
KONFEKCIJA_Z_REFII
BLAGI_PAD OBUCA_M_REFII
SREDNJI_PAD OBUCA_Z_REFII BEZ_PROMJENE RUBLJE_M_REFII
BLAGI_PAD RUBLJE_Z_REFII
BLAGI_PAD TRIKOTAZA_M_REFII
BLAGI_PAD TRIKOTAZA_Z_REFII
BLAGI_PAD
0.01
0574
4774
6097
98
0.22
1473
7331
2244
4
0.00
2341
9689
9910
234
125
2007
; bru
to m
arža
SEZONA ZIMA
SREDTEMP_REFII
BLAGI_PAD
KONFEKCIJA_M_REFII
BLAGI_PAD KONFEKCIJA_Z_REFII
BLAGI_PAD OBUCA_M_REFII
BLAGI_PAD OBUCA_Z_REFII
BLAGI_PAD RUBLJE_M_REFII
BLAGI_PAD RUBLJE_Z_REFII
BLAGI_PAD TRIKOTAZA_M_REFII
BLAGI_PAD TRIKOTAZA_Z_REFII
BLAGI_PAD
0.09
4977
2679
6034
56
0.01
6438
3561
6438
36
0.00
1561
2701
5825
226
6.4.3. „Što ako“ analiza utjecaja na bruto maržu
Nastavno na ranije navedeno provedeno je i nekoliko „ad hoc“ upita s ciljem da se ilustriraju
mogućnosti ovakvog pristupa. Upiti i rezultati prikazani su u tablici u nastavku.
TABLICA 6.4.3.1. Primjeri ad hoc analiza i interpretacija rezultata, uzorak realizirana bruto
marža
Cilj Rezultat 2006 Rezultat 2007 kretanje realizacije bruto marže za dane petak i subotu (da li se profitabilniji proizvodi više prodaju u dane vikenda?)
raste na muškoj trikotaži, konfekciji i obući pada na svim ženskim grupama
raste na muškoj konfekciji trikotaži o obući pada na ženskom rublju, obući i trikotaži
kretanje realizacije bruto marže za dane utorak, srijeda, četvrtak (da li se profitabilniji proizvodi više prodaju u tjednu?)
raste na svim muškim grupama roba raste na ženskoj konfekciji
raste na svim muškim i ženskim grupama roba
kretanje realizacije bruto marže u uvjetima naglog pada tamperature praćenog jačim sjevernim vjetrom večer ranije?
pada na muškoj konfekciji, trikotaži i obući pada na svim ženskim grupama roba
raste na muškoj konfekciji, pada na muškoj trikotaži, obući i rublju raste na ženskoj konfekciji i obući, pada na ženskoj trikotaži i rublju
kako rast realizacije bruto marže u prodaji ženskog rublja utječe na ostale varijable?
raste na svim muškim i ženskim grupama roba
raste na svim muškim i ženskim grupama roba
kako rast realizacije bruto marže u prodaji muške konfekcije utječe na ostale varijable?
raste na svim muškim i ženskim grupama roba
raste na svim muškim i ženskim grupama roba
ako je godišnje doba zima i dođe do značajnijeg pada temperature kako će se kretati trend bruto marže?
raste na ženkom i muškom rublju i muškoj obući pada na svim drugim grupama roba
raste na muškoj trikotaži, rublju i obući, pada na ostalim gupama roba
6.5. Scenarij analiza kombinirani utjecaji na bruto maržu i razinu prodaje
Kombiniranjem podataka modela moguće je otkriti pravilnosti koje osim predviđanja kako je
to navedeno u ranijem dijelu imaju karakter optimizacije odnosno povećanja efikasnosti
poslovanja.
Više je mogućih odgovora na scenarij koji ukazuje na odnos prodanih količina (u
predloženom modelu trend prodaje) i profitabilnost (u predloženom slučaju trend kretanja
realizirane bruto marže).
126
Promatrajući na primjer dan u tjednu utorak, sezonu proljeće te uz uvjet blagog rasta srednje
dnevne temperature uviđamo odnos trenda količina i realizirane bruto marže pri čemu rast
odnosno pad trenda količina donosi rast odnosno pad trenda realizirane bruto marže.
Nastavno na navedno logično je analizirati da li u određenim uvjetima količina opada a
realizirana bruto marža raste i koje su to okolnosti? Promatrajući na primjer trend prodaje i
realizacije bruto marže doći ćemo do rezultata da u slučaju sjevernog vjetra jačine 2 dan prije
promatranja, uz uvjet da je dan u tjednu subota i godišnje doba zima (uzorak iz 2006. godine)
sve grupe roba bilježe par u prodaji. Izdvojeno za primjer na muškoj konfekciji vjerojatnost
pada je preko 60%. No promatranjem realizirane bruto marže uvidjet ćemo da na muškoj
konfekciji (ali i muškoj trikotaži i ženskoj obući) isti uvjeti ukazuju na rast trenda bruto
marže. Navedeno upućuje na dalju analizu formiranih cijena te analiziranje karakteristika roba
a kako bi se prilagođavanjem ponude ostvario najefikasniji mogući rezultat.
Promatrajući točno određenu grupu robe, promjerice mušku konfekciju, analizom u
specijaliziranom alatu možemo doći do podataka i vizualizacije prikazane na slici u nastavku.
Prikazani su prilagođeni dnevni pomaci za 2006. i 2007. godinu na oba uzorka sa istaknutim
kretanjima trenda koji se u ovom slučaju uglavnom podudara na godišnjim razinama.
127
SLIKA 6.5.1. Vizualizacija podataka za opisanoe setove podataka i godine48
TABLICA 6.5.1. Opis trenda uzorka49
Trend Lines Model
A linear trend model is computed for TJEDAN_BROJ given KONFEKCIJA_M_POMAK.
Model formula: GODINA*SET_PODATAKA*( KONFEKCIJA_M_POMAK + intercept ) Number of observations: 1253 DF (degrees of freedom): 8 Residual DF: 1245 SSE (sum squared error): 283225 MSE (mean squared error): 227.49 R-Squared: 0.0023756 Standard error: 15.0828 p (significance): 0.888036 Analysis of Variance:
Field DF SSE MSE F p GODINA 4 661.069 165.267 0.726483 0.573868 SET_PODATAKA 4 32.8529 8.21322 0.0361037 0.997512
Individual trend lines:
Pane(r,c) p Equation (1,1) 0.681529 TJEDAN_BROJ = -1.26596e-005*KONFEKCIJA_M_POMAK + 26.1282 (1,2) 0.951821 TJEDAN_BROJ = 1.25648e-006*KONFEKCIJA_M_POMAK + 27.4574 (1,3) 0.719266 TJEDAN_BROJ = -0.00267271*KONFEKCIJA_M_POMAK + 26.1031 (1,4) 0.91079 TJEDAN_BROJ = 0.000760677*KONFEKCIJA_M_POMAK + 27.5431
48 vizualizacija iz alata Tableau 49 opis trenda modela u alatu Tableau
128
Jasno je da je kombiniranjem raznih poslovno zanimljivih faktora na pravi način i
odgovarajučim modelom moguće pronaći korisne zakonitosti. Dodatni problem koji ovaj
model rješava je kako sve te faktore postaviti u odnos i prikazati te odnose na način da ih je
moguće interaktivno analizirati. Obzirom se radi o moguće velikom broju raznih utjecaja
pojedinačno praćenje može biti upotrebljivo za neke vrlo ograničene pristupe no za
sveobuhvatnu analizu potreban je drugačiji model.
6.6. Kako najbolje iskoristiti model
Kvaliteta podataka jedan je od ključnih preduvjeta za efikasnost primjene rezultata modela.
Povećanjem dostupnosti procesorske snage te razvojem alata za analizu biti će moguće
stvarati složenije sustave pri čemu treba imati na umu da ulančavanje metoda rudarenja
podataka vodi prema ograničavanju polja rješenja pri čemu je posebnu paž nju potrebno
posvetiti kvaliteti konačnog polja rješenja kako u fazi odabira seta ili razine granulacije ne
bismo izgubili potencijalno važne podatke.
Model je široko primjenjiv u situacijama u kojima je potrebno analizirati raznorodne podatke
te kada imamo potrebu analizirati više atributa odjednom (što je priroda svakog poslovnog
okruženja). Time je primjenjiv u svim područjima u kojima je potreban pristup analizi koja je
previše složena za direktnu primjenu numeričkih metoda a istovremeni može izdržati pristup
u kojem se ograničava polje rješenja.
Rezultati modela mogu se koristiti za:
- razumijevanje veza između promatranih varijabli,
- predikciju budućih kretanja na bazi rezultata analize povijesnih podataka i utjecaja,
- prepoznavanje uzoraka kretanja promjena promatranih varijabli u vremenu,
- simulacije poslovnog okruženja bilo za analizu kretanja tržišta bilo za specifične
događaje (pokretanje novog proizvoda).
U uvjetima u kojima je uslijed složenosti sustava koji se promatra nemoguće primijeniti
standardne metode model daje rješenje te dodatno omogućava prilagodbu ovisno o djelatnosti.
6.7. Odabrane metode vizualizacije
Napretkom alata te uz pretpostavku da postoje uvjeti za provođenje metoda iterativnih
pokušaja utvrđivanja zanimljivosti kao efikasne se tehnike pokazuju modeli vizualizacije.
129
Razni alati omogućavaju više ili manje automatizirane izrade često u više dimenzija koje
omogućavaju kvalitetan i koristan pogled na podatke.
Iz iskustva posebno bih skrenuo pažnju na Orange modul za Python, besplatno dostupan alat
sa velikim brojem mogućnosti a koji stalno biva nadopunjavan od strane autora. Upravo iz tog
alata navodim dvije zanimljive vizualizacije na setove podataka iz primjera a kao ilustraciju.
SLIKA 6.7.1. Vizualizacija modela sa 12 atributa, uzorak prodaja50
Općenito je u alatima rijetko dostupan jednostavan pristup vizualizaciji velikog broja
parametara uz dodatne mogućnosti grupiranja i zasebne analize grupa podataka. Prikazi
poput ovog daju uvih u širinu uzorka te omogućavaju utvrđivanje posebnosti područja u
kratkom vremenu. Ograničava ih stupanj preciznosti, odnosno oni su tek predfaza nekoj daljoj
analizi. Posebno korisnim dodatkom pokazuje se mogućnost interaktivnog pristupa
vizualizaciji pri čemu odabir pojedinih kategorija pokazvačem daje dodatne informacije o
uzorku (na slici u primjeru promatra se dan u tjednu srijeda, označen žutim).
50 Orange modul za Python, modul „Liner projection“
130
SLIKA 6.7.2. Analiza veza, vizualni prikaz, muška i ženska trikotaža i konfekcija, uzorak
prodaja51
Slično kao i u prethodnom primjeru te ranije u radu prikazanom multigramu analiza veza daje
pregled u dvije dimenzije broja veza između varijabli a s ciljem otkrivanja intenziteta i drugih
moguće zanimljivih zakonitosti.
6.8. Prednosti i nedostatci predloženog modela
Prednosti su široka primjenjivost te mogućnost kombiniranja velikog broja atributa (svih
podataka koje je moguće opisati vremenskom serijom). Dodatno prednost je prilagodljivost
modela pojedinim područjima te sumiranje ekspertnog znanja u poslovnu razinu modela pri
čemu se empirijski podaci mogu mijenjati i ažurirati kroz vrijeme te se koristiti za punjenje
modela sve dok zadržavaju predloženu strukturu.
Nedostatci modela prvenstveno se očituju u ograničenjima korištenih metoda koji su pak u
uskoj vezi da kvalitetom podataka, znanjem eksperta koji definira zone REF gradacije i
granulaciju podataka te ograničavanjem polja rješenja. Slijedom toga kod primjene modela
potrebno je voditi računa o području primjene pri čemu je najefikasnije područje svakako 51 Orange modul za Python, modul „Parallel coordinates“
131
trgovina i slične djelatnosti. Dodatno, ograničenje može biti procesorska snaga (problem
kombinatorne eksplozije) u slučaju da je modelom potrebno analizirati velik broj varijabli sa
velikim brojem stanja.
6.9. Analiza efikasnosti modela
Efikasnost modela očituje se u primjenjivosti rezultata koji proizlaze iz modela. Tu
prvenstveno govorimo o poslovnom aspektu primjenjivosti. Pojedinačnim metodama moguće
je analizirati pojedine dijelove podataka i samog modela te time potvrditi npr. snagu odnosa
između varijabli ili karakteristike uzoraka podataka (potvrditi da su atributi u uzorku dovoljno
različiti da ima smisla provoditi analizu).
Određivanje efikanosti modela statiskičkim metodama predstavljeno je kroz out-of-sample52 i
out-of-time53 validaciju odnosno na način da je model formiran na bazi podataka za godine
2006. i 2007. te su u fazi analize rezultata uzorci razdvojeni kako bi se provjerilo pravilnost
ponavljanja određenih razultata za zadane okolnosti odnosno na odvojenim uzorcima
pojasnilo na koji način promjena pojedinih parametara utječe na poslovnu interpretaciju
razultata. Također, potrebno je imati na umu da se ovako pripremljeni uzorak podataka sastoji
od 365 zapisa po godini te je pri svakom uzorkovanju potrebno voditi računa o kvaliteti
uzorka odnosno utjecaju na kvalitetu podataka pri smanjivanju inicijalnog seta.
Obzirom se varijable iz vremenskih serija koje se promatraju sastoje od sedam stanja od kojih
tri opisuju rast (blagi rast, srednji rast, snažan rast), tri pad (blagi pad, srednji pad, snažan pad)
i jedna neutralno stanje (bez promjene) moguće je tek djelomično koristiti metode validacije
koje podrazumijevaju jedno stanje ciljne ili ciljnihi varijabli. Sa druge strane upravo taj
pristup daje fleksibilnost primjeni u poslovanju te omogućava pojednostavljivanje polja
rezultata na način da istraživač može izolirati pojedine grupe podataka i zasebno analizirati
karakteristike takvog uzorka te međusobne ovisnosti varijabli.
Kombiniranjem ekspertnog znanja u fazi pretprocesiranja i transformacije u REFII model,
matrice korelacije varijabli odabranih za model, izračunavanja Gini indeksa na
transformiranim varijablama zatim formiranjem dva (ili više) usporedivih uzoraka te
kombiniranjem različitih tehnika pri formiranju varijabli cilja (pravila, meka pravila) uz
dodatne analize metodama vizualizacije omogućavaju efikasno iskorištavnje modela u
52 out-of-sample validacija podrazumijeva izgradnju modela na određenom setu podataka koji se kasnije provjerava na odabranim uzorku tog seta 53 out-of-time validacija podrazumijeva izgradnju modela na setu podataka koji pripada određenom vremenskom periodu koji se kasnije provjerava na usporedivom setu podataka u drugom vremenskom periodu
132
poslovne svrhe, konkretno u području trgovine. Zakonitosti koje proizlaze kao rezultati
modela bilježe se u bazu znanja te ih je moguće naknadno reporoducirati te provjeravati
odnosno bilježiti sličnosti i odstupanja obrazaca kroz vrijeme.
6.10. Smjernice budućih istraživanja
Kroz druga istraživanja i primjere na modelu nedvojbeno je prikazana primjenjivost te je
ponuđen odgovor na neke probleme s kojima su se susretali istraživači posebno oni koji su
istraživali područje trgovine i pokušali u odnos staviti vremenske prilike i podatke o trgovini.
Iako se veći broj radova bavi distribucijskim lancem u tekstilnoj industriji (Forza, 2000, 138-
146) kako bi se efikasno isplanirao taj lanac potrebno je odrediti potražnju. Također radovi na
području predviđanja obzirom na današnje trendove brze mode (Cachon & Swiney, 2011,
778-795) i česte izmjene modnih ciklusa fokusiraju se na predviđanje kroz sustava tzv. brze
reakcije (QR, quick response) (Fiorito et al, 1995, 12-21) odnosno na kanale prodaje (koji je
odgovarajući kanal za pojedinu grupu/vrstu proizvoda (Fisher, 1997, 105-116) što je pitanje
koje zaokuplja interes već duži niz godina).
Pitanja distribucije (Thomassey et al, 2004, 82-95), optimizacije proizvodnje, planiranja i
iskorištavanja prodajnih kapaciteta vrlo su važna pri planiranju efikasnosti no ovise
umnogome o potražnji odnosno realizaciji prodaje kao ključnom aspektu. Kroz predstavljene
rezultate modela ukazano je ono što je predmet dnevnih analiza u tvrtkama koje se bave
prodajom a to je da veća prodana količina ne mora značiti bolji rezultat. A svijet trgovine je
ipak usko povezan sa profitabilnošću odnosno „rastom“ i efikasnošću u svim svojim oblicima.
Nastavno na istraživanje i prezentirane rezultate postoji nekoliko smjerova daljih istraživanja
koje je ovdje potrebno istaknuti.
Nastavno na analizu prodaje i realizirane bruto marže prikazane u modelu za dodatnu
efikasnost u model je uputno uključiti i druge utjecaje u lancu nabave. Povezivanjem ključnih
informacija o kretanju potražnje i prodaje uz dodatak podataka o raspoloživim i transportnim
skladišnih kapacitetima te analizi pakiranja, ključeva boja i veličina te cijena u kombinaciji sa
eksternim podacima (npr. cijene konkurencije) model može postati centralni dio praćenja
poslovanja tvrtke.
Područj
potencij
hand pr
odjeću k
kako bi
SLIKA
Analizo
da web
second
Obzirom
ispod k
proizvo
trenda b
pokazuj
tržišnim
54 http://f55 http://e
e koje je na
jal je zbrinj
roizvodima
koja im više
se ilustrirao
6.10.1. Ras
om odgovar
mjesta pop
hand odjeći
m REFII m
krivulje pog
da prodana
bit će važno
je upravo po
m nišama (p
fashion.ebay.cebay.about.com
a našim pro
avanje stari
no sa drug
e nije potre
o broj mogu
spoložive op
rajućih para
ut stranice e
i pri čemu p
model osim
godan je z
će količina
o da li je ra
ovršina ispo
proizvodnja)
com/; 10.08.20m/od/sellingef
ostorima got
ih tekstilnih
ge strane rad
ebna. Ovdje
ućnosti koje
pcije vezano
al,
ametara mog
eBay54 dana
postoje i spe
kuta otklon
za analize k
a u početku
ast ili pad n
od promatra
) i trgovina
011. ffectivel1/qt/s
tovo netakn
h proizvoda
di se o opc
je potrebno
e su na raspo
o na odlaga
, 1977, 23-4
guće je odre
as ostvare v
ecijalizirani
na omoguć
koje npr. p
u krenuti od
nastao na n
ane krivulje
tekstilnih p
se_sellclothing
nuto a ima z
a. Sa jedne s
ijama koje
o navesti op
olaganju.
anje starih t
41)
editi kapaci
više milijard
i savjeti kak
ćava analizu
prate novi
nule. Nako
nižim ili viš
e trenda. Ia
proizvoda im
g.htm; 10.08.2
značajan istr
strane radi
imaju svi k
pcije koje im
ekstilnih pr
itet ovog po
di američkih
ko efikasno
u putem pr
proizvod.
on nekog vr
šim razinam
ako je to pod
ma sličan p
2011.
raživački i p
se o tržištu
koji posjedu
ma vlasnik
roizvoda (Ja
odručja. Pro
h dolara pro
prodati55.
omatranja p
Uvođenjem
remena pri p
ma prodaje
dručje bliže
pristup koji
133
poslovni
second-
uju staru
odjeće a
acoby et
ocjena je
ometa na
površine
m novog
praćenju
što nam
e drugim
se može
134
spustiti do pojedinog artikla no uglavnom se zaustavlja na pojmu „kolekcija“ koja označava
set artikala usklađenih bojom i odabirom određenoj sezoni i ciljanom tržišnom segmentu.
Konačno, kao direktna nadgradnja na predloženi model moguće je varijable stanja (blago,
srednje, snažno) dodatno ponderirati čime se pri formiranju stanaj varijable cilja dobiva
mogućnost formiranja jednog stanja koje objedinjuje više ranijih stanja a što nadalje
omogućava primjenu svih tehnika analize i validacije koje su karakteristične za takav model.
Za poslovnu primjenu koja se istražuje u ovom radu ovaj pristup predstavlja nepotrebno
dodatno smanjenje polja rješenja pri čemu se gubi izvorni smisao modela no navedeno može
biti potrebno za dokazivanje karakterstika modela tradicionalnim metodama.
135
7. ZAKLJUČAK
Predloženi model konstruiran je sa ciljem da predloži rješenje potrebe za analizom i
razumijevanjem tržišnih zakonitosti te da bude iskorišten kao podrška odlučivanju u
poslovnom okruženju. Obzirom na složene okolnosti u kojima se izvode aktivnosti na tržištu
model mora biti dovoljno robustan i primjenjiv odnosno mora biti u mogućnosti kombinirati
razne poslovno zanimljive atribute te ih biti u mogućnosti prezentirati na jednostavno
razumljiv način te po mogućnosti u obliku front end rješenja koje će moći koristiti i osobe
koje nemaju znanje potrebno za njegovu izgradnju no imaju potrebu koristiti znanje
ekstrahirano iz takvog modela.
Predloženi model u radu je testiran na podacima o prodaji tekstilnih proizvoda kao
najsloženijem primjeru utjecaja i čimbenika te na referentnom uzorku maloprodajne mreže.
Dodatna prednost ovog rada je kvalitetan uzorak podataka koji je pripremljen za potrebe
istraživanja. Rad potvrđuje ne samo mogućnost nego i efikasnost analize podataka u
poslovnom okruženju primjenom odabranih metoda rudarenja podataka.
Probleme koji se pojavljuju u predstavljenom okruženju potrebno je sagledavati sa više
aspekata kako bi se dobila cjelovit pregled. Osnovni problem je kako u upotrebljivoj mjeri
zadovoljiti zahtjeve tržišta i sudionika na tržištu kao što su potreba za kvalitetnim uvidom u
podatke, kratko vrijeme za reakciju, potreba za pristupima koji navode na problem i teže
unapređenje efikasnosti i slično. Cilj istraživanja bio je istražiti mogućnosti primjene metoda
rudarenja podataka i potvrditi korisnost konkretnog pristupa u poslovnom okruženju. Na bazi
opisane metodologije cilje je bio definirati šire primjenjiv model za podršku odlučivanju
odnosno analizu povijesnih trendova i zakonitosti s ciljem efikasnije reakcije na buduća
tržišna kretanja. Rad povezuje metodu za transformaciju i analizu vremenskih serija i metode
rudarenja podataka. Osnova svih aktivnosti povezivanja metodoloških koji otvara mogućnost
drugačije pristupa upravo je jedinstveni model transformacije vremenske serije.
U dijelu koji govori o efikasnosti modela isti je definiran kao potvrda sposobnosti
povezivanja različitih analitičkih metoda ciljem provođenja složenih analiza vremenskih serija
u području istraživanja tržišnih zakonitosti i segmentacije tržišta. Provedena istraživanja
dokazuju primjenjivost i efikasnost modela.
136
Znanstveni doprinos očituje se u predstavljanju nove metodologije u analizi tržišnih
zakonitosti koja se oslanja na karakteristike jedinstvene metode za transformaciju vremenske
serije u smislu rješenja kako raznorodne podatke staviti u odnos te karakteristike Bayesove
logike odnosno pristupa fokusiranja na sažimanje u polju mogućih rješenja. Prednost
ovakvoga pristupa očituje se u kombiniranju različitih pristupa te u mogućnostima primjene
odnosno nadgradnje ovakvog modela. Ovakav pristup daje rješenje na izazov kako uopće
provoditi složene tržišne analize temeljene na vremenskim serijama koje je tradicionalnim
pristupom vrlo teško ili gotovo nemoguće izvesti.
Nastavno na rezultate bit će obrazložene polazne hipoteze.
Hipoteza: događaje odnosno tržište moguće je analizirati metodama rudarenja podataka
Rezultati modela potvrđuju da je primjena metoda rudarenja podataka moguća, u nekim
okolnostima nezamjenjiva u analizi tržišnih kretanja.
Hipoteza: tržišne uvjete moguće je analizirati kombiniranjem /ulančavanjem metoda
rudarenja podataka
Osim što su metode rudarenja podatka pojedinačno primjejnive upravo ulančavanje metoda
rudarenja podataka daje dodatni aspekt primjenjivosti te otvara pristup koji na druge načine
nije moguće ostvariti.
Hipoteza: primjenom REFII modela moguće je kombinirati i analizirati raznorodne grupe
podataka uz pretpostavku da ih je moguće izraziti putem vremenske serije (putem promjene
vrijednosti u nekom vremenu)
Predloženi model upravo na primjerima pokazuje odnosno nastavlja se na razna istraživanja
koja upućuju na zanimljive i iskoristive ovisnosti prodaje i vremenskih prilika no za tu vrstu
analize ne nude rješenja.
Hipoteza: moguće je izgraditi model za podršku odlučivanju slijednom primjenom metode
transformacije vremenske serije (REFII) i Bayesove logike
Izgradnja modela i predstavljanje rezultata te njihova interpretacija i poslovna upotrebljivost
za podršku odlučivanju potvrđuju ovu hipotezu.
137
Hipoteza: model je primjenjiv u trgovini
Model je upravo primjenjiv u područjima u kojima je potrebno zadovoljiti aspekt
„dovoljnosti“ što je posebno slučaj s trgovinom koju karakterizira velik broj čimbenika,
utjecaja i velika dinamika. U radu su navedene specifičnosti trgovine te pokazano na koji
način model rješava nedostatke prethodnih istraživanja te njegova primjenjivost u praksi.
Hipoteza: promjena vremenskih prilika utječe na prodaju
Rezultati modela ukazuju na potvrdu ove hipoteze. Analiza utjecaja vremenskih prilka na
prodaju, posebno na prodaju tekstilnih proizvoda, pitanje je kojem se posvećuje mnogo
vremena. U vremenu u kojem živimo u kojem dolazo do naglih promjena temperature
istraćivanje ovog područja postaje dodatna prednost na tržištu.
Hipoteza: ponašanje potrošača moguće je predvidjeti – ponašanje potrošača u nekoj se mjeri
podudara sa određenim uzorkom koji se pak može ponavljati u vremenu.
Kroz referentne radove povezane tematike prikazana su istraživanja i spoznaje na području
ponašanja potrošača a u kontekstu ovog rada. Kroz analizu rezultata modela na promatranom
uzorku potvrđena je hipoteza te ostvaren doprinos u istraživanju kao podloga za buduće
radove.
Hipoteza: ponašanje potrošača moguće je predvidjeti primjenom metoda rudarenja podataka
– primjenom metoda rudarenja podataka moguće je uočiti obrasce ponašanja i predvidjeti ih
u budućem vremenu.
Na nekoliko različitih scenarija ukazano je na povezanost te na aspekte raznih utjecaja u
vremenu na sličnosti i različitosti obrazaca ponašanja. Obrasci su provjereni na dva nezavisno
uzroka te je moguće prepoznati sličnosti odnosno moguće je prepoznati utjecaje koji dovode
do eventialnih različitosti u rezultatima uzorka. Time je ova hipoteza potvrđena.
Hipoteza: ponašanje potrošača tekstilnih i srodnih proizvoda moguće je predvidjeti
primjenom metoda rudarenja podataka – tekstilni i srodni proizvodi sa svojim posebnostima
dodatno povećavaju složenost istraživanja bilo na strani vanjskih utjecaja bilo na strani
potrošača
Obzirom na prirodu i složenost u pristupu analizi kroz tijek rada izvodi se generički model no
isto se tako izdvajaju karakteristike upravo na primjeru tekstilnih proizvoda obzirom na
138
utjecaje koje je potrebno promatrati. Kako postoji akumulirano iskustvo autora upravo u
području trgovine tekstilom isto je iskorišteno kako bi se dala dodatna kvaliteta ovom radu.
Kroz prikaze i priloge radu nedvojbeno je prikazana razlika u složenosti kad su u pitanju
tekstilni proizvodi.
Hipoteza: kvaliteta informacijskog sustava za praćenje poslovanja i pripadajućeg skladišta
podataka preduvjet su uspješnosti rudarenja podataka u trgovini, tek kvalitetno uobličene i
evidentirane poslovne informacije mogu biti temelj za analizu.
U više navrata u radu upućeno je na situacije koje su se događale tijekom ovog istraživanja
odnosno upućeno je na moguće probleme koji mogu proizaći iz kvalitete podataka tijekom
faza izgradnje modela čime je ova hipoteza potvrđena.
Model se danas primjenjuje u praski za praćenje specifičnih grupa roba u malorpodaji
tekstilom te se pokazao efikasnim u uvjetima u kojima je složenost okruženja takva da nije
moguće na jednostavan način obuhvatiti sve potrebne informacije. Nastavno na smjernice
razvoja model je doživio unapređenja od nastanka te se nastavlja njegov razvoj.
139
KORIŠTENA LITERATURA
Knjige, znanstveni i stručni radovi
- Armstrong J. S. (2001) „Principles of forecasting – A handbook for researcers and
practitioners“, Kluwer Academic Press, Norwell, MA
- Armstrong J. S., Brodie R. J. (1999) „Forecasting for Marketing“, London
International Thompson Business Press
- Barrow M. (1996) “Statistics for Economics, Accounting and Business Studies“, 2nd
Edt., Longman, London
- Cachon G. P., Swiney R. (2011) „The Value of Fast Fashion: Quick Response,
Enhanced Design, and Strategic Consumer Behavior“, Vol. 57, No. 4
- Cassill, N., Kincade, D., Williamson, N. (1993) „The quick response management
system: Structure and components for the apparel industry“, Journal of the Textile
Institute,vol. 84, No. 2
- Charniak E. (1991) "Bayesian Networks Without Tears", http://www.aaai.org
- Choi Y. E, Gaskill L. R. (2000) „An analysis of mental process. behaviors and job
satisfaction of apparel product developers and traditional retail buyers“, Journal of
business research No. 49
- Cooper G., Herskovitts E. (1992) „A Bayesian method for the induction of
probabilistic networks from dana“, Machine learning, 9:309-347
- Cruz-Perez F. (2008) „Kullback-Leibler divergence estimation of continious
distributions“, Princeton University
- Dasgupta C. G., Dispensa G.S., Chose S. (1994) „Comparative predictive performance
of a neural network model with some traditional market response models“,
International journal of forecsting No. 10
- DeLurigo S. A. (1998) „Forecasting Principles and Applications“,McGraw Hill NY
- Edward H., Katsutoshi Y., Yukinobu H., Katoh N. (2000) „A Data Mining System for
Managing Customer Relationship“, AMCIS 2000 Proceedings, paper 33.
- Engel F. J., Blackwell D.R., Miniard W.P. (1995) "Consumer Behavior", The Dryden
Press
- Fiorito S. S., May E.G., Strughn K. (1995) „Quick response in retailing: components
and implementation", International Journal of Retail & Distribution Management“,
Volume 23, No. 5
140
- Fisher M. L. (1997) „What is the right supply chain for your product?“, HBR,
March/April 1997.
- Forza C. (2000) „Time compression in production and distribution within the textile-
apparel chain“, Indegrated Manufacturing systems
- Frank C., Garg A., Raheja A., Sztendera L. (2003) „Forecasting women's apparel sales
using mathematical modeling“, International Journal of Clothing Science and
Technology, Vol. 15, No. 2
- Frank C., Raheja A., Sztandera L., Garg A. (2001) "A Fuzzy Forecasting Model for
Apparel Sales", National Textile Center Annual Report: November 2001.
- Friedman N., Goldszmit M. (1998) „Learning Bayesian networks with local
structure“, University of Jerusalem
- Gobe M. (2001) „Emotional banding“, Allworth press, New York
- Hackerman D. (1995) „A tutorial on leerning with Bayes networks“, Microsoft
corporation technical report, ožujak 1995.
- Heckerman D, Geiger D. (1996) „Likehood and priors to Bayesian networks“,
Technical report MSR-TR-95-54, Microsoft research Redmond SAD
- Herbert S. (1976) “Administrative Behavior“ (3rd ed.), New York: The Free Press
- Hoeksema E. (2000) „Applying Bayesian Belief Networks for a shopping assisnant
web site“
- Jacoby J., Berning C.K., Dietvorst T. F. (1977) „What about desposition“, Journal of
Marketing 41:23
- Jaynes E. T. (1995) „Probability Theroy: The Logic of Science“, Washington
university
- Javor P. (1988) „Uvod u matematičku analizu“, Školska knjiga Zagreb
- Jensen F.V., Nielsen T.D. (2007) „Bayesian networks and decision graphs“, Springer,
Information science and statistics series
- Jensen F., Kjaerulff U.B., Lang M., Madsen A.L. (2005) „Hugin – the tool for
Bayesian networks and influence diagrams“
- Kenny D.A. (1979) „Correlation and casuality“, Wiley
- Kesić T. (1999) "Ponašanje potrošača", Adeco
- Klepac G. (2004) „Otkrivanje zakonitosti temeljem jedinstvenog modela
transformacije vremenske serije“, doktorska disertacija, FOI Varaždin
141
- Klepac G. (2001) „Primjena inteligentnih računalniih metoda u managementu“,
Sinergija
- Klepac G., Mršić L. (2006) „Poslovna inteligencija kroz poslovne slučajeve“, Tim
press/Lider Press
- Keogh E. J., Pazzani M. J. (1998) „An enhanced representation of time seried which
allows fast and accurate classification, clustering and relevance feedback“, American
associoatin for artificial intelligence
- Kolmogorov N. (1950) „Foundations oft he Theory of Probalility“, Chelsea, New
York, (originalno objavljeno kao “Grundbegriffe def Wahrscheinlichkeitsrechnung“,
Springer, Berlin, 1933.)
- Kuo R. J., Xue K. C. (1998) „A decision support system for sales forecasting through
fuzzy neural network with asymmetric fuzzy weights“, Decision support systems No.
24
- Larouse D.T. (2006) „Data mining methods and models“, Wiley
- Larouse D.T. (2005) „Discovering knowledge in data“, Wiley
- Lee H. L., Sasser M. M. (1995) „Product universality and design for supply chain
management“, Production planning and control 6(3)
- Lindstrom M. (2010a) „Brand sense: Sensory Secrets Behind the Stuff We Buy“,
FreePress
- Lindstrom M. (2010b) „Buyology: Truth and Lies About Why We Buy“, Crown
Business
- Moral S. (2003) „Strutural learning: the PC algorithm“, University of Granada Spain
- Mršić L. (2005) „Primjena metoda rudarenja podataka u trgovini tekstilnim i srodnim
proizvodima“, magistarski rad, Ekonomski fakultet Zagreb
- Mršić L. (2008) "Program vjernosti/nagrađivanja kupaca Lantea Grupa
PremiumClub", zbornik 13.HrOUG konferencija, Rovinj 14.-18. listopada 2008.
- Neapolitan R. (2004) „Learning Bayesian networks“, Pearson Prantice Hall
- Nierop E., Fok D., Franses P. H. (2002) „Sales model for many item using attribute
data“, Erasmus Research Institute of Management (ERIM) Rotterdam
- Nisbet R., Elder J., Miner G. (2009) „Statistical analysis and dana mining
applications“, Elsevier
- Panian Ž., Klepac G. (2003) "Poslovna inteligencija", Masmedia
- Panian Ž. (2003) "Odnosi s klijentima u e-poslovanju", Sinergija
142
- Panian Ž. i suradnici (2007) „Poslovna inteligencija, studije slučajeva iz hrvatske
prakse“, Narodne novine
- Pearl J. (2000) „Causality: Models, reasoning, and inference“, New York Cambridge
University Press
- Petz B. (2007) „Osnovne statističke metode za nematematičare“, Naklada Slap
- Pyle D. (2003) „Business modelling and dana mining“, Morgan Kaufmann
- Pyle D. (1999) „Data preparation for data mining“, Morgan Kaufmann publishers, Inc
- Ramya N., Pradeep C. (1999) „A Bayesian Model to Forecast New Product
Performance in Domestic and International Markets“ Marketing Science/Vol. 18, No.
2
- Rossi P. E., Allenby G. M. (2003) „Bayesian Statistics and Marketing“, Marketing
science Vol. 22 No. 3
- Saul L., Jaakkola T., Jordan M. (1996) „Mean field theory for sigmoid belief
networks“, Journal of artificial intelligence research, 4:61-76
- Silvaa R.V., Daviesa G., Naude´b P. (2002) "Assessing customer orientation in the
context of buyer/supplier relationships using judgmental modelling", Industrial
Marketing Management 31
- Solomon M.R., Rabolt N. J. (2004) "Consumer Bahavior in Fashion", Prentice Hall
- Sontag S., Drew C. (2008) „Blind man's bluff“, New York Public affairs
- Spiegelhalter D., Lauritzen S. (1990) „Sequential updating of conditional probabilities
on directed graphical structure“ 20:579-605
- Spirtes P., Glymour C., Scheines R. (2000) „Causation, Prediction and Search“, MIT
- Steck H. (2001) „Constrained based structural learning in Bayesian networks using
finite dana sets“, doktorska disertacija
- Stewart I. (1997) „Does God plays dice? – The new mathematics of chaos“, Penguin
books
- Suppes, P. (1970) "A probabilistic theory of causality"Amsterdam: North-Holland
- Surowiecki J. (2007) „Mudorst masa“, Profil
- Swoyer C. (2002) „Critical Reasoning: A User’s Manual“,
http://www.ou.edu/ouphil/chris.html
- Šošić, I. i Serdar, V. (2002) “Uvod u statistiku“, Školska knjiga, Zagreb
143
- Thomassey S., Happiette M., Castelain J.M. (2005) „A global forecasting support
adapted to textile distribution“, Elsevier, Sceince direct, International journal
Prduction Economics 96
- Yuan C., Lu T.C., Druzdel M.J. (2004) „Annealed MAP“, AUAI Press
- Vakula Z. (2008) „Some social-benefit case studies from Croatia“, WMO Training
Workshop on the Assessment of Socio-economic Benefits of Meteorological and
Hydrological Services, Sofia, Bugarska, 15-17 September
- Vakula Z. (2009) „Business Planning & Weather: Case in Point from Croatia“,
Weather and Society Watch, Vol 3, Number 3, 30 April, USA,
http://www.sip.ucar.edu/news/previous.php#Volume4
- Van Lith P.F., Betlem B.H.L., Roffel B. (2000) „Fuzzy clustering, genetic algorythms
and neuro fuzzy methods compared for hybrid fuzzy first principles modeling“, ISIAC
2000
- Vercellis C. (2009) „Business intelligence: Dana mining and optimization for decision
making“, Wiley
- Wang C.L., Hui A., Siu M. (2002) "Consumer decision-making styles on domestic
and imported brand clothing", http://www.emeraldinsight.com/0309-0566.htm
- Westphal C., Blaxton T. (1998) „Data mining solutions –methods and tools for
solving real world problems“, Wiley
- Williams J.G., Weiqiang L., Mehmut O. (2002) „Mining Temporal Patterns from
Health Care Data“ , Proceedings of the 4th International Conference on Data
Warehousing and Knowledge Discovery (DaWaK02) Lecture Notes in Computer
Science, Vol 2454, Springer, 2002 Pages 221-231, ISBN 3-540-44123-9
- Zhang C., Sun C., Yu G. (2004) „A Bayesian Network Approach to Time Series
Forecasting of Short-Term Traffic Flows“, 2004 IEEE Intelligent Transportation
Systems Conference Washington, D.C., USA, October 3-6
Publikacije i časopisi
- Časopis Banka, godina XVII, broj 7., srpanj 2011. stranica 14-17, intervju dr. Dani
Rodrik „Velika avantura“
- Časopis Suvremena trgovina, V36, broj 1., siječanj-veljača 2011., str 48-51,
prof.dr.sc. Zvonimir Pavlek „Kuda ide trgovina u novom desetljeću?“
- Godin S., „Loš stol“, Magazin Livingstone, br. 26, lipanj 2008, str. 72-73
- Poslovni dnevnik, „Marketing: Važne rodne razlike“, 22.-23.08.2008., str. 16
144
- Pavlek Z. „Zadvoljni, lojalni i oduševljani kupci“, Suvremena trgovina, 1(34), 2009.,
str. 24-27
Internet mjesta
- http://www.ai.mit.edu/~murphyk/Bayes/bnintro.html, 10.10.2004.
- http://www.cs.berkeley.edu/~murphyk/Bayes/bayes.html, "A Brief Introduction to
Graphical Models and Bayesian Networks", 02.11.2004.
- http://www.investitor.org/kako_odabrati_kanal_prodaje.php, 18.07.2011.
- http://www.ncdc.noaa.gov/cmb-faq/anomalies.php; 01.07.2011.
- http://www.djindexes.com/ 01.07.2011.
- http://stockcharts.com/freecharts/historical/djia2000.html; 01.07.2011.
- http://www.dhmz.hr; 01.07.2011.
- http://news.com.com/Behind+the+numbers/2009-1017_3-252162.html, 20.10.2004.
- http://instruct1.cit.cornell.edu/courses/cuttingedge/lifeCycle/03.htm, 01.07.2011.
- http://www.abercrombie.com/, 10.07.2011.
- http://www.evancarmichael.com/Marketing/3973/The-Pro--Con-of-Groupon.html,
20.07.2011.
- http://www.hotelnewsnow.com/Articles.aspx/6068/10-tips-for-retaining-loyal-guests,
10.07.2011.
- http://www.weatherzone.com.au/help/article.jsp?id=59, 20.07.2011.
- http://www.groupon.com/, 01.07.2011
- http://instruct1.cit.cornell.edu/courses/cuttingedge/lifeCycle/10.htm, 01.07.2011.,
originalno Kotler P.
- http://hr.kolektiva.net/, 01.07.2011.
- Izvor: ranije portal kakoprodavati.com danas Facebook grupa kakoprodavati.com,
01.07.2011.
- http://www.gfk.hr/public_relations/press/press_articles/006398/index.hr.html;
10.07.2011.
- http://www.esomar.org/; 15.07.2011.
- http://www.martinlindstrom.com/index.php/cmsid__buyology_TIME100; 15.07.2011.
- http://www.accuweather.com; 10.08.2011.
- http://fashion.ebay.com/; 10.08.2011.
- http://ebay.about.com/od/sellingeffectivel1/qt/se_sellclothing.htm; 10.08.2011.
- http://en.wikipedia.org/wiki/Herbert_Simon; 10.08.2011.
145
- http://nobelprize.org/nobel_prizes/economics/laureates/1978/; 10.08.2011.
- http://www.mcarthurglen.com/; 15.08.2011.
- http://www.abercrombie.com/; 01.10.2011.
Video materijali
- Sony Pictures (2010) „Inside Job“; http://www.imdb.com/title/tt1645089/ 01.07.2011.
Ostali materijali
- Tepeš B. (2008) kolegij „Statistički modeli na grafovima“, materijali s predavanja,
FFZG
Alati
- Hugin, http://www.hugin.com/, 10.07.2011.
- SPSS Statistics, http://www-01.ibm.com/software/analytics/spss/products/statistics/,
10.07.2011
- Orange for Python, http://orange.biolab.si/, 10.07.2011.
- Oracle baza podataka, http://www.oracle.com/us/products/database/index.html,
10.07.2011.
- GeNIe & Smile, http://genie.sis.pitt.edu/, 01.07.2011.
- T.O.A.D., http://www.quest.com/toad/, 10.07.2011.
- Tableau, http://www.tableau.com/, 10.08.2011.
146
PRILOZI
Prilog 1. Državni hidrometeorološki zavod, klimatološki mjesečni izvještaj REPUBLIKA HRVATSKA DRZAVNI HIDROMETEOROLOSKI ZAVOD - Zagreb KLIMATOLOSKO-METEOROLOSKI SEKTOR K L I M A T O L O S K I M J E S E C N I I Z V J E S T A J -------------------------------------------------------------------------------- | D| ZAGREB MAKSIMIR Hs = 123 m Mjesec : 1 Godina : 2005 | |---------------------------------------------------------------------------- | a|tx(oC)|tn(oC)| tx-tn| Temperatura zraka (oC) |Temperatura mokrog ter.(oC) | | | | (oC) | | | n| 21-21| 21-21| 21-21| 7 | 14 | 21 | Sred.| 7 | 14 | 21 | Sred. |--|------|------|------|------|------|------|------|------|------|------|------ | 1| -0.3| -8.6| 8.3| -7.9| -0.3| -2.0| -3.0|L -7.9| -1.5|L -2.2| -3.4 | 2| 0.0| -2.6| 2.6| -1.9| -0.5| -0.5| -0.8|L -2.1| -0.8| -0.6| -1.0 | 3| 5.1| -2.4| 7.5| -1.2| 4.8| -1.4| 0.2|L -1.2| 2.5|L -1.7| -0.5 | 4| -1.3| -6.0| 4.7| -5.2| -1.8| -2.9| -3.2|L -5.2|L -1.8|L -2.9| -3.2 | 5| -1.5| -4.1| 2.6| -3.2| -1.8| -2.6| -2.6|L -3.2|L -1.8|L -2.6| -2.6 | 6| -2.4| -4.5| 2.1| -3.8| -2.7| -3.4| -3.3|L -3.8|L -2.7|L -3.3| -3.3 | 7| -2.3| -4.4| 2.1| -3.8| -3.0| -3.1| -3.2|L -3.8|L -3.0|L -3.1| -3.2 | 8| -2.0| -4.2| 2.2| -3.0| -2.2| -2.7| -2.6|L -3.0|L -2.2|L -2.7| -2.6 | 9| -2.3| -4.4| 2.1| -3.8| -2.7| -2.7| -3.0|L -3.9|L -2.9|L -2.9| -3.2 |10| 0.2| -3.1| 3.3| -2.2| 0.1| -0.4| -0.7|L -2.3|L -0.7| -0.6| -1.0 |--|------|------|------|------|------|------|------|------|------|------|------ |Ds| -6.8| -44.3| 37.5| -36.0| -10.1| -21.7| -22.2| -36.4| -14.9| -22.6| -24.0 |--|------|------|------|------|------|------|------|------|------|------|------ |11| 2.4| -0.9| 3.3| -0.3| 2.3| -0.2| 0.4| -0.5| 0.5| -1.0| -0.5 |12| 1.0| -2.0| 3.0| -0.8| 0.9| -1.9| -0.9|L -1.4| -0.4|L -2.6| -1.8 |13| 0.5| -3.7| 4.2| -1.9| 0.5| -0.8| -0.8|L -2.1| -1.0|L -1.3| -1.4 |14| 1.4| -1.5| 2.9| -0.7| 1.2| -0.1| 0.1|L -0.9| 0.2| -0.5| -0.4 |15| 0.7| -0.8|N 1.5| -0.6| 0.6| -0.2| -0.1| -0.8| -0.6| -1.0| -0.8 |16| 2.5| -4.6| 7.1| -4.0| 2.3| -3.2| -2.0|L -4.1| -0.5|L -3.7| -3.0 |17| 1.1| -7.0| 8.1| -4.5| 0.3| -2.2| -2.2|L -4.7|L -1.3|L -2.7| -2.8 |18| 11.6| -4.7| 16.3| -3.2| 8.2| 2.2| 2.4|L -3.3| 4.2| 0.9| 0.7 |19| 6.4| -3.4| 9.8| -1.2| 6.2| 0.9| 1.7|L -1.6| 1.3| -1.7| -0.9 |20| 4.5| -4.8| 9.3| -4.3| 3.6| 3.0| 1.3|L -4.9| 0.1| -0.5| -1.4 |--|------|------|------|------|------|------|------|------|------|------|------ |Ds| 32.1| -33.4| 65.5| -21.5| 26.1| -2.5| -0.1| -24.3| 2.5| -14.1| -12.3 |--|------|------|------|------|------|------|------|------|------|------|------ |21| 9.7| -0.2| 9.9| 3.6| 9.4| 1.0| 3.8| 0.8| 4.2| -0.2| 1.2 |22| 1.1| -3.6| 4.7| -2.4| -1.1| -3.6| -2.7|L -4.9|L -4.1|L -3.6| -4.0 |23| 0.5| -4.0| 4.5| -2.5| 0.3| -1.9| -1.5|L -3.2|L -2.6|L -3.0| -3.0 |24| -1.9| -8.6| 6.7| -7.0| -3.4| -7.3| -6.2|L -8.0|L -6.2|L -8.7| -7.9 |25| -2.3| -16.7| 14.4| -15.8| -2.8| -12.1| -10.7|L-15.6|L -5.2|L-12.1| -11.2 |26|N -2.8|N-18.1| 15.3|N-17.7| -4.3| -12.1|N-11.6|L-17.6|L -6.2|L-12.1| -12.0 |27| -0.6| -15.7| 15.1| -15.1| -1.6| -8.3| -8.3|L-14.8|L -4.1|L -8.3| -8.9 |28| 0.2| -14.7| 14.9| -13.5| -0.2| -8.5| -7.7|L-13.3|L -2.8|L -8.5| -8.3 |29| 5.9| -12.0|X 17.9| -10.3| 3.6| 5.8| 1.2|L-10.1| 1.0| 3.5| -0.5 |30| 13.3|X 2.5| 10.8| 7.4| 12.5| 2.5| 6.2| 4.7| 7.2| 2.1| 4.0 |31|X 15.0| 0.1| 14.9| 4.5|X 14.7| 10.9|X 10.2| 3.8| 9.3| 7.9| 7.2 |--|------|------|------|------|------|------|------|------|------|------|------ |Ds| 38.1| -91.0| 129.1| -68.8| 27.1| -33.6| -27.3| -78.2| -9.5| -43.0| -43.4 |S3| 3.5| -8.3| 11.7| -6.3| 2.5| -3.1| -2.5| -7.1| -0.9| -3.9| -3.9 |--|------|------|------|------|------|------|------|------|------|------|------ |Ms| 63.4|-168.7| 232.1|-126.3| 43.1| -57.8| -49.6|-138.9| -21.9| -79.7| -79.7 |Sr| 2.0| -5.4| 7.5| -4.1| 1.4| -1.9| -1.6| -4.5| -0.7| -2.6| -2.6 |Sd| 4.7| 5.0| 5.1| 5.5| 4.6| 4.6| 4.4| 5.1| 3.4| 4.0| 3.9 -------------------------------------------------------------------------------- | tx Nd| tn Nd| |Dnevni srednjak t Nd| |------|--|-------|--| |-----------------|--| | < 0.0|11|=<-10.0| 5| | <=-20.0 | 0| |=>25.0| 0| < 0.0|29| |od-19.9 do -15.0 | 0| |=>30.0| 0|=> 20.0| 0| |od-14.9 do -10.0 | 2| ---------------------- |od -9.9 do -5.0 | 3| |od -4.9 do 0.0 |16| |od 0.1 do 5.0 | 8| |od 5.1 do 10.0 | 1| |od 10.1 do 15.0 | 1| |od 15.1 do 20.0 | 0| |od 20.1 do 25.0 | 0| |od 25.1 do 30.0 | 0| | > 30.0 | 0| ----------------------
147
-------------------------------------------------------------------------------- | D| ZAGREB MAKSIMIR Mjesec : 9 Godina : 2005 | | |---------------------------------------------------------------------------| | a| tn5cm| Tlak zraka (hPa) | | R(mm) | S | Sn| E | VV | | | (oC) | | SS(h)| | | | 14 | 14 | | n| 7 | 7 | 14 | 21 | Sred. | | 7-7 |O| cm | cm|7 21|7 21| |--|------|-------|-------|-------|-------|------|------|-|----|---|-----|-----| | 1| 15.3| 1002.6| 1002.0| 1002.8| 1002.5| 8.0| | | | |1 1 1|6 6 7| | 2| 14.8| 1004.5| 1005.1| 1007.4| 1005.7| 8.8| | | | |1 1 1|6 6 6| | 3| 15.0| 1009.8| 1009.3|X1010.3|X1009.8| 6.0| | | | |1 1 1|6 8 7| | 4| 12.3|X1010.3| 1009.8| 1009.2|X1009.8| 1.4| | | | |1 1 1|8 8 8| | 5| 10.4| 1007.1| 1005.9| 1004.7| 1005.9| 8.2| | | | |1 1 1|7 8 7| | 6| 8.6| 1004.4| 1003.1| 1003.3| 1003.6| X11.1| | | | |1 1 1|8 8 7| | 7| 9.5| 1003.7| 1003.4| 1004.2| 1003.8| 10.4| | | | |1 1 1|6 8 7| | 8| 11.0| 1005.3| 1004.7| 1004.3| 1004.8| 10.8| | | | |1 1 1|7 8 8| | 9| 13.5| 1002.6| 1000.4| 999.0| 1000.7| 3.8| | | | |1 1 1|8 7 6| |10|X 17.5| 997.0| 995.8| 996.2| 996.3| 3.2| 3.8|1| | |1 1 1|5 8 7| |--|------|-------|-------|-------|-------|------|------|-|----|---|-----|-----| |Ds| 127.9|10047.3|10039.5|10041.4|10042.9| 71.7| 3.8| | | | | | |--|------|-------|-------|-------|-------|------|------|-|----|---|-----|-----| |11| 14.0| 996.0| 995.2| 996.0| 995.7| 9.3| 0.1|1| | |1 1 1|6 8 8| |12| 14.5| 997.1| 998.6| 1000.8| 998.8| X11.1| | | | |1 0 0|8 9 8| |13| 10.5| 1004.6| 1005.3| 1006.1| 1005.3| 8.1| | | | |0 0 0|7 8 8| |14| 15.0| 1007.5| 1005.8| 1005.2| 1006.2| 4.7| 6.6|1| | |2 1 1|7 8 8| |15| 9.8| 1005.0| 1002.5| 1000.7| 1002.7| 8.8| | | | |1 1 0|7 8 8| |16| 9.8| 995.8| 991.6|N 989.6|N 992.3| 9.1| | | | |0 0 0|7 8 7| |17| 12.5| 991.2| 995.7| 999.7| 995.5| 0.6| | | | |0 0 1|7 7 7| |18| 9.6| 1002.7| 1005.2| 1006.6| 1004.8| 0.0| 2.9|1| | |2 2 2|7 6 6| |19| 9.2| 1005.3| 1005.6| 1005.3| 1005.4| 0.0| 20.2|1| | |2 2 2|6 8 7| |20| 10.2| 1003.2| 1004.1| 1005.4| 1004.2| 0.0| 4.3|1| | |2 2 2|6 7 7| |--|------|-------|-------|-------|-------|------|------|-|----|---|-----|-----| |Ds| 115.1|10008.4|10009.6|10015.4|10010.9| 51.7| 34.1| | | | | | |--|------|-------|-------|-------|-------|------|------|-|----|---|-----|-----| |21| 9.6| 1005.5| 1006.2| 1006.4| 1006.0| 0.0| 0.5|1| | |1 1 1|7 7 7| |22| 11.9| 1005.7| 1005.9| 1005.9| 1005.8| 0.0| 0.4|1| | |1 1 1|7 6 7| |23| 7.7| 1004.9| 1004.2| 1004.4| 1004.5| 3.3| 0.0|9| | |1 1 1|6 8 8| |24| 8.0| 1004.0| 1003.9| 1003.8| 1003.9| 4.6| | | | |1 1 1|6 7 6| |25|N 6.8| 1003.2| 1002.1| 1003.6| 1003.0| 8.2| | | | |1 1 1|6 7 7| |26| 7.8| 1005.4| 1006.6| 1007.6| 1006.5| 7.9| | | | |1 1 1|6 6 6| |27|N 6.8| 1008.1| 1006.8| 1006.8| 1007.2| 2.4| | | | |1 1 1|5 6 5| |28| 14.2| 1007.1| 1007.2| 1007.0| 1007.1| 0.1| 4.1|1| | |2 1 1|6 6 6| |29| 8.2| 1004.2| 1001.7| 1003.1| 1003.0| 0.0| | | | |1 2 2|2 5 7| |30| 7.5| 1004.6| 1005.7| 1007.6| 1006.0| 6.4|X 24.9|1| | |2 2 2|3 8 7| |--|------|-------|-------|-------|-------|------|------|-|----|---|-----|-----| |Ds| 88.5|10052.7|10050.3|10056.2|10053.0| 32.9| 29.9| | | | | | |--|------|-------|-------|-------|-------|------|------|-|----|---|-----|-----| |S3| 8.9|1005.3 |1005.0 |1005.6 |1005.3 | 3.3| | | | | | | |--|------|-------|-------|-------|-------|------|------|-|----|---|-----|-----| |Ms| 331.5|30108.4|30099.4|30113.0|30106.8| 156.3| 67.8| | | | | | |Sr| 11.1| 1003.6| 1003.3| 1003.8| 1003.6| 5.2| | | | | | | |Sd| 2.9| 4.2| 4.2| 4.3| 4.1| 4.0| | | | | | | -------------------------------------------------------------------------------- |Nd(SS=0.0)= 6 | | Broj dana sa | ----------------------- ---------------- |snijegom>=1cm | | Cestina vidljivosti | | Mjesecni intenzitet | | | <0.05 <1 <10 >=50| | oborine = 6.8 mm/dan | 0 | |--|-----|---|---|----| -------------------------------------------------- | 7| 0 | 2 |16 | 0 | |R>=0.1mm od oblika Nd| R(mm) Nd | Sadrzaj vode | |14| 0 | 0 | 8 | 1 | |------------------|--|-------|---| od snijega | |21| 0 | 0 | 7 | 0 | |tekucih,mjesovitih|10|>= 0.1 |10 | dan mm/cm | |Nd| 0 | 2 |19 | 1 | |krutih,mjesovitih | 0|>= 0.5 | 8 |-----|--------| ----------------------- |mjesovitih | 0|>= 1.0 | 7 | 5 | . | ----------------------|>= 5.0 | 3 | 10 | . | |>=10.0 | 2 | 15 | . | |>=20.0 | 2 | 20 | . | |>=50.0 | 0 | 25 | . | ------------| 30 | . | ----------------
148
-------------------------------------------------------------------------------- | D| ZAGREB MAKSIMIR Mjesec : 1 Godina : 2005 | | |---------------------------------------------------------------------------| | a| Tlak vodene pare (hPa)|Relativna vlaga ( % )| Naoblaka ( 0-10 ) s pojavama| | | | | | | n| 7 | 14 | 21 |Sred.| 7 | 14 | 21 | Sred.| 7 | 14 | 21 |Sred.| |--|-----|-----|-----|-----|----|----|----|------|-------|-------|-------|-----| | 1| 5.6| 5.9| 5.3| 5.6| 93| 77| 96| 89 | 9| 4 | 9| | 0| 4 | 6.0| | 2| 4.2| 7.2| 6.7| 6.0| 96| 60| 86| 81 | 4| 4 | 4| 2| 10| | 6.0| | 3| 5.8| 6.5| 5.6| 6.0| 93| 63| 74| 77 | 4| | 3| 2| 0| | 2.3| | 4| 5.8| 5.2| 6.0| 5.7| 90| 44| 64|N 66 | 10| | 9| | 9| | 9.3| | 5| 4.9| 5.6| 5.4| 5.3| 92| 45| 87| 75 | 2| 4 | 3| 2| 0| 4 | 1.7| | 6| 5.5| 6.7| 6.0| 6.1| 83| 48| 93| 75 | 9| 4 | 4| 2| 0| 4 | 4.3| | 7| 5.5| 6.8| 6.3| 6.2| 94| 58| 90| 81 | 0| 4 | 4| 2| 0| | 1.3| | 8| 5.4| 5.4| 7.1| 6.0| 94|N 32| 73|N 66 | 0| 4 | 0| 2| 0| | 0.0| | 9| 7.4| 7.9| 7.0|X 7.4| 66| 55| 94| 72 | 7| | 8| | 0| 3 | 5.0| |10| 5.5|X 8.1| 6.4| 6.7| 97| 65| 95| 86 | 3| 4 | 0| 2| 0| 4 | 1.0| |--|-----|-----|-----|-----|----|----|----|------|-------|-------|-------|-----| |Ds| 55.6| 65.3| 61.8| 61.0| 898| 547| 852| 768 | 48 | 44 | 19 | 36.9| |--|-----|-----|-----|-----|----|----|----|------|-------|-------|-------|-----| |11| 4.9| 7.6| 5.8| 6.1| 98| 82| 96| 92 | 10| 40| 5| 2| 0| | 5.0| |12| 4.6| 6.6| 5.2| 5.5| 95| 95|X100|X 97 | 0|94 | 1|9 2| 10| 40| 3.7| |13| 4.5| 5.4| 6.2| 5.4| 98| 99| 95|X 97 | 10| 40| 10| 40| 10|2 0| 10.0| |14| 6.0| 7.0| 5.5| 6.2| 98| 85| 93| 92 | 10| | 4| 2| 0| 4 | 4.7| |15| 4.2| 4.8| 4.6| 4.5| 94| 49| 76| 73 | 0| 4 | 3| 2| 0| 4 | 1.0| |16| 4.2| 3.9| 4.2| 4.1| 75| 50| 82| 69 | 0| 4 | 3| 2| 0| 4 | 1.0| |17| 3.4| 3.7| 4.1| 3.7| 92| 53| 88| 78 | 0| 4 | 0| 2| 0| 4 | 0.0| |18| 3.4| 4.5| 4.4| 4.1| 96| 71| 96| 88 | 0| 4 | 6| 2| 10| 4 | 5.3| |19| 5.4| 4.9| 5.2| 5.2| 92| 71| 96| 86 | 10| | 9| 2| 9| | 9.3| |20| 3.6| 5.5| 5.0| 4.7| 94| 85| 65| 81 | 10| 0| 10| | 10| | 10.0| |--|-----|-----|-----|-----|----|----|----|------|-------|-------|-------|-----| |Ds| 44.2| 53.9| 50.2| 49.5| 932| 740| 887| 853 | 50 | 51 | 49 | 50.0| |--|-----|-----|-----|-----|----|----|----|------|-------|-------|-------|-----| |21| 5.6| 6.4| 5.4| 5.8| 61| 52| 88| 67 | 5| | 7| 2| 0| 4 | 4.0| |22| 4.5| 4.4| 4.4| 4.4| 96| 36| 79| 70 | 1| 4 | 4| 2| 0| 4 | 1.7| |23| 4.3| 3.3| 4.1| 3.9| 87| 33| 77|N 66 | 7| 4 | 8| | 2| 4 | 5.7| |24| 4.6| 5.9| 5.6| 5.4| 77| 95| 94| 89 | 10| 4 | 10|6 | 10|6 | 10.0| |25| 4.8| 4.1| 3.5| 4.1| 86| 69| 66| 74 | 10|6 | 10| | 10| | 10.0| |26| 3.8| 4.1| 3.3| 3.7| 75| 76| 66| 72 | 10|6 | 10|6 | 8| | 9.3| |27| 2.9| 3.6| 2.9| 3.1| 57| 67| 74|N 66 | 10| | 10| | 9| | 9.7| |28| 3.0| 3.0| 2.8| 2.9| 82| 67| 66| 72 | 10| | 10| | 10| | 10.0| |29| 3.3| 3.4| 2.7| 3.1| 89| 68| 61| 73 | 10|6 | 10| | 0| | 6.7| |30|N 1.8| 2.5| 2.3|N 2.2| 87| 46| 87| 73 | 0| | 5| 2| 0| | 1.7| |31| 2.3| 3.2| 3.9| 3.1| 89| 52| 65| 69 | 10| | 9| | 7| | 8.7| |--|-----|-----|-----|-----|----|----|----|------|-------|-------|-------|-----| |Ds| 40.9| 43.9| 40.9| 41.7| 886| 661| 823| 791 | 83 | 93 | 56 | 77.5| |S3| 3.7| 4.0| 3.7| 3.8| 81| 60| 75| 72 | 7.5 | 8.5 | 5.1 | 7.0| |--|-----|-----|-----|-----|----|----|----|------|-------|-------|-------|-----| |Ms|140.7|163.1|152.9|152.2|2716|1948|2562|2412 |181 |188 |124 |164.4| |Sr| 4.5| 5.3| 4.9| 4.9| 88| 63| 83| 78 | 5.8 | 6.1 | 4.0 | 5.3| |Sd| 1.2| 1.5| 1.3| 1.3|10.7|17.8|12.1| 9.4 | | | | | -------------------------------------------------------------------------------- |Broj dana sa relativnom vlagom|Cestina stupnjeva naoblake | Broj termina s | |------------------------------|---------------------------|-------------------| |bar u jednom od termina| u 14 |sat/st.|0- 2|3- 7|8-10|Suma|kisom,........ | 1| |-----------------------|------|-------|----|----|----|----|----------------|--| |= ili < 30%|= ili < 50%|=> 80%| 07 | 10 | 6 | 15 | 31 |snijegom,.... | 6| |-----------|-----------|------|-------|----|----|----|----|----------------|--| | 0 | 9 | 6 | 14 | 4 | 13 | 14 | 31 |sugradicom,... | 0| -------------------------------|-------|----|----|----|----|----------------|--| | Broj dana sa| 21 | 18 | 1 | 12 | 31 |maglama | 8| |sr. naoblakom|-------|----|----|----|----|----------------|--| |-------------| Suma | 32 | 20 | 41 | 93 |sijanjem Sunca |18| | <2.0 | >8.0 |---------------------------|----------------|--| |------|------| |Suncem i naob.>5| 3| | 9 | 10 | |----------------|--| --------------- |grmljavinom,....| 0| ---------------------
149
Prilog 2. Državni hidrometeorološki zavod, minimalne temperature
1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 Datum
-0.8 -9.4 0.2 -3.2 -8.6 -2.9 -7.4 -1.4 2.4 -1.9 -0.2 -0.5 101
-0.4 -6.6 7.8 -2.9 -2.6 -1.8 -5.5 -1.6 -0.7 -4.5 1.2 2.0 102
-3.0 -5.4 2.5 -0.5 -2.4 3.1 -6.7 4.0 -3.5 -0.4 0.5 -1.8 103
-7.3 -2.6 2.0 0.2 -6.0 1.8 -11.8 1.6 -6.2 -1.6 0.1 -2.3 104
-7.3 -1.4 0.3 -0.4 -4.1 5.4 -11.2 -2.8 -8.7 -2.1 0.7 0.4 105
-7.3 0.3 -0.6 -2.7 -4.5 8.0 -6.8 -4.2 -7.0 -2.8 0.7 0.7 106
-3.3 -1.8 2.4 -4.0 -4.4 6.0 -7.7 -5.3 -7.4 -1.1 0.2 4.8 107
-0.6 -1.8 2.7 3.7 -4.2 6.3 -6.0 -14.8 -6.4 -1.9 0.8 1.2 108
0.3 -1.2 1.8 1.7 -4.4 1.7 -6.9 -8.4 -0.7 2.9 -3.7 1.5 109
0.0 -0.2 -1.2 -2.6 -3.1 0.1 -7.1 -11.6 0.1 -1.5 -8.0 8.6 110
0.3 0.2 -2.8 0.5 -0.9 5.7 -2.8 -14.0 -1.5 -3.1 -6.4 9.6 111
0.7 0.5 -4.4 -1.6 -2.0 0.9 -2.7 -14.9 -1.5 -4.1 -3.7 3.0 112
0.0 0.2 -0.4 1.6 -3.7 -1.5 -2.8 -17.8 3.1 -4.4 -1.9 0.4 113
1.5 0.8 4.0 -3.1 -1.5 -1.6 -3.0 -8.4 6.1 -0.4 -2.6 -1.2 114
1.3 1.3 4.1 -0.8 -0.8 -2.9 -3.8 -9.8 1.0 -4.6 -2.3 0.7 115
-3.4 -0.5 1.6 -2.5 -4.6 -2.3 -3.8 -10.5 -2.1 -3.4 -2.9 -2.6 116
-4.0 -2.0 0.7 1.5 -7.0 -2.2 -6.3 -3.8 3.2 -6.8 -6.9 3.5 117
-5.4 -3.0 -2.2 0.6 -4.7 -1.9 -2.4 -5.4 -0.9 -7.8 -0.4 6.2 118
-3.2 -4.5 -1.6 -0.8 -3.4 -1.4 -6.6 -4.9 1.2 -4.1 -1.9 6.9 119
-2.4 -1.5 4.2 -0.7 -4.8 -2.7 -4.9 -4.8 0.3 -6.9 -5.7 2.0 120
-3.8 1.2 2.3 -0.8 -0.2 -1.4 -5.7 -4.7 -2.7 0.1 -3.5 3.5 121
-1.8 0.8 1.9 -0.8 -3.6 -1.1 3.4 -0.9 -6.0 -4.5 -4.7 5.0 122
-4.2 0.3 2.4 -1.5 -3.6 -0.3 1.7 1.2 -9.9 -3.6 -11.1 4.5 123
-4.1 -0.4 -0.4 -2.4 -8.6 0.4 5.5 0.0 -11.4 -2.1 -10.1 3.5 124
-5.4 0.6 -0.1 -3.0 -16.7 6.2 2.9 3.0 -11.1 -1.9 -14.2 -1.7 125
-5.6 -0.6 -2.3 -3.4 -18.1 8.3 1.5 2.1 -5.1 -3.5 -13.1 -3.4 126
-2.8 -1.7 -3.9 -2.0 -15.7 4.0 3.8 -1.4 -2.3 -6.5 -10.5 -6.3 127
-1.2 -2.2 -6.2 -1.4 -14.7 3.4 5.7 -0.4 -1.8 -7.5 -7.6 -3.6 128
-2.2 -3.8 -6.0 -1.9 -12.0 2.7 0.3 -0.1 -8.9 -7.1 -5.0 3.0 129
-2.2 -1.9 -4.9 -5.6 2.5 1.6 0.4 -3.4 -11.3 -14.4 -2.6 -1.5 130
-7.9 -3.5 -5.7 -4.6 0.1 0.6 4.5 -1.6 -10.0 -15.8 -5.9 -1.4 131
-10.4 -3.5 -5.5 -5.9 -0.2 0.7 2.8 -3.8 2.4 -2.6 -3.8 2.3 201
-5.7 -3.0 -6.6 -2.8 5.5 -3.9 -1.3 -9.2 -0.5 -6.4 -5.6 -2.7 202
-1.7 -5.0 -8.3 0.0 3.7 -4.1 -0.8 -9.6 -0.3 -0.2 -4.5 -1.0 203
-0.1 -4.6 -1.5 0.4 -1.5 2.5 -3.8 -3.5 1.3 -3.4 -5.0 -2.1 204
-7.1 -1.1 -3.1 -1.2 -2.3 6.8 -1.6 -2.6 -0.1 -8.6 -7.0 -3.5 205
-8.0 2.8 -7.1 -0.8 1.6 1.8 2.3 -4.8 0.4 -11.9 -11.0 2.2 206
-5.3 -0.8 -4.9 -3.4 0.3 9.4 6.3 -7.0 7.4 -14.5 -12.6 5.6 207
-5.6 -1.0 -3.6 -1.4 3.9 10.6 3.8 -6.9 3.6 -15.5 -4.5 2.4 208
-9.7 0.4 -5.7 -4.6 3.8 4.3 0.9 -6.8 1.6 -17.6 -0.8 5.6 209
-12.2 -0.3 -1.8 -2.7 -2.8 6.7 3.0 -2.2 -1.4 -17.8 -4.1 1.3 210
-7.8 2.0 -2.6 -3.8 -3.1 1.7 -1.5 -1.5 -2.5 -7.1 -3.1 2.9 211
-3.6 6.1 -1.8 -4.2 -3.1 -2.4 7.8 -2.6 -3.9 -1.2 -4.8 2.2 212
-2.5 7.3 1.5 -6.4 -0.6 0.2 4.4 -5.2 -4.7 0.0 -5.8 4.7 213
-2.5 1.7 2.3 -3.2 0.4 2.0 2.6 -8.5 -1.0 -1.0 -5.0 0.3 214
-4.5 -1.7 -2.0 -6.4 -3.2 2.0 2.7 -9.3 -4.1 -2.6 -1.0 3.6 218
* mjerna postaja Maksimir Zagreb, 07:00h ujutro, period od 1948. do 2007., uzorak
150
Prilog 3. Državni hidrometeorološki zavod, maksimalne temperature
1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 Datum 1.2 -6.9 14.5 -1 -0.3 -0.3 1 3.5 5.1 4.2 3.6 3 101
1.5 -5 13.2 0.5 0 10 5.4 10.8 2.6 10.8 3.5 2.9 102
0 -2 10.5 1.7 5.1 11.5 0.5 16.3 -0.4 7.8 3.6 3.5 103
2 -0.5 11.7 1.8 -1.3 8.4 -1.9 15.7 -2.8 10.7 3.5 3.4 104
0.5 0.8 10.6 7 -1.5 8.1 -0.4 6.8 0.2 10.5 2.1 1.9 105
-1 1.8 14 5.7 -2.4 15.5 5.8 0.5 0.2 12.7 3.5 2.7 106
-0.1 1.2 12.5 13.8 -2.3 19.4 5.7 -2.5 1 10.5 2.9 1.7 107
1.8 -0.3 15 9 -2 14 3.2 -4.6 4.2 15.6 2.7 0.5 108
2.7 0.9 11.1 4.7 -2.3 10.3 4.5 -4.6 0.8 13 1.2 0.7 109
7.2 0.7 10.9 2.1 0.2 12.5 0 -4.8 2.2 11.6 0.9 0.4 110
6.9 2 8.8 2.7 2.4 13.6 -1.3 -1.4 1.5 6.9 -0.7 0.6 111
11.6 1.4 8.3 8.2 1 8 -1.5 -4 9.9 4 1.4 1.1 112
5.5 1.8 11.6 8.3 0.5 2 -1.3 -4.5 10.5 0.9 0.2 0.4 113
3.4 3.1 13.6 8 1.4 1 -1 1.1 13.8 6.7 -0.3 0.7 114
4.5 3.6 9.9 4.1 0.7 1 -2.2 2.5 6.6 6.9 1.2 1.3 115
3.6 1 6 10.7 2.5 -0.8 -1.5 9.3 7.4 5.3 0.7 1.3 116
-1.9 -0.7 8.6 13.5 1.1 0.1 -2.1 7 12.5 2.9 -0.1 2.2 117
-2.8 -2 8.2 8.3 11.6 4 -0.9 0.5 3.8 1.3 7.6 1.7 118
1 -1 5.7 3.7 6.4 4.3 0.5 1.7 2.7 2.4 5.7 1.5 119
-0.6 2 7 0.8 4.5 -0.8 3.5 -2.5 8 3.2 4.4 1.8 120
1.7 2.8 4.8 0.6 9.7 0.4 8.9 0 3.9 11.4 10 2.2 121
0.3 1.4 4.3 0.6 1.1 1 12.3 6.3 -0.6 10.9 6.5 3.4 122
-1 1.8 3.3 -0.3 0.5 2.9 11 3.1 0.2 7.7 -4.7 4.7 123
-2.3 1 2.6 -0.6 -1.9 6.6 10.7 4.6 0.2 1.8 -5.3 4.3 124
-3.6 1.1 2.6 -1.3 -2.3 14.3 13.4 4.6 -0.4 0 -5.9 3.7 125
-2.2 1.2 1.5 -0.9 -2.8 11.3 9.3 4.2 4.4 -1.7 -4 4.2 126
-0.2 -0.4 1.3 2 -0.6 10 11.6 6.5 0.5 -1.5 -2.7 4.6 127
0.9 0.4 0.7 2.8 0.2 8.2 16.5 9.4 0.7 -4 1.8 4.5 128
0.1 2.6 2.1 3.5 5.9 5.5 17 8.2 2.5 -2.4 3.4 4.9 129
0.8 4.4 4.8 -1.8 13.3 3.6 16.9 6.9 4.4 -0.6 4.5 4.6 130
-0.4 -0.6 1.5 -0.7 15 5 12.1 2.5 7.3 1 1.5 5.4 131
-0.8 3.8 0.7 -1 13.6 3.4 11.2 1.5 10.7 3.5 1.6 5.7 201
0.2 2.6 -0.6 0.3 13.8 4.5 14.3 -0.5 10.1 4.1 -2.2 5.5 202
5.6 2.9 3.9 8.5 13.4 4.5 9.8 -0.3 11.5 3.5 -2.8 5.2 203
2.9 3 3.2 9.5 8.6 13.6 14 2.8 13.2 2.8 -1.8 4.8 204
0.5 10 5.8 13.2 13.8 15.5 14.6 3.6 19 -0.9 -0.9 4.8 205
-2.7 7.5 7.7 10.6 17.7 16.3 13.5 5.4 16.1 -1.5 -0.9 5.5 206
-1.6 7.8 8.4 9.8 17 15.7 11 3.9 13.5 -4.8 -0.7 6.1 207
-2.4 8.6 6.2 7.2 14.8 17.5 12 1.2 13.1 -5.6 6.3 6.8 208
-0.9 10.2 8.5 3.2 11.5 14.6 10.8 1.6 11.1 -4.7 9.9 6.5 209
-1.7 11.1 13.8 2.4 9.6 11.2 11.2 0.6 6 -1.4 9.7 6.6 210
-0.6 14.4 15.7 -0.8 9.2 11.3 14.1 0.4 12.6 4.4 6.4 5.3 211
2.4 13.1 17.4 1 9.2 11.7 18.8 -0.2 1.5 9.6 5.4 5.3 212
3.2 14.1 17.3 -0.7 10.6 9.2 16 -1.5 0.8 9 4.3 5.5 213
5.7 11.5 18.2 0.1 9.5 9.4 10.6 -1 7.6 5.3 6.6 5.1 214
2.3 10 20 2.8 7.9 10.5 5.2 -0.5 6.5 3.5 8.7 4.8 215
* mjerna postaja Maksimir Zagreb, 07:00h ujutro, period od 1948. do 2007., uzorak
151
Prilog 4. Podaci o prodaji, uzorak
POS OZNAKA DATUM JEDINICA MJERE OPIS ROBE GRUPA ROBE NAMJENA ROBE SPOL NAZIV PRODAVAONICE PRODANO KOLIČINA BRUTO MARŽA
903 09.06.2007 KOM VESTA TRIKOTAZA NAMJENA OSTALO Z PRODAVAONICA 10234 122.00 3,349.81
22801 09.06.2007 KOM HLACE JOGGING TRIKOTAZA NAMJENA OSTALO M PRODAVAONICA 10234 231.00 2.959.50
3001 09.06.2007 KOM KOMPLET TRIKOTAZA NAMJENA OSTALO M PRODAVAONICA 10234 34.00 961.57
7803 09.06.2007 KOM KOMPLET DJECJI TRIKOTAZA NAMJENA OSTALO D PRODAVAONICA 10234 81.00 864.50
930 09.06.2007 KOM HLACE KRATKE TRIKOTAZA NAMJENA OSTALO M PRODAVAONICA 10111 124.00 2,211.51
28903 09.06.2007 KOM HLACE BICIKLISTICKE TRIKOTAZA NAMJENA OSTALO Z PRODAVAONICA 10111 111.00 2,116.16
1401 09.06.2007 KOM HLACE JOGGING TRIKOTAZA NAMJENA OSTALO Z PRODAVAONICA 10234 172.00 4,142.90
7301 09.06.2007 KOM HLACE JOGGING TRIKOTAZA NAMJENA OSTALO Z PRODAVAONICA 10111 132.00 2,861.52
26901 09.06.2007 KOM TRENIRKA TRIKOTAZA NAMJENA OSTALO D PRODAVAONICA 10111 151.00 2,951.15
9301 09.06.2007 KOM MAJICA KRATKI RUKAV TRIKOTAZA NAMJENA OSTALO D PRODAVAONICA 10111 135.00 6,353.10
28430 09.06.2007 KOM HLACE TRIKOTAZA NAMJENA OSTALO Z PRODAVAONICA 10111 131.00 149.52
5401 09.06.2007 KOM MAJICA KRATKI RUKAV BASIC TRIKOTAZA NAMJENA OSTALO Z PRODAVAONICA 10234 97.00 2,492.00
9301 09.06.2007 KOM HLACE BICIKLISTICKE TRIKOTAZA NAMJENA OSTALO Z PRODAVAONICA 10002 83.00 1,232.70
8501 09.06.2007 KOM MAJICA TRIKOTAZA NAMJENA OSTALO Z PRODAVAONICA 10093 171.00 4,421.90
26430 09.06.2007 KOM HLACE KRATKE TRIKOTAZA NAMJENA OSTALO Z PRODAVAONICA 10002 151.00 1,112.00
20213 09.06.2007 KOM HLACE KRATKE TRIKOTAZA NAMJENA OSTALO M PRODAVAONICA 10093 131.00 1,141.04
29501 09.06.2007 KOM MAJICA DUGI RUKAV TRIKOTAZA NAMJENA OSTALO M PRODAVAONICA 10002 122.00 954.55
22630 09.06.2007 KOM HLACE TRIKOTAZA NAMJENA OSTALO Z PRODAVAONICA 10002 121.00 684.11
7803 09.06.2007 KOM TRENIRKA TRIKOTAZA NAMJENA OSTALO M PRODAVAONICA 10093 143.00 2,269.90
22801 09.06.2007 KOM TRENIRKA TRIKOTAZA NAMJENA OSTALO Z PRODAVAONICA 10002 162.00 3,120.00
9301 09.06.2007 KOM KOMBINEZON S RUKAVIMA TRIKOTAZA NAMJENA OSTALO Z PRODAVAONICA 10002 51.00 1,117.23
3001 09.06.2007 KOM HLACE JOGGING TRIKOTAZA NAMJENA OSTALO Z PRODAVAONICA 10093 61.00 1,114.90
22630 09.06.2007 KOM MAJICA KRATKI RUKAV BASIC TRIKOTAZA NAMJENA OSTALO Z PRODAVAONICA 10002 93.00 1,203.00
16203 09.06.2007 KOM MAJICA KRATKI RUKAV TRIKOTAZA NAMJENA OSTALO Z PRODAVAONICA 10002 110.00 4,234.20
25403 09.06.2007 KOM MAJICA KRATKI RUKAV TRIKOTAZA NAMJENA OSTALO Z PRODAVAONICA 10093 64.00 1,265.95
3001 09.06.2007 KOM TRENIRKA TRIKOTAZA NAMJENA OSTALO M PRODAVAONICA 10002 92.00 2,134.00
9301 09.06.2007 KOM TRENIRKA TRIKOTAZA NAMJENA OSTALO M PRODAVAONICA 10002 82.00 2,157.00
5401 09.06.2007 KOM HLACE KRATKE TRIKOTAZA NAMJENA OSTALO M PRODAVAONICA 10093 66.00 2,547.00
930 09.06.2007 KOM MAJICA KRATKI RUKAV TRIKOTAZA NAMJENA OSTALO M PRODAVAONICA 10002 73.00 3,135.53
11103 09.06.2007 KOM KOMBINEZON BEZ RUKAVA TRIKOTAZA NAMJENA OSTALO Z PRODAVAONICA 10093 82.00 1,73.80
29278 09.06.2007 KOM MAJICA KRATKI RUKAV TRIKOTAZA NAMJENA OSTALO D PRODAVAONICA 10002 90.00 3,169.76
1401 09.06.2007 KOM TAJICE TRIKOTAZA NAMJENA OSTALO D PRODAVAONICA 10093 92.00 1,181.80
1401 09.06.2007 KOM MAJICA KRATKI RUKAV TRIKOTAZA NAMJENA OSTALO Z PRODAVAONICA 10002 62.00 2,240.62
903 09.06.2007 KOM MAJICA KRATKI RUKAV TRIKOTAZA NAMJENA OSTALO Z PRODAVAONICA 10011 85.00 1,840.06
5401 09.06.2007 KOM HLACE TRIKOTAZA NAMJENA OSTALO D PRODAVAONICA 10002 91.00 1,121.00
11103 09.06.2007 KOM TRENIRKA TRIKOTAZA NAMJENA OSTALO D PRODAVAONICA 10093 92.00 1,120.00
11103 09.06.2007 KOM HLACE JOGGING TRIKOTAZA NAMJENA OSTALO D PRODAVAONICA 10093 71.00 946.00
28903 09.06.2007 KOM MAJICA DUGI RUKAV TRIKOTAZA NAMJENA OSTALO D PRODAVAONICA 10093 81.00 927.65
50065 09.06.2007 KOM KOMPLET DJECJI TRIKOTAZA NAMJENA OSTALO D PRODAVAONICA 10002 81.00 875.95
27530 09.06.2007 KOM TRENIRKA TRIKOTAZA NAMJENA OSTALO M PRODAVAONICA 10023 71.00 1,264.54
24278 09.06.2007 KOM MAJICA KRATKI RUKAV TRIKOTAZA NAMJENA OSTALO Z PRODAVAONICA 10002 93.00 1.226.70
7301 09.06.2007 KOM MAJICA KRATKI RUKAV TRIKOTAZA NAMJENA OSTALO M PRODAVAONICA 10014 124.00 1.186.66
29278 09.06.2007 KOM KOMPLET TRIKOTAZA NAMJENA OSTALO D PRODAVAONICA 10002 164.00 4.478.68
152
Prilog 5. Podaci o temperaturi, vjetru i kalendaru, transformirani
Datum Dan Tjedan Pomak REFII Jačina vjetra Smjer vjetra
02.04.2004 PETAK 14 -2.40 SREDNJI PAD 1 N
01.04.2004 ČETVRTAK 14 5.10 SNAZAN RAST 2 N
30.03.2004 UTORAK 13 -0.10 BEZ PROMJENE 1 N
28.03.2004 NEDJELJA 13 0.20 BEZ PROMJENE 1 N
27.03.2004 SUBOTA 13 -0.50 BEZ PROMJENE 0 C
24.03.2004 SRIJEDA 12 0.10 BEZ PROMJENE 2 N
22.03.2004 PONEDJELJAK 12 -7.70 SNAZAN PAD 0 C
21.03.2004 NEDJELJA 12 0.30 BEZ PROMJENE 0 C
18.03.2004 ČETVRTAK 12 0.80 BEZ PROMJENE 1 N
17.03.2004 SRIJEDA 11 1.80 SREDNJI RAST 1 N
16.03.2004 UTORAK 11 1.40 BLAGI RAST 1 N
15.03.2004 PONEDJELJAK 11 -2.40 SREDNJI PAD 1 N
14.03.2004 NEDJELJA 11 2.10 SREDNJI RAST 0 C
12.03.2004 PETAK 11 -1.50 BLAGI PAD 0 C
10.03.2004 SRIJEDA 10 -1.40 BLAGI PAD 1 N
09.03.2004 UTORAK 10 0.00 BEZ PROMJENE 1 N
08.03.2004 PONEDJELJAK 10 0.60 BEZ PROMJENE 3 N
07.03.2004 NEDJELJA 10 0.20 BEZ PROMJENE 2 N
06.03.2004 SUBOTA 10 1.80 BLAGI RAST 0 C
05.03.2004 PETAK 10 -3.20 SNAZAN PAD 0 C
03.03.2004 SRIJEDA 9 -0.60 BEZ PROMJENE 1 N
01.03.2004 PONEDJELJAK 9 -1.00 BEZ PROMJENE 2 N
29.02.2004 NEDJELJA 9 1.50 BLAGI RAST 0 C
28.02.2004 SUBOTA 9 -0.90 BEZ PROMJENE 3 N
27.02.2004 PETAK 9 -0.60 BEZ PROMJENE 0 C
26.02.2004 ČETVRTAK 9 1.30 BLAGI RAST 0 C
25.02.2004 SRIJEDA 8 1.40 BLAGI RAST 0 C
22.02.2004 NEDJELJA 8 2.20 SREDNJI RAST 0 C
21.02.2004 SUBOTA 8 -2.20 SREDNJI PAD 0 C
19.02.2004 ČETVRTAK 8 -2.50 SREDNJI PAD 2 N
17.02.2004 UTORAK 7 -4.50 SNAZAN PAD 1 N
16.02.2004 PONEDJELJAK 7 0.00 BEZ PROMJENE 2 N
13.02.2004 PETAK 7 3.90 SNAZAN RAST 0 C
12.02.2004 ČETVRTAK 7 -5.40 SNAZAN PAD 0 C
11.02.2004 SRIJEDA 6 2.70 SREDNJI RAST 3 N
10.02.2004 UTORAK 6 -7.20 SNAZAN PAD 1 N
09.02.2004 PONEDJELJAK 6 -2.50 SREDNJI PAD 0 C
07.02.2004 SUBOTA 6 1.10 BLAGI RAST 0 C
06.02.2004 PETAK 6 4.40 SNAZAN RAST 0 C
05.02.2004 ČETVRTAK 6 1.30 BLAGI RAST 1 N
04.02.2004 SRIJEDA 5 0.40 BEZ PROMJENE 0 C
03.02.2004 UTORAK 5 -1.20 BLAGI PAD 0 C
02.02.2004 PONEDJELJAK 5 -3.30 SNAZAN PAD 1 N
31.01.2004 SUBOTA 5 9.10 SNAZAN RAST 0 C
28.01.2004 SRIJEDA 4 0.30 BEZ PROMJENE 0 C
27.01.2004 UTORAK 4 -0.50 BEZ PROMJENE 1 N
153
Prilog 6. Oracle PL/SQL skripte, pretprocesiranje podataka, primjer
BEGIN
DECLARE
CURSOR C IS
SELECT DATUM_DOK, GRUPA_KLAS_NAZIV, SPOL_KLAS_NAZIV, SUM(NVL(IZLAZ_KOL,0)) KOLICINA,
SUM(NVL(IZLAZ_NC,0)) NC, SUM(NVL(IZLAZ_MPC,0)) MPC, SUM(NVL(IZLAZ_MPC,0))-
SUM(NVL(IZLAZ_NC,0)) BRUTOMARZA
FROM LEO_DOC_PODACI_PRODAJA
WHERE DATUM_DOK BETWEEN TO_DATE('01012006','DDMMRR') AND TO_DATE('31122007','DDMMRR')
AND GRUPA_KLAS_NAZIV = 'OBUĆA'
AND SPOL_KLAS_NAZIV = 'M'
GROUP BY DATUM_DOK, GRUPA_KLAS_NAZIV, SPOL_KLAS_NAZIV
ORDER BY DATUM_DOK;
CURSOR D (X_DATUM IN DATE) IS
SELECT DATUM_DOK, GRUPA_KLAS_NAZIV, SPOL_KLAS_NAZIV, SUM(NVL(IZLAZ_KOL,0)) KOLICINA,
SUM(NVL(IZLAZ_NC,0)) NC, SUM(NVL(IZLAZ_MPC,0)) MPC, SUM(NVL(IZLAZ_MPC,0))-
SUM(NVL(IZLAZ_NC,0)) BRUTOMARZA
FROM LEO_DOC_PODACI_PRODAJA
WHERE GRUPA_KLAS_NAZIV = 'OBUĆA'
AND SPOL_KLAS_NAZIV = 'M'
AND DATUM_DOK = X_DATUM
GROUP BY DATUM_DOK, GRUPA_KLAS_NAZIV, SPOL_KLAS_NAZIV;
BEGIN
FOR I IN C LOOP
FOR J IN D (I.DATUM_DOK-1) LOOP
UPDATE DOC_ISTRAZIVANJE SET DOC_POMAK_OBUCA_M = NVL(I.KOLICINA,0) - NVL(J.KOLICINA,0)
WHERE DOC_DATUM = I.DATUM_DOK;
END LOOP;
END LOOP;
END;
END;
154
Prilog 7. Oracle PL/SQL skripte, transformacija u REFII, primjer BEGIN
DECLARE
V_MAX NUMBER(20,2);
V_MIN NUMBER(20,2);
V_PROSJEK NUMBER(20,2);
V_BEZ_PROMJENE NUMBER(20,2) := 1/100;
V_BLAGA_PROMJENA NUMBER(20,2) := 20/100;
V_SREDNJA_PROMJENA NUMBER(20,2) := 60/100;
--SNAŽNA PROMJENA > 60%
CURSOR C IS SELECT * FROM DOC_ISTRAZIVANJE_KOLICINE ORDER BY DOC_DATUM;
BEGIN
UPDATE DOC_ISTRAZIVANJE_KOLICINE SET DOC_REFII_OBUCA_Z = NULL;
SELECT MAX(DOC_POMAK_OBUCA_Z) INTO V_MAX FROM DOC_ISTRAZIVANJE_KOLICINE;
SELECT MIN(DOC_POMAK_OBUCA_Z) INTO V_MIN FROM DOC_ISTRAZIVANJE_KOLICINE;
V_PROSJEK := (ABS(V_MAX) + ABS(V_MIN))/2;
--DBMS_OTUPUT.PUT_LINE('V_MAX: '||TO_CHAR(V_MAX));
--DBMS_OTUPUT.PUT_LINE('V_MIN: '||V_MIN);
--DBMS_OTUPUT.PUT_LINE('V_PROSJEK: '||V_PROSJEK);
--DBMS_OTUPUT.PUT_LINE('V_STAGNACIJA: '||V_PROSJEK*V_BEZ_PROMJENE);
--DBMS_OTUPUT.PUT_LINE('V_BLAGA_PROMJENA: '||V_PROSJEK*V_BLAGA_PROMJENA);
--DBMS_OTUPUT.PUT_LINE('V_SNAZNA_PROMJENA: '||V_PROSJEK*V_SNAZNA_PROMJENA);
FOR I IN C LOOP
IF I.DOC_POMAK_OBUCA_Z IS NULL THEN
UPDATE DOC_ISTRAZIVANJE_KOLICINE SET DOC_REFII_OBUCA_Z = 'NEMA PODATAKA' WHERE DOC_DATUM
= I.DOC_DATUM AND DOC_REFII_OBUCA_Z IS NULL;
ELSIF NVL(I.DOC_POMAK_OBUCA_Z,0) BETWEEN -V_PROSJEK*V_BEZ_PROMJENE AND
V_PROSJEK*V_BEZ_PROMJENE THEN
UPDATE DOC_ISTRAZIVANJE_KOLICINE SET DOC_REFII_OBUCA_Z = 'BEZ PROMJENE' WHERE DOC_DATUM
= I.DOC_DATUM AND DOC_REFII_OBUCA_Z IS NULL;
ELSIF NVL(I.DOC_POMAK_OBUCA_Z,0) BETWEEN -V_PROSJEK*V_BLAGA_PROMJENA AND 0 THEN
UPDATE DOC_ISTRAZIVANJE_KOLICINE SET DOC_REFII_OBUCA_Z = 'BLAGI PAD' WHERE DOC_DATUM =
I.DOC_DATUM AND DOC_REFII_OBUCA_Z IS NULL;
ELSIF NVL(I.DOC_POMAK_OBUCA_Z,0) BETWEEN 0 AND V_PROSJEK*V_BLAGA_PROMJENA THEN
UPDATE DOC_ISTRAZIVANJE_KOLICINE SET DOC_REFII_OBUCA_Z = 'BLAGI RAST' WHERE DOC_DATUM =
I.DOC_DATUM AND DOC_REFII_OBUCA_Z IS NULL;
ELSIF NVL(I.DOC_POMAK_OBUCA_Z,0) BETWEEN -V_PROSJEK*V_SREDNJA_PROMJENA AND 0 THEN
UPDATE DOC_ISTRAZIVANJE_KOLICINE SET DOC_REFII_OBUCA_Z = 'SREDNJI PAD' WHERE DOC_DATUM =
I.DOC_DATUM AND DOC_REFII_OBUCA_Z IS NULL;
ELSIF NVL(I.DOC_POMAK_OBUCA_Z,0) BETWEEN 0 AND V_PROSJEK*V_SREDNJA_PROMJENA THEN
155
UPDATE DOC_ISTRAZIVANJE_KOLICINE SET DOC_REFII_OBUCA_Z = 'SREDNJI RAST' WHERE DOC_DATUM
= I.DOC_DATUM AND DOC_REFII_OBUCA_Z IS NULL;
ELSIF NVL(I.DOC_POMAK_OBUCA_Z,0) < -V_PROSJEK*V_SREDNJA_PROMJENA THEN
UPDATE DOC_ISTRAZIVANJE_KOLICINE SET DOC_REFII_OBUCA_Z = 'SNAZAN PAD' WHERE DOC_DATUM =
I.DOC_DATUM AND DOC_REFII_OBUCA_Z IS NULL;
ELSIF NVL(I.DOC_POMAK_OBUCA_Z,0) > V_PROSJEK*V_SREDNJA_PROMJENA THEN
UPDATE DOC_ISTRAZIVANJE_KOLICINE SET DOC_REFII_OBUCA_Z = 'SNAZAN RAST' WHERE DOC_DATUM =
I.DOC_DATUM AND DOC_REFII_OBUCA_Z IS NULL;
END IF;
END LOOP;
END;
END;
156
Prilog 8. Vremenska serija, uzorak količina prodaje, normalizirana,
prije pretprocesiranja
157
Prilog 9. Vremenska serija, uzorak bruto marža, normalizirana, prije
pretprocesiranja
158
Prilog 10. Vremenska serija, uzorak srednja temperatura
159
Prilog 11. Prikaz mreže modela u alatu GeNIe
160
Prilog 12. Prikaz PL/SQL okruženja u alatu T.O.A.D.
161
Prilog 13. Prikaz okruženja u alatu Orange modul for Python
162
Prilog 14. Primjer definiranja poslovnih rizika u trgovini tekstilom56
Svrha ovog priloga je dati ilustraciju sa kojim se rizicima suočavaju odnosno na koje
rizike je potrebno posvetiti pažnju u planiranju u trgovini tekstilom a kako bi se što
vjernije predstavila složenost tržišta u današnje vrijeme.
Rizici su preuzeti iz godišnjeg izviješća tvrtke Abercrombie&Fitch, jednog od danas
najpopularnijih proizvođača casual odjeće za mlađu populaciju, za 2010. godinu. Iako
se radi o izvješću koje je namijenjeno dioničarima te u kontekstu govori o rizicima
povezanim sa kretanjm cijene dionice, istovremeno ovako strukturirano daje kvalitetan
pregled tržišnih čimbenika uz tek naznaku dijela koji je povezan sa donošenjem odluke
od strane potrošača.
Izvješće kao bitne rizike u poslovanju u 2011. koje je potrebno uzeti u obzir navodi
slijedeće 34 točke:
1. promjene u ekonomskim i financijskim okolnostima te rezultat tih promjena na
povjerenje potrošača i ukupnu potrošnju odnosno posljedično na izvršenje posla,
rezultat poslovnih operacija i likvidnost,
2. sposobnost predviđanja, identificiranja i reakcije na promjene u modnim
trendovima i zahtjevima potrošača na sezonskoj osnovi,
3. upravljanje zalihama u odnosu na potražnju na tržištu koje, ukoliko ne bude
efikasno, može dovesti do pada profitabilnosti
4. fluktuacije u trošku, dostupnosti i kvalitetni proizvodnih materijala (pamuk),
troškovi rada i prijevoza koji mogu dovesti do kašnjenja proizvodnje i povećati
troškove
5. kapitalne nagrade za protekli period povezane sa izvršnim managementom mogu
utjecati na novčani tijek te utjecati na ukupan rezultat i vrijednost dionica
6. strategija razvoja tvrtke bazira se dominantno na međunarodnom širenju što
povećava kompleksnost operacija, zahtjeva veće resurse i može utjecati na
efikasnost prodajnih mjesta
56 preuzeto sa Abercrombie&Fitch Annual Report 2010, http://www.abercrombie.com/anf/investors/investorrelations.html, 01.10.2011.
163
7. međunarodni plan širenja ovisi o velikom broju faktora od koji svaki može
dovesti do odgoda u terminskim planovima što posljedično može usporiti ili
spriječiti penetraciju pojedinih tržišta i utjecati na profitabilnost operacija• our
direct-to-consumer sales are subject to numerous risks that could adversely
impact sales
8. trpimo i nastavljamo trpjeti troškove vezano na zatvaranje prodajnih mjesta iz
operacija koje smo napustili
9. razvoj novih brandova iziskuje troškove koji će utjecati na naše financijsko
stanje i rezultat
10. flukatuacija tečajeva valuta u zemljama u kojima vršimo ili planiramo vršiti
operacije utjecat će na financijsko stanje i rezultat operacija
11. ukupna sustav uvelike ovisi o tehnološkim rješenjima te postoji rizik efikasnog
funkcioniranja u slučaju bilo kakvih problema sa dostupnošću informacijskog
sustava
12. obzirom na okolnosti na tržištu prodaja će i dalje varirati što će utjecati na
vrijednost dionice
13. tržišni udio nastavit će nagativan trend uslijed širenja konkurancije i pritiska na
cijene proizvoda za konkurentske proizvode
14. sposobnost da privučemo kupce u naše dućane djelomično ovisi o uspješnosti
shopping centara u kojima se nalazi većina naših prodavaonica
15. prodaja snažno varira i nastavit će varirati na bazi sezone što može dovesti do
kratkoročnih pozitivnih ili negativnih trendova u periodima poput blagdana
16. sposobnost da precizno planiramo potražnju za proizvodima te upravljamo
logistikom prodajnih mjesta imat će utjecaj na ukupan rezultat operacija
17. sposobnost da zaštitimo reputaciju branda imat će direktan utjecaj na brand
18. oslanjamo se na iskustvo i znanja izvršnog managementa čije bi napuštanje
tvrtke imalo utjecaj na poslovanje tvrtke
19. prekid ili odgoda u izvođenju aktivnosti u lancu nabave (prvenstveno u slučaju
problema nekog od dobavljača) koji bi doveo do izgubljene prodaje povećat će
trošak naših operacije
20. ne kontroliramo izvore proizvodnje stoga je potrebno uzeti u obzir rizike s
kojima se suočavaju proizvođači
164
21. ne kontroliramo transportne kapacitete stoga je potrebno uzeti u obzir rizike s
kojima se suočavaju prjevoznici
22. mogući su povećani troškovi uslijed rastućeg rizika prijevara putem kreditnih
kartica
23. nadogradnje i unapređenja informacijkog sustava mogu dovesti odgoda u
provođenju nekih aktivnosti
24. kapaciteti kao i kapaciteti naših partnera osjetljivi su na mogućnost da dođe do
elementarnih nepogoda takve vrste da onemoguće ili uspore poslovne aktivnosti
25. izloženost pravnim parnicama može imati utjcaj na rezultat poslovanja
26. sposobnost da zaštitimo naše robne marke može utjecati na percepciju naših
brandova te utjecati na image branda i mogućnost prodora na nova tržišta
27. utjecaj projmena poreznih politika na globalnoj razini može utjcati na efikasnost
naših operacija
28. utjecaj mogućih ratnih sukoba na nekom od tržišta može imati efekte na rezultat
naših operacija
29. sposobnost da sklopimo police osiguranja od komercijalnih rizika posla po
prihvatljivim cijenama može utjecati na troškove i rezultat
30. pad prometa i novčanog tijeka ako do njega dođe utjecat će na visinu ostvarenih
bruto marži
31. izloženi smo raznim zakonima koji definiraju carinska pitanje, zaštitu potrođača,
kvote, troškove rada a koji mogu utjecati na našu poslovnu praksu te pofvećati
troškove ili utjecati na percepciju branda ako im se ne prilagodimo
32. troškovi regulatornih agencija i prilagodba polsovanja utječu na način kako
izvodim posao i na efikasnost posla
33. bilo kakve kreditne obveze bez kvalitetnog osiguranja mogu utjecati na rezultat
naših operacija
34. na efikasnost naših operacija utječu promjene u klimi i emisije ispušnih plinova i
promjene u povezanojh regulativi
165
Prilog 15. Lokacije prodajnih mjesta poslovnog sustava Tekstilpromet
d.d.57 u Gradu Zagrebu
- ADIDAS, Zagreb, Bogovićeva 1a, Avenija Dubrovnik 16 SC Avenue Mall, SC
West Gate Zaprešić
- BASLER, Zagreb, Trg bana J.Jelačića 6
- BENETTON, Zagreb, Masarykova 10
- BENETTON - UNDERCOLOURS OF BENETTON, Zagreb, Dubrava 11
- CALAMAR, Zagreb, Ilica 39
- CAMEL ACTIVE, Zagreb, Gajeva 2a, City Center one, Jankomir 33
- CENTRA, Zagreb, Dubrava 42, Maksimirska 46,
Maksimirska 14, Vlaška 91, Trg bana J.Jelačića 4, Bakačeva 10, Pod zidom 9,
Dolac 9, Ilica 69, Črnomerec 3, Krajiška 2, Argentinska 2, Nikole Tesle 5, Pavla
Hatza 8, Kralja Zvonimira 29, R.Bičanića 4, Meštrovićev trg bb, Trg žrtava
fašizma 9, Božidara Magovca 39
- DI CAPRIO, Zagreb, Maksimirska 23
- ELENA MIRO, Zagreb, Ilica 13
- EMPORIO ARMANI, Zagreb, Frana Petrića 5
- FILA, Zagreb, Masarykova 10
- GALEB, Zagreb, Vlaška 95, Teslina 16, Zvonimirova 7, B.Magovca 47,
Jurišićeva 9
- GERRY WEBER, Zagreb, Ilica 36, City Center one, Jankomir 33
- LEVI'S, Zagreb, Jurišićeva 30
- LIU JO, Zagreb, Frana Petrića 3
- MANGO, Zagreb, Ilica 20
- MEN'S POINT, Zagreb, Ilica 8
- MODERATO, Zagreb, Maksimirska 81, Maksimirska 3, Vlaška 93b, Jurišićeva
25, Praška 6, Ilica 44, Ilica 80, Ilica 156, Ilica 218, Petrinjska 26, Trg žrtava
fašizma 2, Meštrovićev trg 1
- MODERATO MEGASTORE, Zagreb, Avenija Dubrava 45, Benetton/Playlife,
Naf Naf, Sisley, Centra, Moderato, Ritual, Naš dom
57 http://www.lanteagrupa.hr/; http://www.pro-sport.hr/, stanje na dan 01.10.2011.
166
- MONARI, Zagreb, Ilica 38a
- NAFNAF, Zagreb, Ilica 16, Trg A. Stračevića, City Center one, Jankomir 33,
King Cross, Škorpikova 34
- NAŠ DOM, Zagreb, Maksimirska 50, Maksimirska 33, Bakačeva 3, Ilica 29,
Ilica 60, Ilica 168a, Gundulićeva 34, Barčev trg bb, Trg žrtava fašizma 5,
B.Magovca 3, Ozaljska 30, Ulica grada Gospića 1a, City Center one, Jankomir
33
- NAVIGARE, Zagreb, Gajeva 2
- NIKE, Zagreb, Ilica 10, Jankomir 33
- OUTLET, Zagreb, Ilica 23, Bani 71, Ulica grada Gospića 1a, Trg Hrvatskoh
velikana 2
- PENNYBLACK, Zagreb, Ilica 13
- SISLEY, Zagreb, Vlaška 105
- SKINY, Zagreb, Trg bana J.Jelačića 2
- SVIJET TKANINE, Zagreb, Kvaternikov trg 1, Jurišićeva 8
Ilica 53a tel. 4846-374, Vlaška 94
- TOP SPORT, Zagreb, Dubrava 45, Bogovićeva 4a, Maksimirska 4
- TOSCA BLU, Zagreb, Ilica 8
- TRIUMPH, Zagreb, Maksimirska 29, Jurišićeva 12, Ilica 35
- VRTULJAK , Zagreb, Avenija Dubrava 43, Maksimirska 49a, Draškovićeva 9,
Petrinjska 5, Meštrovićev trg 1
167
Prilog 16. Matrice korelacije, grafički prikaz odnosa58
Matrica korelacije, uzorak bruto marža pomak
Matrica korelacije, uzorak prodaja pomak
58 svrha grafičkog prikaza je bolja preglednost
168
Prilog 17. Popis korištenih kratica i simbola
AVG funkcija; rezultat prosječna vrijednost BIC Bayesian Information Criterion BN Bayesian Network DM Data Mining ES Expert system
MAP Maximum a Posteriori assignment MDL Minimum Description Length MLC Maximum Likehood Criterion
QR sustav Quick Response sustav
REF akronim od Rise, Equal, Fall. Model nagiba pravaca vremenskih odsječaka, dio REFII modela, ujedno i preteča REFII modela
REFII akronim od Rise, Equal, Fall, gdje II označavava drugu, dorađenu generaciju REF modela. REFII model je jedinstveni model transformacije vremenske serije
SUM funkcija; rezultat suma QR sustav sustava tzv. brze reakcije, engl. quick response
Annealed MAP algoritam
algoritam koji simulira lance unutar mreže koji se fokusiraju na koncentraciju vjerojatnosti u čvorovima mreže
out-of-sample validacija
validacija podrazumijeva izgradnju modela na određenom setu podataka koji se kasnije provjerava na odabranim uzorku tog seta
out-of-time validacija
validacija podrazumijeva izgradnju modela na setu podataka koji pripada određenom vremenskom periodu koji se kasnije provjerava na usporedivom setu podataka u drugom vremenskom periodu
∑ suma
P vjerojatnost ishoda P(a|b) vjerojatnost ishoda događaja a pod uvjetom b
{ } omeđivanje elemenata skupa E element skupa ≤ manji ili jednak ≥ veći ili jednak → funkcija (preslikavanje) f funkcija
169
ŽIVOTOPIS
Autor je rođen 27. lipnja 1973. godine u Zagrebu. Srednju školu završava 1992. sa
zvanjem prirodoslovno-matematički tehničar. Diplomira 1997. godine na Ekonomskom
fakultetu u Zagrebu na katedri za vanjsku trgovinu sa temom diplomskog rada: “Kasko
osiguranje u brodskom prometu” (praksa i rad vezani uz Helios d.d. za osiguranje,
Zagreb). Poslijediplomski studij Informatički management na Ekonomskom fakultetu u
Zagrebu završava kao prvi student V. i VI. generacije 2005. godine sa magistarskim
radom na temu „Primjena metoda rudarenja podataka u trgovini tekstilnim i srodnim
proizvodima“. Jedan je od pokretača DSA (Decision Support Academy) pri učilištu
Alegbra u Zagrebu. Godine 2011. izabran je u zvanje višeg predavača te aktivno
sudjeluje u nastavi na Poslovnoj školi financija i prava Effectus u Zagrebu te Visokoj
školi za primijenjeno računarstvo u Zagrebu na kolegijima iz domene otkrivanja znanja
iz podataka, poslovne analize i analize rizika.
U siječnju 1998. godine zapošljava se u Domu zdravlja u Ivanić Gradu kao pomoćnik
ravnatelja ustanove za informatiku i financije gdje radi do sredine 1999. godine. U rujnu
1999. godine zapošljava se u dioničkom društvu Tekstilpromet d.d., u službi
informatike, kao projektant/organizator. Na ovom radnom mjestu obavlja više funkcija
voditelja/sudionika na različitim projektima te je aktivno uključen u projekte
organiziranja, razvoja i uvođenja aplikacija. Pohađa više specijaliziranih tečajeva za rad
s Oracle alatima. 2006. godine dolazi na poziciju direktora službe informatike i
telekomunikacija poslovnog sustava Tekstilpromet pristunog u više zemalja u regiji.
2008. godine prelazi na poziciju direktora društva Lantea Grupa d.d., vodećeg tekstilnog
maloprodajnog lanca u zemlji koji posluje u okviru sustava povezanog oko tvrtke
Tekstilpromet d.d. U okviru poslova preuzima i poziciju direktora društava Lauris Moda
d.o.o. i Premium Signum d.o.o. (tvrtki kćeri Lantea Grupe) te poziciju koordinatora za
ICT na razini Tekstilpromet grupe.
Koautor je jedne knjige iz domene rudarenja podataka te suradnik na jednom
sveučilišnom udžbeniku slične tematike. Sudionik je više domaćih i međunarodnih
konferencija te autor više članaka u specijaliziranim časopisima. Član je udruge YES
(Young Executives Society) Hrvatska.
170
OBJAVLJENI RADOVI
Knjige
- G. Klepac, L. Mršić (2006) „Poslovna inteligencija kroz poslovne slučajeve“,
Liderpress/TIM Press, Zagreb, ISBN 953-95472-1-0 (Lider press), 953-7177-
15-7 (TIM press)
Poglavlja u knjigama
- Panian Ž. i suradnici (2007) „Poslovna inteligencija - studije slučajeva iz
hrvatske poslovne prakse“, Narodne novine, Zagreb, ISBN: 978-953-234-085-
3
Javna predavanja na stručnim konferencijama
- Klepac G., Kliček B., Mršić L. (2005) „Temporal pattern discovery in consumer
behavior with REFII model“, Consumer Personality and Research Conference,
Dubrovnik, Hrvatska
- Mršić L., Čuturilo T. (2008) "Customer loyalty/reward program Lantea Grupa
PremiumClub", Oracle Open World 2008 konferencija , San Francisco, SAD,
21.-25. rujna 2008.
- Mršić L. (2008)“ Izgradnja skladišta podataka i primjena analitičkih metoda u
poslovanju“, Oracle technology day, Ekonomski fakultet Sarajevo, 06/2008
- Mršić L. (2005) „Postoji li pravilnost u trgovini tekstilnim proizvodima“,
Zbornik HrOUG str. 11., 10. konferencija HrOUG, 18.-22.10.2005. Umag
- Mršić L. (2006) „Poslovna inteligencija u funkciji povećanja efikasnosti
poslovanja“, Zbornik HrOUG str 19., 11. konferencija HrOUG 17.-20.10.2006.
Umag
- Mršić L., Klepac G. (2007) „Upravljanje rizičnošću portfelja primjenom metoda
poslovne inteligencije“, Zbornik HrOUG str 24., 12. konferencija HrOUG, 16.-
20.10.2007. Rovinj
- Mršić L., Klepac G. (2007) „Upravljanje prekidom ugovornih odnosa u
trgovini“, Zbornik HrOUG str. 24., 12. konferencija HrOUG, 16.-20.10.2007.
Rovinj
171
- Mršić L., Čuturilo T. (2008) „Program vjernosti kupaca“, Zbornik HrOUG str.
39, 13. konferencija HrOUG, 14.-18.10.2008. Rovinj
- Klepac G., Mršić L. (2007) „Prevencija i sprečavanje prekida ugovornih
odnosa/kupovine primjenom analitičkih CRM metoda" , CRM konferencija,
Infoarena, Zagreb, travanj 2007.
- Mršić L. (2010) „ Kolektivna svijest, prednost ili nedostatak“, Primjena BI
procesa konferencija u organizaciji Comminus-a i Liderpress-a, 10/2010
- Mršić L. (2011) „ Planiranje u retailu: Kako kraj cilusa pretvoriti u novi
početak?“, Primjena BI procesa međunarodna konferencija u organizaciji
Comminus-a i Liderpress-a, 11/2011, zbornik sažetaka ISBN 978-953-7724-06-
1
Top Related