B- Temel Politikalar ve Öncelikler
III- FAALİYETLERE İLİŞKİN BİLGİ VE DEĞERLENDİRMELER
I analysedelen av oppgaven anvender jeg forskjellige analyseverktøy med hensikt å finne ut om jeg kan bekrefte eller avkrefte hypotesene jeg har presentert. Jeg gjennomfører enkle univariate analyser, samt en korrelasjonsanalyse, mens hovedvekten av analysen gjennomføres ved regresjonsanalyser.
5.3.1 Logistisk regresjonsanalyse
Den avhengige variabelen er dikotom. Dette innebærer at den vanlige lineære regresjonsanalysens forutsetninger ikke er tilstede. En kan da blant annet oppleve et estimat ut over maksimumsverdiene 1 og 0, og fravær av homoskedastisitet. Analysemetoden som utpeker seg her, er den logistiske regresjonsanalysen (Clausen & Eikemo, 2007, p. 83). Det er likevel argumenter for at en kan bruke lineær regresjon også på dikotome variabler, men det forutsetter at fordelingen mellom de to verdiene er noe jevnt fordelt, og ikke over gitte fordelingspunkt.
Christophersen bruker en skjevfordeling som ikke må overstige 20/80 (Christophersen, 2013, p. 46). Helleviks standpunkt at dersom fordelingen ikke overstiger 70/30 vil tolkningen av resultatet være mye av det samme (Hellevik, 2002, p. 279). I denne fremstillingen er fordelingen av den avhengige variabelen ca. 90/10. Se tabell 6-1. Dette gjør beslutningen om å benytte logistisk regresjon klart.
I vurderingen av hvilke logistiske analyseverktøy som skal brukes, kan man blant annet velge mellom en logit og probit tilnærming. Det er her valgt å bruke en logit-modell. Dette begrunnes i at det er et rent valgspørsmål. I tillegg er det primært logit som brukes i statsvitenskapen.
Helland har en formening om at det matematiske grunnlaget i logit er intuitivt enklere (Helland, 1999, p. 43). Skog anser disse som forholdsvis like, og påstår at forskjellen i predikasjonsverdi er under 1%, og at de dermed får ganske like resultater (Skog, 2014, p. 390).
Kjennetegnene ved den logistiske regresjonen er at en har en S-formet tolkning. Dette innebærer at en får en situasjon der sannsynligheten for å få henholdsvis verdien 1 og 0, går mot uendelig, men aldri vil møte disse to verdiene. Den skalaen som en da bruker går til uendelig, både positivt
som en andel av de uavhengige, bruker en heller sannsynlighet. Det den logistiske analysen gjør er å maksimere sannsynligheten for å predikere sammensetninger av de avhengige variablene, som maksimerer sannsynligheten for å få verdien 1, en såkalt maximun likelyhood-metode.
Ligningen en bruker i logit-analyse er:
Z = a + bX
A er konstantleddet, mens b er koeffisienten multiplisert med den uavhengige variabelen. Z er logiten, som igjen er en funksjon av oddsen for å være registrert (Helland, 1999, pp. 7-9).
Verdien til Z vil variere, men en verdi over 7 i positiv eller negativ retning vil være å anse som sikre utfall. Da opererer en på tusentallsnivå i fordelingen mellom utfall og ikke-utfall.
5.3.2 Tverrsnittsanalyse
I den foreliggende analysen har jeg gjennomført det som må kategoriseres som en tverrsnittanalyse. Dette med bakgrunn i at det ikke er endringer i enhetene over tid som er av interesse, men kjennetegnene ved innmeldelse i registeret. Undersøkelsen tar i utgangspunktet for seg åtte år, der jeg først har kategorisert de åtte årene til to perioder, og deretter slått periodene sammen til en analyse. Dette dels for å øke antallet observerte enheter, N. Et annet argument for sammenslåing har vært på bakgrunn av organisasjonsdatabasen. Dette gjør at jeg har to øyeblikksbilder av den kommunale organiseringen, men ikke kontinuerlig informasjon.
I nevnte sammenslåingsprosess har det vært utfordrende å behandle variabelen GJELD. Jeg har vurdert forskjellige alternativer hvordan en best kan håndtere den nominelle verdien i starten av en kommunestyreperiode. Det oppleves som lite tilfredsstillende å holde den nominelle verdien konstant, for deretter å addere sammen. En alternativ måte hadde vært å sentrere variabelen om en gitt verdi, eksemplifisert ved 0. Dette innebærer å fjerne gjennomsnittet fra hver verdi. Da beholdes standardavvikene og fordelingen i utvalget slik det i utgangspunktet var, med en likere verdi. Ulempen
med dette er at forholdstallene mellom de to periodene fortsatt vil være misvisende. En gjeld Figur 5-5 Tverrsnitt - GJELD
på 100 kr i periode 1 er relativt sett en større gjeld enn tilsvarende i periode 2, forutsatt en økning i inflasjon. Et annet alternativ hadde vært å korrigere for en økonomiske utviklingstrekk, som den kommunale deflatoren, inflasjon eller en selektiv rente. Dette anser jeg som svakere, da det forventes at dette bare vil kunne fange opp enkelte sider ved et svært komplekst spørsmål, den kommunale gjeldsoppbygningen. Det er viktig å ha i mente at dette er en variabel som det kontrollers for, og som det kontrolleres for i starten av hver periode. Variablene er ikke en av de forklarende uavhengige variablene. Det er valgt å konstruere en multiplikator slik at gjennomsnittet får lik verdi i begge periodene, men slik at også forholdet mellom periode 1 og 2 blir ivaretatt. Dette gjøres ved her ved å multiplisere verdien i periode 1 med den vektede forskjellen mellom periode 1 og periode 2. 37,8x = 51,1 = 1,35. Dette innebærer at om en kommune hadde 10 000 kr i periode 1, blir det målt som 13 500 kr per innbygger i modellen.
De andre variablene har ikke en tilsvarende problematikk. Det nærmeste er variabelen som dekker de utgiftskorrigerte frie inntektene, men den er allerede sentrert med gjennomsnittet på 100, som holdes konstant over alle de aktuelle årene.
Figur 5-6 Nominell gjeld periode 1 og 2
6 Analyse
I denne delen av oppgaven gjennomføres selve analysen. Først foretar jeg en deskriptiv analyse av de ulike variablene for å gi ytterligere bakgrunnsinformasjon samt fordelinger. Deretter foretar jeg en rask korrelasjonsanalyse for å vise at ingen av variablene må ekskluderes på bakgrunn av samvariasjon, samt korrelasjoner mellom den avhengige og øvrige variabler.
Deretter følger de ulike regresjonsanalysene jeg har foretatt. Det er her hoveddelen av analysen er gjort. Det er kjørt noen ulike variasjoner i kodingen av de forskjellige variablene, og disse kjøringene, samt resultater av disse redegjøres det her for. Avslutningsvis presenteres funnene sett opp mot hypotesene som er formulert. Her er en presentasjon av selve funnene fra analysen.
Resultatet av analysen drøftes i neste kapittel.