torsdag, februar 26, 2009

Store Norske Leksikon vs. Wikipedia

Dagsavisen har i sin utgave torsdag 26. februar 2009 en artikkel på side 32-33 som omhandler lanseringen av Store Norske Leksikon sin nettutgave, og dette leksikonet sammenlignet med den norske utgaven av Wikipedia. De hadde også en artikkel tirsdag 24. februar som snakket om den snart kommende nettlanseringen av SNL.


Dagsavisen gjorde i denne artikkelen en temmelig uformell undersøkelse hvor kulturredaksjonen i avisen valgte ut ett sett emner og vurderte dekningen av disse i Store Norske Lekiskon og Wikipedia. I tillegg fikk de tre "eksperter" til å vurdere dekningen av deres spesialtfelt i begge leksikonene. Denne endte med at Wikipedia vant 5-4 mot Store Norske Leksikon.

Jeg vil her komme med noen kommentarer. Det kan være verdt å først lese over min kritikk av norske forskeres holdning til Wikipedia, da dette også er en generell vurdering av folk som kommer med kommentarar ala "Hah, det stod jo i Wikipedia at Jens Stoltenberg var pedofil!!!" (det er riktig - en eller annen anonym tosk gikk inn og endret artikkelen, og lot det ligge offentlig. Det ble liggende ute i rundt en dag, før det ble endret tilbake. Det er i det hele tatt temmelig mye vandalise rundt artikkelen om Jens, men allikevel er innholdet stort sett til alle tider korrekt).

Forutintatte 'Eksperter'
Dagsavisen benyttet tre 'eksperter' som helt åpenbart har meget forutintatte holdninger. Jeg siterer 'Ekspert' Trond Thorbjørnsen, leder av SOS Rasisme: "Man har fjernet seg fra anonymitetshysteriet som kjennetegner Wikipedia, og det er bra. Artiklene der er ofte preget av redigeringskriger og meningsytringer ...". Også 'Ekspert' Nina Karin Monsen, filosof, som tydeligvis ofte er innom og redigerer artikkelen om seg selv på Wikipedia, mener allikevel "Jeg har ikke mye tillit til Wikipedia. Det virker tilfeldig hvem som redigerer artiklene". Allikevel viser det seg at Wikipedia-artikkelen om henne er vesentlig fyldigere enn SNL sin artikkel.

(I bunnen av dette blogginnlegget kan du lese litt om disse utsagnene.)

Sammenlikning mot norsk utgave av Wikipedia
Som kan leses i mitt blogginnlegg nevnt innledningsvis, så er jeg ikke noe stor fan av 'nasjonaliseringen' som har skjedd av Wikipedia. Jeg synes det blir urettferdig å såpass tidlig i den norske Wikipedias historie sammenligne det med SNL. Det hadde vært interessant hvis Dagsavisen hadde tatt seg bryet med å sammenlikne SNL med hovedversjonen av Wikipedia, hvilket er den engelske, og sett hvordan skåren ble da.

Store Norske Leksikon har 155 000 artikler (i følge den første artikkelen i Dagsavisen) eller 300 000 artikler (i følge den andre). Jeg kan ikke finne at SNL selv sier noen plass hvor mange artikler de har. Som en sammenlikning, så finnes det nå "209 131 [artikler] i den norske utgaven på bokmål og riksmål. På den nynorske versjonen arbeides det på over 46 000 artikler". Det finnes 2618 brukerkonti som er aktive i den forstand at de har gjort minst en endring siste 30 dager (statistikk for norske Wikipedia). I den engelske versjonen, så finnes det i skrivende stund akkurat 2 763 029 artikler. Den har 167 976 aktive brukerkonti (statistikk for engelske Wikipedia).

Lisens på innhold - mulighet for bruk av innhold
Det aller største ankepunktet mot Store Norske Leksikon er nok sannsynligvis lisensen på artiklene. De eksisterende artiklene har copyright Store Norske Leksikon (naturligvis), og lisensen de har gitt dem er av en lukket type hvor kun SNL kan bestemme hva som skal skje med teksten utover det å publisere den på snl.no. Dette betyr at man ikke kan ta f.eks. noen hundre artikler fra snl.no og slenge sammen til et kompendium som man distribuerer for noen kroner, eller gratis til alle elevene i en klasse, eller på en skole.

Dette er i en ekstrem motsetning til hvordan Wikipedia forholder seg til det samme. Her er lisensen helt og holdent fri, i den forstand at alt man legger inn i Wikipedia får den samme åpne lisensen, og man kan for eksempel lage skolebøker og gi disse ut helt fritt. Det eneste "aberet" i så måte er at også disse bøkene kan igjen kopieres helt fritt fra - man kan ikke legge restriksjoner på viderekopiering av ting som har sitt utspring i Wikipedia. Dette kan oppfattes som restriktivt, men hvis man tenker over det, så er det jo egentlig positivt: Informasjonen kan ikke "lukkes ned" av noen part.

Wikipedia, og da spesielt den engelske hovedversjonen, er på en helt annen måte enn Store Norske Leksikon en sosial platform. Her kan all verdens befolkning få tilgang til all verdens kunnskap, helt kostnadsfritt. Store deler av Wikipedia blir f.eks. gjort tilgjengelig på laptoppene som distribueres av OLPC-prosjektet. Det gis også ut bøker og "CD kompendium" basert på innhold fra Wikipedia - alt er selvfølgelig fritt tilgjengelig, for alle verdens folk, fattige som rike. Wikipedia kan på denne måten tildels ses på som et enormt u-landsprosjekt som kan være med å gi slike land en 'flying start' i forhold til kunnskap.

Reklame
Store Norske Leksikon har ett lass med reklame overalt, av typen bevegelige irritasjonsmomenter. Til sammenlikning drives Wikipedia over alle land fullstendig ideelt, basert på donasjoner, og er 100% reklamefritt.

Teknisk kvalitet på nettstedet
Jeg finner det temmelig snodig at Store Norske Leksikon velger å bygge et helt slikt system opp fra bunnen av. Det virker nesten naivt til det utrolige å tro at man kan danke ut selve systemet som Wikipedia benytter, MediaWiki. Dette har hatt årevis med utvikling rundt ett system for å håndtere brukergenerert innhold, og har også mangfolde automatiserte småprogram og "intelligente agenter" som hjelper med å holde innholdet i god form (les mot slutten av dette innlegget for mer info). Hvorfor valgte ikke heller SNL å ta til seg denne eksisterende kildekoden, som er Open Source og dermed kan benyttes helt fritt, og kan modifiseres helt fritt? Hvis SNL hadde spesifikke ønsker om fagansvarlig og så videre, så kan det poengteres at flere av disse funksjonene faktisk allerede finnes i MediaWiki, og resten kunne blitt "patchet inn" av SNL sin stab av programvareutviklere.

Med valget SNL har gjort, så må nå absolutt alle funksjoner bygges opp fra grunnen av (utenom at de faktisk tydeligvis har benyttet en eksisterende "WYSIWYG" editor for editering av sider). Jeg tror ikke SNL på noe vis har ressurser til at dette blir på høyde med, og langt mindre bedre enn, Wikipedias system MediaWiki.
 
Kulturminister Trond Giske hyller Store Norske Leksikon
Det blir noe snodig når kulturministeren hyller iniativet som Store Norske Leksikon gjør, og mellom linjene kritiserer andre kilder, da nødvendigvis Wikipedia, med uttalelser "Den enorme informasjonsflommen fører til at det blir stadig vanskeligere å skille mellom god og dårlig informasjon på nett. Derfor er det svært viktig at vi bygger kunnskapskilder som gir enkel og gratis tilgang".

Hva har Trond gjort for den norske utgaven av Wikipedia, eller for interesseorganisasjonen Wikimedia Norge? (Wikimedia Norge er den norske avdelingen av Wikimedia Foundation i USA, som jobber for "Wikipedianere" i Norge og det norske Wikipedia, startet i 2007). Til SNL strømmer nemlig ressursene: SNL skal få en støtte av ABNtre millioner kroner over tre år. Videre skal Nasjonalbiblioteket åpne opp sitt bildemateriale til SNL, som ikke kan benyttes av Wikipedia.

Noe strøinformasjon om Wikipedia
Wikipedia er et ekstremt dynamisk prosjekt med veldig mye bevegelse hver dag. Folkene som ivrig prøver å drive dette digre nettstedet sitter ikke inaktiv og ser på at deres 12 millioner artikler til stadighet blir utsatt for vandalisme av folk som kun er ute etter "å fucke opp", eller kanskje har underliggende grunner for å redigere en artikkel i en viss retning (for eksempel ble alle ip-adresser til det hvite hus "banned" fra å redigere Wikipedia i en periode, på grunn av veldig mange politisk fargede endringer).

Mitt tidligere blogginnlegg nevner noen av de helt basale verktøyene en vanlig Wikipedia-bruker har tilgjengelig, og BØR benytte, når man bruker Wikipedia.

Angående utsagnene til "Ekspertene" nevnt i toppen av artikkelen:

Grunnen til at det er mulig å redigere anonymt, er for at det skal være mulig for personer som sitter i utsatte posisjoner, typisk i regimer hvor det er streng sensur og farlig å mene det ene eller det andre, å legge inn informasjon. Dette er imidlertid en posisjon som nærmest daglig er oppe til diskusjon i de aktive sirkler i Wikipedia. Jeg må personlig si at jeg godt kunne vært foruten all den dritten som anonyme brukere legger inn: Vandalisme av artikler skjer nær 100% av gangene fra anonyme brukere. Sjekk for eksempel de historiske endringene på artikkelen om Jens Stoltenberg - anonyme brukere identifiseres ved at de ikke har brukernavn, men istedet en ip-adresse (som ser ut som fire tall separert av tre punktum, f.eks. slik: 84.215.14.106). Hvis du ser kommentarer ovenfor slike endringer som f.eks. sier "undid", "rv", "revert" eller "vandalism", så er dette opprettinger gjort etter vandalisme.

Men gitt dette ønsket om at det faktisk fremdeles skal være mulig å redigere anonymt, så har det blitt utviklet en god del løsninger for å prøve å motvirke slike endringer, eller ihvertfall prøve å fange de opp veldig snart. Først og fremst har man "Watch page" funksjonen: Folk som føler seg knyttet til en artikkel abonnerer som regel på endringer av denne artikkelen ("watch" fanen på toppen av alle artikler når man er logget inn), og dermed fanges feilaktig informasjon opp.

Slike løsninger videreutvikles også hele tiden. For tiden er det en strømning som vurderer å innføre "flagged revisions", som gjør at spesielt kontroversielle artikler kan bli evaluert av folk som har en eller annen autoritet ang. artikkelens innhold. Nye endringer vil da ikke bli synlige uten at man ber om det, før en person med "patrolling rights" har "sett" den nye endringen og evaluert den som OK.

Det norske Wikipedia har også nettopp test-innført en ny modul kalt "misbruksfilter" som vil hindre anonyme brukere, samt veldig nye brukere, i å gjøre visse "kontroversielle" operasjoner. Systemet baserer seg på regelsett, som for eksempel hindrer en bruker å flytte artikler til nye titler som inneholder et sett skumle ord, for eksempel dersom brukeren har en historie på mindre enn 200 redigeringer fra før.

For å håndtere "redigeringskriger" og annen destruktiv adferd mellom bidragsyterne til Wikipedia, så er det utviklet temmelig grundige retningslinjer for Wikipedia, og alle disse kan summeres som "The five pillars of Wikipedia". Det finnes spesifikke prosedyrer for håndtering av både redigeringskriger og for innhold i artikler som motstrider det 'nøytrale standpunkt'.

Det finnes også svært mange automatiserte prosesser (såkalte "bots") på Wikipedia som hjelper å fange opp vandalisme, og for å korrigere innholdet automatisk, eller ihvertfall melde ifra om innhold som kanskje kunne ha godt av en vurdering.

I det norske Wikipedia så finnes "Tinget", hvor de som er interesserte i hvordan systemet drives kommer sammen for å diskutere. "Torget" er en annen side hvor man kan få hjelp til å skrive artikler i Wikipedia.

På den engelske Wikipedia, så heter noenlunde tilsvarende sider "Village Pump", "Community Portal" og "Help Desk".


Jaja, da antar jeg at du vet hvor du skal hente informasjon? Og ihvertfall hvor du skal legge inn informasjon? Dette burde også Store Norske Leksikon vurdere - bidra med hele røkla inn i Wikipedia. Så ville det ihvertfall få litt betydning.