Nogle svar på spørgsmål, kommentarer og kritik af
bibliotek.dk ytret dels på konferencen Brugernes bibliotek, dels i kommentarer
til Udviklingsplan 2007 for bibliotek.dk.
Udviklingsplanen er blevet behandlet på møde 13.12.2006 med lederfora i bibliotekerne (det er den afsluttende behandling i Biblioteksstyrelsens høring af udviklingsplanen). Referatet fra dette møde er sendt ud fra
Biblioteksstyrelsen den 22. januar 2007 – det indeholder også opsummering og svar på høringen.
Jeg har vurderet at det var rimeligt at det officielle svar var sendt ud, inden jeg kommenterer debatten.
Nedenstående er udelukkende kommentarer på egne vegne, men
vil formentlig blive offentliggjort på danbib.dk/bibliotek.dk i let redigeret
form da der er en generel interesse i nogle af emnerne.
”Hvorfor er der ikke bare ét søgefelt ligesom hos Google?”
”brugerne skriger på enkle, google-lignende grænseflader”
”F.eks. er produktdesignet på bibliotek.dk alt for
komplekst. Med Amazon.com som benchmark, kan bibliotekerne i dag således ikke
engang det, Amazon.com kunne i 1994.”
Opgaven er at give flest mulige brugere det de ønsker med
mindst muligt besvær. Hvis vi troede på at en grænseflade med ét søgefelt gav
flest muligt det ønskede hurtigst, VAR der kun ét søgefelt. Det er – indtil
videre – vores erfaring at brugerne ville bruge mere tid på at finde det de
leder efter ved en "Google-like-grænseflade" end den vi har valgt.
Alle der laver grænseflader stræber forhåbentlig efter at lave det bedst mulige, "Danmarks bedste" eller "verdens bedste". Men det er ikke en eksklusiv ret at mene at den løsning man har lavet ER verdens bedste. Og "eksperter" har ikke én mening om hvad der er den bedste løsning.
På DBC har vi brugt et af de største designbureau'er (Framfab) til sammen med DBC at løse designopgaven på bibliotek.dk og derudover har vi brugt en uafhængig konsulent Kim Pedersen.
På Brugernes bibliotek-konferencen gav Thomas Madsen-Mygdal faktisk også en illustration af Google-søgemetodens (og rankeringens) begrænsninger (uden dog at omtale det som et Google-problem). Når han skrev Tor Nørretranders i Google så fik han jo ikke link til bibliotek.dk - 20. januar er det første bibliotek.dk-link hit nr. 22 på google.dk - dårligt!
Jamen hvordan er det nu at Google skal vide hvad en bruger har lyst til at se som de første links?
Og hvorfor er det ikke ”Google der er dårlig”, men bibliotek.dk??
Søgeresultatet ser sådan ud (og er beskrevet ud fra hvordan det ser ud 20.1. – søgt i google.dk).
Der er da nogle gode links til noget der har med Tor
Nørretranders at gøre, men hvis nu man var ude efter hans nyeste bog, er den
der ikke.
Det er derimod hit nr. 1 hvis man skriver ”tor nørretranders” i
forfatterfeltet i bibliotek.dk (og nr. 2 hvis man skriver det i fritekst)
Søgning i bibliotek.dk på forfatter=tor nørretranders
Bogen kan naturligvis også findes i Google hvis man ved hvad
den hedder – ellers skal man d.d. bladre hen til hit nr. 69.
Man kan godt i bibliotek.dk søge ”som i Google” – der er et
fritekstfelt – men det er ikke placeret som det første og eneste felt fordi det
ofte giver en stort søgeresultat. Og vi har så ingen viden om hvad det er brugeren
ønsker da der jo i fritekst kan skrives alle typer data fra emner, ord i titler til isbn eller forfatternavne.
Google laver naturligvis også andre søgemuligheder fordi de
godt ved at søgningen i det ene felt langtfra altid er lykken. Der er en
”avanceret søgning” (som dog ikke giver muligheder som bibliotek.dk), og så
findes der Google Scholar, Google Books osv. Google har valgt disse to
grænseflader som dem de lægger biblioteksmaterialer ind i. Når man også finder bibliotek.dk-links via Google, er det fordi vi (og mange andre) laver websider der indekseres
af Google – i bibliotek.dk’s tilfælde Emneoversigten.
Går man ind i Google Books og markerer at man vil søge i
bibliotekskataloger og bruger den bibliotek.dk-agtige grænseflade til at søge
på forfatteren ”tor nørretranders”, ja så vælter bøgerne frem med links til
bibliotek.dk. Folkene på Google har altså samme opfattelse som ligger bag de fleste
bibliotekskataloger verden over: man tilfredsstiller flest hurtigst ved straks
at give mulighed for at præcisere sin søgning. Det kan man hvis man har strukturerede metadata.
Man kan undre sig over hvorfor der er tradition for at kalde formularsøgesider for avanceret søgning. Det kræver jo langt mere at søge præcist hvis man kun har ét søgefelt, og derfor kan blive nødt til at bruge søgelogik og søgekoder hvis man vil have et præcist svar.
Læs evt. mere om bibliotek.dk i Google
Der er i øvrigt ganske mange der alligevel finder de danske
biblioteker via Google. Af dem der kommer ind på bibliotek.dk (januar 2007),
kommer 20% fra Google.dk og godt 5% fra andre Google-varianter.
Vi bruger alle specialiserede grænseflader mange andre steder – og undres ikke over det.
Når vi skal
finde et tog til Hobro på næste lørdag, går vi ikke til Google og skriver Hobro
27.1. og forventer at få et brugbart svar, ligesom vi også accepterer at når vi
skal finde et billigt fly til Malaga, skal vi ind i en særlig grænseflade.
Biblioteksgrænseflader minder på mange måder om sådanne
databaser eller andre specialiserede baser som fx beskrevet i denne generelle
wikipedia-beskrivelse af Vertical search.
Det der er karakteristisk for biblioteksbaser og mange andre
baser er: hovedparten af dataene er strukturerede ”metadata” og ikke
fuldtekstdata. Det ville da være dejligt hvis alt var digitaliseret, men grænsefladen må indrettes ud fra den virkelighed vi står i nu.
Og vi har ikke adgang til et redskab i stil med "linkpopularitet".
Og prøv så i øvrigt lige at søge på Tor Nørretranders hos Amazon - brugervenligt? - enkelt og overskueligt?
Og både Google og Amazon mangler da vist også at man med ét klik kan se hvor materialet er gratis til rådighed og hjemme i éns nabolag.
”Hvorfor
får jeg ikke lige det jeg søger som det første?”
”– hvorfor er søgeresultaterne ordnet efter år og ikke
relevans?
Jeg skal søge og det øverste skal være det jeg skal have.”
Hovedproblemet er berørt ovenfor, og jeg kan måske nok dele
Kalle Nielsens undren i forhold til Brugernes bibliotek-konferencen:"Thomas
Madsen-Mygdal var for mig et frisk pust. Selv om jeg stadig undrer mig over, at personer, som end ikke selv bruger biblioteket, hyres til ukvalificeret at udtale sig om hvad
bibliotekerne skal og kunne gøre, så var hans indlæg forfriskende". (Kalle
Nielsen)
Men da udsagnet om at "det jeg søger bare skal komme som det første" jævnligt kommer op i andre sammenhænge, fx under betegnelsen ”relevanssortering”, vil jeg give nogle få kommentarer til
dette mere specifikt.
Hver gang man laver en sorterings- eller rankeringsalgoritme vælger man naturligvis hvad man synes er vigtigst for brugeren. Ingen af os kan vide hvad der er relevant for en bruger som skriver et eller flere ord i et fritekstsøgefelt. Man kan vælge "forståelige kriterier" som dét der er hjemme vises først, det der er nyest kommer først, posterne kommer alfabetisk efter titlen e.l. Eller man kan vælge rankeringer hvor brugeren ikke umiddelbart kan gennemskue eller ændre på rankeringen som fx Googles rankering efter blandt andet hvor mange der linker til den enkelte side.
Skriver en bruger "einstein" (for nu at blive ved Tor Nørretranders’ nyeste bog) i bibliotek.dk's fritekstsøgefelt, kan det være for at finde netop Nørretranders bog. Det kan også være for at finde bøger af Einstein, og er det en skoleelev der skriver vil Nørretranders bog næppe være det mest relevante. Det giver d.d. 1813 hits, og det er unægtelig en blandet
landhandel: søgning på einstein (fritekst)
For et par år siden lavede vi undersøgelser af muligheden for at rankere efter emne; det resulterede i sorteringsmuligheden ”sortér efter emne”, men det er en tilvalgsmulighed da vi ikke kan vide om brugeren søger efter emne, hvis de søger fritekst.
Grænsefladerne i
bibliotek.dk indbyder brugerne til at meddele lidt mere end blot ”einstein” –
dels ved valg af grænseflade dels ved at give mulighed for at skrive hvilken
slags oplysning ”einstein” er. Vælger man musiksøgesiden og skriver det ind i
”titel på cd” får man 12 hit – overskueligt hvis det nu var Philip Glass’
"Einstein on the beach", man var ude efter:
einstein som titel på cd
Halvdelen af
søgningerne på bibliotek.dk sker på en anden grænseflade end
defaultgrænsefladen. Da det aldrig er let at få brugere til at vælge noget andet end default, må det være fordi de kan se at det er nyttigt at gøre det i en
lang række søgesituationer.
Statsbiblioteket
har forsøgt sig med en ”relevanssortering” som default-sortering. Den kan sikkert give en fornuftig sortering af nogle søgeresultater, men generelt er det svært at se det som overbevisende – her igen søgningen på
einstein
DBC havde for en del år siden i et udviklingsarbejde omkring en lignende rankeringsalgoritme, men fandt det ikke overbevisende til anvendelse i baser som DanBib på det tidspunkt. Link til artikler om forsøget
Det andet alternativ kunne være at vælge en sortering efter hvad der er mest ”populært”. Hvilket vil betyde at uanset hvem man er og hvad man leder efter, vil man altid få præsenteret de samme hits øverst. Jeg har svært ved at se nytten af det generelt, men det kan da forsøges som et tilbud (når vi får adgang til en central base over udlånsdata).
I dag har brugeren visse muligheder for personalisering som fx at ønske som default kun materialer på dansk og kun fra folkebiblioteker og ikke lydbøger m.v. Det reducerer "einstein"-søgningen til 295 poster og det kan nok for mange brugere være en fornuftig default-indstilling. Vi fortsætter med udvikling af flere personaliseringsmuligheder.
Hvorfor er bibliotekerne ikke synlige i søgemaskinernes resultater?
Jamen det er de jo også, som demonstreret ovenfor. Hvis man
vil have bibliotek.dk-posten blandt de øverste hit, skal man søge mere præcist end ”tor nørretranders” (er der nogen der synes at det er underligt??) fx
Søgning på tor nørretranders at tro på tro
Søgning på hjarvad selskabelige
Det er ikke bibliotekerne der bestemmer hvordan og hvor
de vises i Google. Det er Googles valg at de høstede poster kun vises i Google Scholar og kun hvis de matches med poster i Google Scholar. Der er dog et
udviklingsprojekt i 2007 der kan bløde lidt op på dette.
”Servicen er designet af en komité” – ”mer' beta”
"… Thomas direkte refererede til bibliotek.dk’ komplekse og
30-sider lange, aktuelle udviklingsplan som har været behandlet i plenum.
Verdensklasse designes ikke af komiteer…..Der skal eksperimenteres mere, og
eksperimenterne bør foretages af små hold og lanceres med det samme. I gamle
dage kunne man gøre tingene færdige, men det kan man ikke længere. Der kommer
altid en ny version".
Vi har allerede set projekter, der har været lang tid undervejs, og hvis ideer i og for sig har været velvalgte på starttidspunktet, men som med tiden er blevet overhalet indenom enten af udviklingen eller af træthed i organisationen.
Her er der tale om en ren misforståelse: fordi der faktisk er en åbenhed omkring bibliotek.dk-udviklingen (i modsætning til så mange andre offentlige projekter inklusive bibliotekers udviklingsplaner), betyder det ikke at der kun laves ting som har været til høring. Ligesom projekter kan fjernes hvis de bliver uaktuelle.
Fx at de har været med til at prioritere projekter der har fokus på samspillet med bibliotekerne højt.
Jeg har ikke set nogen praktiserende biblioteksfolk udtale at tiden er forpasset for "tunge" projekter som værkvisning og automatisering af fjernlån selvom projekterne er flerårsprojekter.
Og det kunne være rigtig fint hvis Statsbiblioteket som har specielle forpligtelser som overcentral i lånesamarbejdet på samme måde prioriterede "samspilsprojekter" så det ikke i dag var det eneste store bibliotek som ikke kan levere "holdings" til visning af udlånsstatus i bibliotek.dk og DanBib, og endnu mere afgørende for bibliotekernes arbejde og for brugernes tilfredshed: til automatisering af fjernlån.
På grund af en i starten udbredt skepsis eller forsigtighed over for bibliotek.dk har Biblioteksstyrelsen valgt denne model med rådgivende udvalg og høringer af udviklingsplanen. Noget kunne tyde på at stemningen i dag er sådan at det ikke er nødvendigt at det er en stor projektliste der sendes i høring, men mere er nogle hovedprincipper og ideer. Men modellen er altså opstået efter ønske fra og i samarbejde med bibliotekerne.
Udviklingsplanen
lægger nogle rammer for udviklingen, men i løbet af året laves mange ting som
ikke står på udviklingsplanen.
MEN, vi kan ikke arbejde som Google med den infrastrukturelle del af bibliotek.dk. Hvis Google lancerer noget i en beta-version som ikke fungerer, har brugerne ingen grund til at klage. Det er jo gratis, og betales heller ikke over skatten – og der findes andre søgemaskiner.
Bibliotek.dk finansieres af de danske borgere, der er kun ét bibliotek.dk, og det er medarbejdere ved de danske biblioteker det går ud over hvis vi ikke tester ordentligt. Den største bestillingsmodtager, Københavns Kommunes Biblioteker, modtager når det går højest knap 30.000 bestillinger/viderestillinger fra bibliotek.dk på en måned.
Dér skal ikke laves nogen kiksede forsøg før både medarbejdere og brugere
bliver aldeles rasende!