Dansk BiblioteksCenter A/S

DanBib og netpunkt.dk information

Sidst opdateret: 22.1.2007


Hvorfor og hvordan?
- svar på nogle spørgsmål om bibliotek.dk


"Hvorfor er der ikke bare ét søgefelt ligesom hos Google?”
”Hvorfor får jeg ikke lige det jeg søger som det første?”
Hvorfor er bibliotekerne ikke synlige i søgemaskinernes resultater?
”Servicen er designet af en komité” – ”mer' beta”
”Bibliotekerne stiller papirbaserede materialer til rådighed”
”Hvorfor kan jeg ikke søge i bøgernes indhold?”

Lokalt remix
Brugerinvolvering

Nogle svar på spørgsmål, kommentarer og kritik af bibliotek.dk ytret dels på konferencen Brugernes bibliotek, dels i kommentarer til Udviklingsplan 2007 for bibliotek.dk.

Udviklingsplanen er blevet behandlet på møde 13.12.2006 med lederfora i bibliotekerne (det er den afsluttende behandling i Biblioteksstyrelsens høring af udviklingsplanen). Referatet fra dette møde er sendt ud fra Biblioteksstyrelsen den 22. januar 2007 – det indeholder også opsummering og svar på høringen. Jeg har vurderet at det var rimeligt at det officielle svar var sendt ud, inden jeg kommenterer debatten.

Nedenstående er udelukkende kommentarer på egne vegne, men vil formentlig blive offentliggjort på danbib.dk/bibliotek.dk i let redigeret form da der er en generel interesse i nogle af emnerne.

Kirsten Larsen, DBC

”Hvorfor er der ikke bare ét søgefelt ligesom hos Google?”


”brugerne skriger på enkle, google-lignende grænseflader”

”F.eks. er produktdesignet på bibliotek.dk alt for komplekst. Med Amazon.com som benchmark, kan bibliotekerne i dag således ikke engang det, Amazon.com kunne i 1994.”

Opgaven er at give flest mulige brugere det de ønsker med mindst muligt besvær. Hvis vi troede på at en grænseflade med ét søgefelt gav flest muligt det ønskede hurtigst, VAR der kun ét søgefelt. Det er – indtil videre – vores erfaring at brugerne ville bruge mere tid på at finde det de leder efter ved en "Google-like-grænseflade" end den vi har valgt.
Alle der laver grænseflader stræber forhåbentlig efter at lave det bedst mulige, "Danmarks bedste" eller "verdens bedste". Men det er ikke en eksklusiv ret at mene at den løsning man har lavet ER verdens bedste. Og "eksperter" har ikke én mening om hvad der er den bedste løsning.
På DBC har vi brugt et af de største designbureau'er (Framfab) til sammen med DBC at løse designopgaven på bibliotek.dk og derudover har vi brugt en uafhængig konsulent Kim Pedersen.

På Brugernes bibliotek-konferencen gav Thomas Madsen-Mygdal faktisk også en illustration af Google-søgemetodens (og rankeringens) begrænsninger (uden dog at omtale det som et Google-problem). Når han skrev Tor Nørretranders i Google så fik han jo ikke link til bibliotek.dk - 20. januar er det første bibliotek.dk-link hit nr. 22 på google.dk - dårligt!
Jamen hvordan er det nu at Google skal vide hvad en bruger har lyst til at se som de første links?
Og hvorfor er det ikke ”Google der er dårlig”, men bibliotek.dk??

Søgeresultatet ser sådan ud (og er beskrevet ud fra hvordan det ser ud 20.1. – søgt i google.dk).
Der er da nogle gode links til noget der har med Tor Nørretranders at gøre, men hvis nu man var ude efter hans nyeste bog, er den der ikke.
Det er derimod hit nr. 1 hvis man skriver ”tor nørretranders” i forfatterfeltet i bibliotek.dk (og nr. 2 hvis man skriver det i fritekst)
Søgning i bibliotek.dk på forfatter=tor nørretranders
Bogen kan naturligvis også findes i Google hvis man ved hvad den hedder – ellers skal man d.d. bladre hen til hit nr. 69.

Man kan godt i bibliotek.dk søge ”som i Google” – der er et fritekstfelt – men det er ikke placeret som det første og eneste felt fordi det ofte giver en stort søgeresultat. Og vi har så ingen viden om hvad det er brugeren ønsker da der jo i fritekst kan skrives alle typer data fra emner, ord i titler til isbn eller forfatternavne.

Google laver naturligvis også andre søgemuligheder fordi de godt ved at søgningen i det ene felt langtfra altid er lykken. Der er en ”avanceret søgning” (som dog ikke giver muligheder som bibliotek.dk), og så findes der Google Scholar, Google Books osv. Google har valgt disse to grænseflader som dem de lægger biblioteksmaterialer ind i. Når man også finder bibliotek.dk-links via Google, er det fordi vi (og mange andre) laver websider der indekseres af Google – i bibliotek.dk’s tilfælde Emneoversigten.

Går man ind i Google Books og markerer at man vil søge i bibliotekskataloger og bruger den bibliotek.dk-agtige grænseflade til at søge på forfatteren ”tor nørretranders”, ja så vælter bøgerne frem med links til bibliotek.dk. Folkene på Google har altså samme opfattelse som ligger bag de fleste bibliotekskataloger verden over: man tilfredsstiller flest hurtigst ved straks at give mulighed for at præcisere sin søgning. Det kan man hvis man har strukturerede metadata.
Man kan undre sig over hvorfor der er tradition for at kalde formularsøgesider for avanceret søgning. Det kræver jo langt mere at søge præcist hvis man kun har ét søgefelt, og derfor kan blive nødt til at bruge søgelogik og søgekoder hvis man vil have et præcist svar.

Læs evt. mere om bibliotek.dk i Google

Der er i øvrigt ganske mange der alligevel finder de danske biblioteker via Google. Af dem der kommer ind på bibliotek.dk (januar 2007), kommer 20% fra Google.dk og godt 5% fra andre Google-varianter.

Vi bruger alle specialiserede grænseflader mange andre steder – og undres ikke over det.
Når vi skal finde et tog til Hobro på næste lørdag, går vi ikke til Google og skriver Hobro 27.1. og forventer at få et brugbart svar, ligesom vi også accepterer at når vi skal finde et billigt fly til Malaga, skal vi ind i en særlig grænseflade.
Biblioteksgrænseflader minder på mange måder om sådanne databaser eller andre specialiserede baser som fx beskrevet i denne generelle wikipedia-beskrivelse af Vertical search.

Det der er karakteristisk for biblioteksbaser og mange andre baser er: hovedparten af dataene er strukturerede ”metadata” og ikke fuldtekstdata. Det ville da være dejligt hvis alt var digitaliseret, men grænsefladen må indrettes ud fra den virkelighed vi står i nu.
Og vi har ikke adgang til et redskab i stil med "linkpopularitet".

Og prøv så i øvrigt lige at søge på Tor Nørretranders hos Amazon - brugervenligt? - enkelt og overskueligt?
Og både Google og Amazon mangler da vist også at man med ét klik kan se hvor materialet er gratis til rådighed og hjemme i éns nabolag.

”Hvorfor får jeg ikke lige det jeg søger som det første?”

”– hvorfor er søgeresultaterne ordnet efter år og ikke relevans?

Jeg skal søge og det øverste skal være det jeg skal have.”

Hovedproblemet er berørt ovenfor, og jeg kan måske nok dele Kalle Nielsens undren i forhold til Brugernes bibliotek-konferencen:"Thomas Madsen-Mygdal var for mig et frisk pust. Selv om jeg stadig undrer mig over, at personer, som end ikke selv bruger biblioteket, hyres til ukvalificeret at udtale sig om hvad bibliotekerne skal og kunne gøre, så var hans indlæg forfriskende". (Kalle Nielsen)

Men da udsagnet om at "det jeg søger bare skal komme som det første" jævnligt kommer op i andre sammenhænge, fx under betegnelsen ”relevanssortering”, vil jeg give nogle få kommentarer til dette mere specifikt.

Hver gang man laver en sorterings- eller rankeringsalgoritme vælger man naturligvis hvad man synes er vigtigst for brugeren. Ingen af os kan vide hvad der er relevant for en bruger som skriver et eller flere ord i et fritekstsøgefelt. Man kan vælge "forståelige kriterier" som dét der er hjemme vises først, det der er nyest kommer først, posterne kommer alfabetisk efter titlen e.l. Eller man kan vælge rankeringer hvor brugeren ikke umiddelbart kan gennemskue eller ændre på rankeringen som fx Googles rankering efter blandt andet hvor mange der linker til den enkelte side.

Skriver en bruger "einstein" (for nu at blive ved Tor Nørretranders’ nyeste bog) i bibliotek.dk's fritekstsøgefelt, kan det være for at finde netop Nørretranders bog. Det kan også være for at finde bøger af Einstein, og er det en skoleelev der skriver vil Nørretranders bog næppe være det mest relevante. Det giver d.d. 1813 hits, og det er unægtelig en blandet landhandel: søgning på einstein (fritekst)

For et par år siden lavede vi undersøgelser af muligheden for at rankere efter emne; det resulterede i sorteringsmuligheden ”sortér efter emne”, men det er en tilvalgsmulighed da vi ikke kan vide om brugeren søger efter emne, hvis de søger fritekst.

Grænsefladerne i bibliotek.dk indbyder brugerne til at meddele lidt mere end blot ”einstein” – dels ved valg af grænseflade dels ved at give mulighed for at skrive hvilken slags oplysning ”einstein” er. Vælger man musiksøgesiden og skriver det ind i ”titel på cd” får man 12 hit – overskueligt hvis det nu var Philip Glass’ "Einstein on the beach", man var ude efter: einstein som titel på cd

Halvdelen af søgningerne på bibliotek.dk sker på en anden grænseflade end defaultgrænsefladen. Da det aldrig er let at få brugere til at vælge noget andet end default, må det være fordi de kan se at det er nyttigt at gøre det i en lang række søgesituationer.

Statsbiblioteket har forsøgt sig med en ”relevanssortering” som default-sortering. Den kan sikkert give en fornuftig sortering af nogle søgeresultater, men generelt er det svært at se det som overbevisende – her igen søgningen på einstein

DBC havde for en del år siden i et udviklingsarbejde omkring en lignende rankeringsalgoritme, men fandt det ikke overbevisende til anvendelse i baser som DanBib på det tidspunkt. Link til artikler om forsøget

Det andet alternativ kunne være at vælge en sortering efter hvad der er mest ”populært”. Hvilket vil betyde at uanset hvem man er og hvad man leder efter, vil man altid få præsenteret de samme hits øverst. Jeg har svært ved at se nytten af det generelt, men det kan da forsøges som et tilbud (når vi får adgang til en central base over udlånsdata).

I dag har brugeren visse muligheder for personalisering som fx at ønske som default kun materialer på dansk og kun fra folkebiblioteker og ikke lydbøger m.v. Det reducerer "einstein"-søgningen til 295 poster og det kan nok for mange brugere være en fornuftig default-indstilling. Vi fortsætter med udvikling af flere personaliseringsmuligheder.

Hvorfor er bibliotekerne ikke synlige i søgemaskinernes resultater?

Jamen det er de jo også, som demonstreret ovenfor. Hvis man vil have bibliotek.dk-posten blandt de øverste hit, skal man søge mere præcist end ”tor nørretranders” (er der nogen der synes at det er underligt??) fx

Søgning på tor nørretranders at tro på tro

Søgning på hjarvad selskabelige

Det er ikke bibliotekerne der bestemmer hvordan og hvor de vises i Google. Det er Googles valg at de høstede poster kun vises i Google Scholar og kun hvis de matches med poster i Google Scholar. Der er dog et udviklingsprojekt i 2007 der kan bløde lidt op på dette.

”Servicen er designet af en komité” – ”mer' beta”

"… Thomas direkte refererede til bibliotek.dk’ komplekse og 30-sider lange, aktuelle udviklingsplan som har været behandlet i plenum. Verdensklasse designes ikke af komiteer…..Der skal eksperimenteres mere, og eksperimenterne bør foretages af små hold og lanceres med det samme. I gamle dage kunne man gøre tingene færdige, men det kan man ikke længere. Der kommer altid en ny version".

Vi har allerede set projekter, der har været lang tid undervejs, og hvis ideer i og for sig har været velvalgte på starttidspunktet, men som med tiden er blevet overhalet indenom enten af udviklingen eller af træthed i organisationen.

Og i et høringssvar: "Det er tankevækkende, at der for Bibliotek.dk er årlige høringsrunder frem for små eksperimenterende udviklingsiterationer, som virksomheder med succes på nettet har anvendt i mange år som deres udviklingsmetode.

Her er der tale om en ren misforståelse: fordi der faktisk er en åbenhed omkring bibliotek.dk-udviklingen (i modsætning til så mange andre offentlige projekter inklusive bibliotekers udviklingsplaner), betyder det ikke at der kun laves ting som har været til høring. Ligesom projekter kan fjernes hvis de bliver uaktuelle.

Bibliotekerne er leverandører af den service bibliotek.dk giver adgang til. Derfor er det naturligvis absolut rimeligt at Biblioteksstyrelsen vælger at drøfte med dem hvordan bibliotek.dk udvikler sig. Fx at der kun to gange har været markedsføringskampagner i større stil fordi bibliotekerne ganske enkelt havde svært ved at følge med det stærkt stigende antal bestillinger. Bestillingsstatistik

Fx at de har været med til at prioritere projekter der har fokus på samspillet med bibliotekerne højt.

Jeg har ikke set nogen praktiserende biblioteksfolk udtale at tiden er forpasset for "tunge" projekter som værkvisning og automatisering af fjernlån selvom projekterne er flerårsprojekter.

Og det kunne være rigtig fint hvis Statsbiblioteket som har specielle forpligtelser som overcentral i lånesamarbejdet på samme måde prioriterede "samspilsprojekter" så det ikke i dag var det eneste store bibliotek som ikke kan levere "holdings" til visning af udlånsstatus i bibliotek.dk og DanBib, og endnu mere afgørende for bibliotekernes arbejde og for brugernes tilfredshed: til automatisering af fjernlån.
På grund af en i starten udbredt skepsis eller forsigtighed over for bibliotek.dk har Biblioteksstyrelsen valgt denne model med rådgivende udvalg og høringer af udviklingsplanen. Noget kunne tyde på at stemningen i dag er sådan at det ikke er nødvendigt at det er en stor projektliste der sendes i høring, men mere er nogle hovedprincipper og ideer. Men modellen er altså opstået efter ønske fra og i samarbejde med bibliotekerne.

Udviklingsplanen lægger nogle rammer for udviklingen, men i løbet af året laves mange ting som ikke står på udviklingsplanen.

Slutbrugerne inddrages i form af brugerundersøgelser, forslag og kommentarer fra enkeltbrugere samt inddragelse i næsten alle større ændringer.
Mange slutbrugere vil have oplevet at noget de har foreslået, sættes i drift samme dag som de har foreslået det. Når det ikke drejer sig om noget der berører infrastrukturen, er det ganske uproblematisk.
Læs evt. mere om bibliotek.dk brugerundersøgelser og metoder.
Andre gode ideer udføres i løbet af få dage eller uger efter aftale med Biblioteksstyrelsen. Nogle ting sættes i drift for at prøve om det virker efter hensigten - uden at fortælle brugerne om det. Fx den stavehjælp som har været i drift siden december, og som vi ved skal udvides med flere og flere faciliteter efterhånden. Og så skruer vi på funktionen alt efter hvad vi kan se fx i 0-hit-log og belastning, og hvad vi får af brugerkommentarer.
Det kunne da være herligt hvis vi fik 10 millioner om året og selv kunne bestemme hvad de blev brugt til, men sådan spiller klaveret ikke i forhold til bibliotek.dk.

MEN, vi kan ikke arbejde som Google med den infrastrukturelle del af bibliotek.dk. Hvis Google lancerer noget i en beta-version som ikke fungerer, har brugerne ingen grund til at klage. Det er jo gratis, og betales heller ikke over skatten – og der findes andre søgemaskiner.
Bibliotek.dk finansieres af de danske borgere, der er kun ét bibliotek.dk, og det er medarbejdere ved de danske biblioteker det går ud over hvis vi ikke tester ordentligt. Den største bestillingsmodtager, Københavns Kommunes Biblioteker, modtager når det går højest knap 30.000 bestillinger/viderestillinger fra bibliotek.dk på en måned. Dér skal ikke laves nogen kiksede forsøg før både medarbejdere og brugere bliver aldeles rasende!

”Bibliotekerne stiller papirbaserede materialer til rådighed”
”Hvorfor kan jeg ikke søge i bøgernes indhold?”

Disse temaer er der næppe nogen i biblioteksvæsenet som ikke kan svare på, men for en ordens skyld: bibliotekerne udlåner masser af andre materialer end ”papirmaterialer” og de giver adgang til meget net-baseret materiale via licenser. Bibliotek.dk har – udover alle de udmærkede bøger, tidsskrifter og artikler også ca. 200.000 netdokumenter og godt 300.000 musikmaterialer – og en masse andre materialer.
Den danske restriktive ophavsret er vel ikke bibliotekernes ansvar. Det ville være dejligt med mere digitalisering, men et statsligt site er næppe stedet der skal ignorere ophavsretslovgivningen.

Lokalt remix

”Dertil er det nødvendigt at teknologiudviklingen er decentral, og at de decentrale ting udnyttes centralt så snart de foreligger i den første udgave. Grundlaget i form af spændende datakilder som brugerregistre og logs over brugeradfærd ligger i dag helt ubrugt hen og kunne være basis for mange spændende formidlingsfunktioner der kunne fungere i en fremtidig smidig udgave af bibliotek.dk. Bibliotek.dk kunne således findes i en lang række remixede udgaver – biblioteksverdenen har nemlig et stort potentiale for at tiltrække idealistiske og højt kompetente it-udviklere, som brænder for at formidle data på nye måder og som ikke er interesserede i at bidrage til store kommercielle foretagender, som holder sine data tæt til kroppen. Det er altså ikke nok på traditionel vis at markedsføre bibliotekernes tjenester - hele infrastrukturen for tjenesterne skal gøres så smidig, at de markedsfører sig selv i kraft af at de kan anvendes i mange forskellige sammenhænge på mange forskellige måder.” citat fra avisen.dk

Vist nærmest siden bibliotek.dk startede har det været muligt at linke til konkrete søgninger eller konkrete poster i bibliotek.dk - Linkme-syntaks

I mere end et halvt år har det været muligt at afprøve en webservice til bibliotek.dk, men endnu har ingen biblioteker afprøvet den (eller har i hvert fald ikke meldt noget tilbage om afprøvningen) - bibliotek.dk webservice

Afprøvningen har bevidst fokuseret på bibliotekssektoren samt dem der har henvendt sig af egen drift for at sikre at denne målgruppe kunne bruge den.

”Andre der har lånt….” Det ville være herligt at kunne komme videre med at eksperimentere med dette. Det kræver imidlertid at projektet "Mit bibliotek" stiller servicen og projektets erfaringer til rådighed for andre i et åbent grænsesnit - det er endnu ikke sket. For at blive rigtig interessant for bibliotek.dk skal vi have fat på en langt større mængde udlånsdata, men det burde heller ikke være et problem.

Brugerinvolvering

Desværre kom konferencen Brugernes bibliotek næsten ikke til at handle om brugerinvolvering på det mere konkrete plan som fx rating, kommentarer eller tagging, men om det overordnede tema "Overlever bibliotekerne?" som jo også er ganske vigtigt ;-)
Der er givet delte meninger om brugerindvolvering i bibliotekskredse – se opsamlingen af høringssvar i
referat fra møde om udviklingsplanen.
Men der er afsat ressourcer til forsøg på Udviklingsplan for 2007. Brugerne af bibliotek.dk er særdeles kommunikationsivrige. Det har vi glæde af både ved brugerundersøgelser, udvikling af ny funktionalitet og henvendelser om store og små ting i det daglige. Derfor ville det være spændende om de også kunne berige bibliotek.dk på anden vis.