Visning og sortering i bibliotek.dk

Sidst opdateret: 12.01.2016

OpenFormat
Visformat - Værkvisning
Udfoldet format
Rækkefølge ved visning af flere poster inden for et værk
Bestilling af værk og konkret udgave
Sortering og rankering
bibliotek.dk’s rankeringsalgoritmer

bibliotek.dk's poster ligger i Brønd 3. De formateres til visning af webservicen OpenFormat. Posterne hentes i MarcXchange hvis de findes i dette format - ellers i DKABM.
Grænsefladen er en Drupal-grænseflade. I administrationsmodulet til denne ligger en lang række funktioner også ang. visformaterne, fx hvilke ledetekster der skal vises og rækkefølgen på dataelementerne.

OpenFormat

Er en webservice der danner forskellige visningsformater, konverterer fra et marc-format til et andet. Som input skal servicen have en bibliografisk post i form af XML, det kan være i DKABM og/eller MarcXchange format. Ud over de bibliografiske data skal der medsendes information om hvilket visningsformat man ønsker formateret.

OpenFormat kan med fordel benyttes indirekte via OpenSearch, hvor man allerede i søgningen angiver hvilket visningsformat de fremsøgte poster skal formateres til.

Visformat - Værkvisning

Posterne vises først i et helt kort format, som kan udfoldes til stort format ved klik på titlen.
Brugeren kan - efter login - på Min side - Mine indstillinger vælge om man ønsker det udfoldede format som standard.
Posterne vises i bibliotek.dk værkmatchet. Det vil sige at forskellige udgaver og i et vist omfang forskellige materialetyper søges matchet sammen i ét værk.
Læs mere om værkmatch og principperne for hvad der matches sammen.

Kort format

I det korte format vises titel og ophav samt sprog hvis dette ikke er dansk.
Hvis man ikke ønsker en bestemt udgave, er det muligt at bestille fra det korte format ved at klikke på Vælg og bestil, og dernæst vælge Bestil ud for den materialetype man ønsker at bestille, fx en bog eller en lydbog.

Udfoldet format

I det store format ses på værkniveau:

  • emne
  • indholdsnote
  • fanen Inspiration (Find titler der ligner, Andre der har lånt, Læs mere om forfatteren)
  • fanen Anmeldelser (Materialevurdering (vises først ½ år efter publicering), Anmeldelser incl. links til Infomedia samt Brugerratings)


Efter oplysningerne på værkniveau kommer de forskellige materialetyper.
For hver materialetype vises kun én udgave - andre udgaver kan foldes ud ved klik på Vis alle udgaver.
For hver materialetype vises Se hvilke biblioteker der har materialet - primært til orientering. Det er lettest for brugeren at bruge bestillingsfunktionen i bibliotek.dk, og ikke bruge links til de lokale kataloger.
Herudover er det to formater til brug ved eksport af data til referenceværktøjer: ris og refWorks.

Flerbindsværker
Flerbindsværker er formateret i op til tre niveauer (bind-, sektions- og hovedniveau), så det er muligt for brugergrænsefladen at præsentere data hørende til det enkelte niveau for sig selv. Ligeledes er ved musikindspilninger med flere komponisters værker, hvert sammenhørende sæt af komponist, titel, udøver mv. samlet så de kan præsenteres samlet.

Videresøgning
Relevante videresøgningsmuligheder er formateret, så de består af henholdsvis data til videresøgning og data til visning. Det vil bl.a. være forfatter, emne, serie, målgruppe, klassemærke. Brugergrænsefladen kan vælge at præsentere disse som klikbare links eller blot præsentere visningsdata.

Titler der ligner - Læs om ophavet
Til bibliotek.dk dannes også data til søgning på titler der ligner og om ophavet. Bemærk at der kan være relationer tilhørende den bibliografiske post, link til infomedia, henviser til fx filmatiseringer af eller anmeldelser af titlen. Relationerne kan således indeholde supplerende muligheder som ikke fremgår af visningsformateringen.

Rækkefølge ved visning af flere poster inden for et værk

Rækkefølge af materialetyper inden for ét værk
Rækkefølgen af materialetyper inden for ét værk er som hovedregel alfabetisk.
For at undgå at brugere utilsigtet bestiller en mindre brugt materialetype er der lavet to undtagelser:
Når bånd (kassettebånd, spolebånd) er involveret, sorteres de til sidst - altså efter fx cd.
Når blu-ray er involveret, sorteres de til sidst - altså efter dvd.

Rækkefølge ved visning af flere udgaver inden for samme materialetype
Skønlitteratur: rækkefølgen bestemmes af antal lokaliseringer. Den post der har flest lokaliseringer vises øverst og dernæst i faldende antal. Dog ligger bogklubudgaver og særudgaver altid sidst.
Indspillet musik: rækkefølgen bestemmes af antal lokaliseringer. Den post der har flest lokaliseringer vises øverst og dernæst i faldende antal.
Faglitteratur: nyeste post øverst, dernæst faldende efter årstal.

For hver udgave vises de udgavespecifikke oplysninger
fx indhold, emner, titel, ophav, materialetype, udgiver, udgivelsesår, evt. serie, omfang, opstilling i folkebiblioteker m.m.

Til højre for posten vises i den udfoldede post forskellige link (afhængig af den konkrete posts muligheder):

  • Bestilknap (mangler ved gratis e-ressourcer og e-bøger eller andet som ikke kan bestilles)
  • Gem i huskelisten (og bestille senere)
  • Download til referencesystemer
  • Er materialet hjemme på dine favoritbiblioteker (grønne-gule-røde lamper) (kræver at man er logget ind)

Bestilling af værk og konkret udgave

I bibliotek.dk kan brugeren bestille på værkniveau og en konkret udgave. Læs mere om dette ovenfor og her:
http://www.danbib.dk/index.php?doc=bibdkbestil_vaerk.

Sortering og relevansrankering

Bibliotek.dk bruger fra 29.1.2015 som standardsortering en slags relevansrankering. Hermed en forklaring af begreberne sortering og rankering og den bagvedliggende teknik. OBS! Over for slutbrugerne bruger vi udtrykket sortering om både sortering og rankering.

Sortering
Ved sortering forstår vi ordning af poster efter et princip som betyder at den samme mængde poster sorteres på samme måde uanset hvordan brugeren er kommet frem til dem. Sorteringsnøglen fastlægges ved indlæggelsen af posten. Mest brugt til fx sortering alfabetisk efter forfatter eller titel og sortering efter år/dato/indlæggelsestidspunkt. Bibliotek.dk har til og med januar 2015 brugt sortering efter år/dato som standardsortering. De hidtidige sorteringsmetoder kan stadig vælges når posterne vises.

Rankering
Kan defineres som alle de mere dynamiske metoder hvor en sorteringsnøgle IKKE kan fastsættes ved indlæggelse af posten, og hvor resultatet afhænger af brugerens søgeudtryk. Fx rankering efter popularitet (mest udlånte, højest ratede osv.), efter tilgængelighed, eller den måske mest brugte ”relevansrankering”.

Relevansrankering
I princippet defineret som: brugeren får øverst i søgeresultatet det der er mest relevant for brugeren.
Dette kan udmøntes på mange forskellige måder. Det kan være det mest populære, men er hyppigt et mix af flere ting, herunder forskellige former for tekstmatchning. Man sikrer at poster indeholdende søgeordene bestemte steder i posten eller dokumentet (evt. flere gange) optræder før poster der indeholder søgeordene andre steder/færre gange. Altså et match i forhold til den opsatte algoritme – ikke nødvendigvis noget der har noget som helst med relevans for brugeren at gøre.
I systemer med énbokssøgning forsøger man ofte at lave én relevansrankeringsalgoritme som kan tage højde for at det brugeren skriver kan være en forfatter, en titel eller et emne (eller noget fjerde).

bibliotek.dk’s rankeringsalgoritmer

Fordi relevansrankeringsalgoritmer som både skal tage højde for alle typer input, og skal fungere udelukkende på metadata, ikke synes særlig vellykkede, bruger vi en anden model:

  1. vi laver tre forskellige rankeringsalgoritmer til henholdsvis forfatter- , titel-, og emnesøgninger
  2. vi laver en mekanisme som gætter på om brugeren søger en forfatter, en titel eller et emne
  3. vi kobler de to ting, og rankerer posterne efter det bedste bud på hvad brugeren leder efter

Rankeringsalgoritmer for forfatter, emner og titler
Algoritmerne er udarbejdet på denne måde:

  1. Vi finder en lang række søgninger efter henholdsvis forfatter, emner, titler
  2. Vi ser på søgeresultatet og markerer posternes relevans ud fra et defineret søgebehov (mulighed for at give 9 point for højeste relevans ned til 0 point for ingen relevans). En del af søgningerne og markeringerne er lavet af slutbrugere, andre af DBC.
  3. Vi eksperimenterer med sammensætning af rankeringsalgoritmen på testsøgningerne og deres relevansmarkering indtil vi finder den som på de samlede søgninger giver det bedste resultat: flest af de højest ratede poster øverst i søgeresultatet
  4. Resultatet er tre forskellige relevansrankeringsalgoritmer for henholdsvis forfattersøgninger, titelsøgninger og emnesøgninger.

Disse tre rankeringsalgoritmer har i knapt ½ år været tilgængelig for afprøvning på bibliotek.dk i sorteringsmenuen: Jeg leder efter en titel – Jeg leder efter et emne – Jeg leder efter en forfatter. De findes stadig i sorterings-rullemenuen og kan bruges.

Funktionen der gætter på hvad brugeren søger efter
Arbejdet med denne funktion er sket på denne måde:

  1. Ethvert søgeresultat leverer en optælling af forekomst af søgeordet/søgeordene i henholdsvis forfatter-, titel, og emneordsindeks.
  2. Ud fra et større antal testsøgninger (som vi har defineret som enten forfatter-, titel-, eller emnesøgninger) ser vi på om antal forekomster i indekser alene kan fortælle hvilken type søgning der er tale om
  3. Det kan den ikke. Vi har derfor arbejdet med en forskellig vægtning af forekomst i forfatter-, titel-, og emneindekser, og testet hvornår flest søgninger blev gættet rigtigt.
  4. Den vægtning vi indtil videre bruger er forfatter=1 , titel ganges med 2, emne ganges med 6.
  5. Det giver på testmaterialet en succesrate på 80%. De søgninger der typisk fejler, er titelsøgninger der består af navne som fx ”peter pedal” (fejler vil her sige at der ikke vælges den optimale relevansrankering).

Brugergrænseflade
Som udgangspunkt rankerer vi posterne med den funktion som er beskrevet ovenfor. Brugeren får en besked:
Posterne er sorteret ud fra at en forfatter/en titel/et emne er vigtigst. Vælg anden sortering hvis denne sortering ikke passer dig.

På de udvidede søgesider med feltsøgning får man naturligvis forfatterrankeringen hvis man udelukkende har søgt i et forfatterfelt og tilsvarende med titler og emner. Vi har defineret valg af rankering hvis brugeren indtaster data i flere felter. Søgeudtryk i kommandosøgning behandles på samme måde.

Se også ovenfor om sortering inden for en værkklynge.
Vær opmærksom på at værkmatch kan forstyrre sorteringsbilledet fordi det måske blot er én udgave i en værkklynge som medfører at posten sorteres som den gør.