Visning og sortering i bibliotek.dk

Sidst opdateret: 11.9.2019

OpenFormat
Visformat - Værkvisning
Udfoldet format
Rækkefølge ved visning af flere poster inden for et værk
Bestilling af værk og konkret udgave
Sortering og rankering
bibliotek.dk’s rankeringsalgoritmer

bibliotek.dk's poster ligger i Brønd 3.5. De formateres til visning af webservicen OpenFormat. Posterne hentes i MarcXchange hvis de findes i dette format - ellers i DKABM.
Grænsefladen er en Drupal-grænseflade. I administrationsmodulet til denne ligger en lang række funktioner også ang. visformaterne, fx hvilke ledetekster der skal vises og rækkefølgen på dataelementerne.

OpenFormat

OpenFormat er en webservice, der danner forskellige visningsformater og konverterer fra et marc-format til et andet. Som input skal servicen have en bibliografisk post i form af XML, det kan være i DKABM og/eller MarcXchange format. Ud over de bibliografiske data skal der medsendes information om, hvilket visningsformat man ønsker formateret.

OpenFormat kan med fordel benyttes indirekte via OpenSearch, hvor man allerede i søgningen angiver, hvilket visningsformat de fremsøgte poster skal formateres til.

Visformat - Værkvisning

4 niveauer i værkvisning som den bruges i bibliotek.dk


Værk: øverste niveau der viser de fælles data for de poster der er værkmatchet. Ikoner viser hvilke mellemværker der er matchet (overordnede materialetyper).
Mellemværk: betegner den overordnede materialetype. I bibliotek.dk viser hvert ikon en mellemværkstype:
Bøger - Lydbøger - Musik - Noder - Net - Film - Spil - Artikler - Andet
Underværk: Inden for hvert mellemværk kan der være flere forskellige materialetyper. Fx kan musik være grammofonplade, cd, bånd, netversion m.m. I bibliotek.dk vises underværkerne under hver mellemværksfane. Underværk er de specifikke materialetyper. I bibliotek.dk tilbydes brugeren at bestille på underværkniveau ("uanset udgave"). Det betyder altså at man kan bestille en musik-cd eller en bog på underværkniveau hvis man ønsker en hvilken som helst udgave. Men man kan ikke bestille et værk uanset form (på VHS, blu-ray, dvd, net) da det næppe er det hyppigst forekommende ønske.
Manifestation: én konkret udgave af et værk fx én bestemt udgave af en musik-cd. I bibliotek.dk ses som udgangspunkt kun én manifestation for hver underværktype. Alle manifestationer kan ses ved klik på "Vis alle udgaver", således at brugeren får mulighed for at bestille en eksakt udgave.

 

Posterne vises først i et helt kort format, som kan udfoldes til stort format ved klik på titlen.
Brugeren kan efter login på Min side/Mine indstillinger vælge, om man ønsker det udfoldede format som standard.
Posterne vises i bibliotek.dk værkmatchet. Det vil sige, at forskellige udgaver og i et vist omfang forskellige materialetyper søges matchet sammen i ét værk.
Læs mere om værkmatch og principperne for hvad der matches sammen.

Kort format

I det korte format vises titel og ophav samt sprog, hvis dette ikke er dansk.
Hvis man ikke ønsker en bestemt udgave, kan man blot bestille fra det korte format ved at klikke på Vælg og bestil, og dernæst vælge Bestil ud for den materialetype man ønsker at bestille, fx en bog eller en lydbog.

Udfoldet format

I det store format ses på værkniveau:

  • emne
  • indholdsnote
  • fanen Inspiration (Find titler der ligner, Læs mere om forfatteren)
  • fanen Anmeldelser (Materialevurdering (vises først ½ år efter publicering), Anmeldelser incl. links til Infomedia)


Efter oplysningerne på værkniveau kommer de forskellige materialetyper.
For hver materialetype vises kun én udgave - andre udgaver kan foldes ud ved klik på Vis alle udgaver.
For hver materialetype vises Se hvilke biblioteker der har materialet - primært til orientering. Det er lettest for brugeren at bruge bestillingsfunktionen i bibliotek.dk og ikke bruge links til de lokale kataloger.
Herudover er der to formater til brug ved eksport af data til referenceværktøjer: ris og refWorks.

Flerbindsværker
Flerbindsværker er formateret i op til tre niveauer (bind-, sektions- og hovedniveau), så det er muligt for brugergrænsefladen at præsentere data hørende til det enkelte niveau for sig selv. Ligeledes er ved musikindspilninger med flere komponisters værker, hvert sammenhørende sæt af komponist, titel, udøver mv. samlet, så de kan præsenteres samlet.

Videresøgning
Relevante videresøgningsmuligheder er formateret, så de består af henholdsvis data til videresøgning og data til visning. Det vil bl.a. være forfatter, emne, serie, målgruppe, klassemærke. Brugergrænsefladen kan vælge at præsentere disse som klikbare links eller blot præsentere visningsdata.

Titler der ligner - Læs om ophavet
Til bibliotek.dk dannes også data til søgning på titler der ligner og om ophavet. Bemærk, at der kan være relationer tilhørende den bibliografiske post, link til infomedia, henvisninger til fx filmatiseringer af eller anmeldelser af titlen. Relationerne kan således indeholde supplerende muligheder som ikke fremgår af visningsformateringen.

Anbefalinger på baggrund af den aktuelle post

I bunden af hver post vises anbefalinger til andre materialer. Anbefalingerne er baseret på data om brugeradfærd.

Rækkefølge ved visning af flere poster inden for et værk

Rækkefølge af materialetyper inden for ét værk
Rækkefølgen af materialetyper inden for ét værk er som hovedregel alfabetisk.
For at undgå at brugere utilsigtet bestiller en mindre brugt materialetype er der lavet to undtagelser:
Når bånd (kassettebånd, spolebånd) er involveret, sorteres de til sidst - altså efter fx cd.
Når blu-ray er involveret, sorteres de til sidst - altså efter dvd.

Rækkefølge ved visning af flere udgaver inden for samme materialetype
Skønlitteratur: rækkefølgen bestemmes af antal lokaliseringer. Den post der har flest lokaliseringer vises øverst og dernæst i faldende antal. Dog ligger bogklubudgaver og særudgaver altid sidst.
Indspillet musik: rækkefølgen bestemmes af antal lokaliseringer. Den post der har flest lokaliseringer vises øverst og dernæst i faldende antal.
Faglitteratur: nyeste post øverst, dernæst faldende efter årstal.

For hver udgave vises de udgavespecifikke oplysninger
Fx indhold, emner, titel, ophav, materialetype, udgiver, udgivelsesår, evt. serie, omfang, opstilling i folkebiblioteker m.m.

Til højre for posten vises i den udfoldede post forskellige link (afhængig af den konkrete posts muligheder):

  • Bestilknap (mangler ved gratis e-ressourcer og e-bøger eller andet som ikke kan bestilles)
  • Gem i huskelisten (og bestille senere)
  • Download til referencesystemer
  • Er materialet hjemme på dine favoritbiblioteker (grønne-gule-røde lamper) (kræver at man er logget ind)

Bestilling af værk og konkret udgave

I bibliotek.dk kan brugeren bestille på værkniveau og en konkret udgave. Læs mere om dette ovenfor og her:
http://www.danbib.dk/index.php?doc=bibdkbestil_vaerk.

Sortering og relevansrankering

Bibliotek.dk bruger som standardsortering en slags relevansrankering. Hermed en forklaring af begreberne sortering og rankering og den bagvedliggende teknik. OBS! Over for slutbrugerne bruger vi udtrykket sortering om både sortering og rankering.

Sortering
Ved sortering forstår vi ordning af poster efter et princip, som betyder, at den samme mængde poster sorteres på samme måde, uanset hvordan brugeren er kommet frem til dem. Sorteringsnøglen fastlægges ved indlæggelsen af posten. Mest brugt til fx sortering alfabetisk efter forfatter eller titel og sortering efter år/dato/indlæggelsestidspunkt.

Rankering
Kan defineres som alle de mere dynamiske metoder hvor en sorteringsnøgle IKKE kan fastsættes ved indlæggelse af posten, og hvor resultatet afhænger af brugerens søgeudtryk. Fx rankering efter popularitet (mest udlånte, højest ratede osv.), efter tilgængelighed eller den måske mest brugte ”relevansrankering”.

Relevansrankering
I princippet defineret som: brugeren får øverst i søgeresultatet det der er mest relevant for brugeren.
Dette kan udmøntes på mange forskellige måder. Det kan være det mest populære, men er hyppigt et mix af flere ting, herunder forskellige former for tekstmatchning. Man sikrer, at poster indeholdende søgeordene bestemte steder i posten eller dokumentet (evt. flere gange), optræder før poster der indeholder søgeordene andre steder/færre gange. Altså et match i forhold til den opsatte algoritme – ikke nødvendigvis noget der har noget som helst med relevans for brugeren at gøre.
I systemer med énbokssøgning forsøger man ofte at lave én relevansrankeringsalgoritme, som kan tage højde for at det, brugeren skriver, kan være en forfatter, en titel eller et emne (eller noget fjerde).

bibliotek.dk’s rankeringsalgoritmer

Fordi relevansrankeringsalgoritmer som både skal tage højde for alle typer input, og skal fungere udelukkende på metadata, ikke synes særlig vellykkede, bruger vi en anden model:

  1. vi laver tre forskellige rankeringsalgoritmer til henholdsvis forfatter- , titel-, og emnesøgninger
  2. vi laver en mekanisme som gætter på om brugeren søger en forfatter, en titel eller et emne
  3. vi kobler de to ting, og rankerer posterne efter det bedste bud på hvad brugeren leder efter.

Rankeringsalgoritmer for forfatter, emner og titler
Algoritmerne er udarbejdet på denne måde:

  1. Vi finder en lang række søgninger efter henholdsvis forfatter, emner, titler
  2. Vi ser på søgeresultatet og markerer posternes relevans ud fra et defineret søgebehov (mulighed for at give 9 points for højeste relevans ned til 0 point for ingen relevans). En del af søgningerne og markeringerne er lavet af slutbrugere, andre af DBC.
  3. Vi eksperimenterer med sammensætning af rankeringsalgoritmen på testsøgningerne og deres relevansmarkering, indtil vi finder den som på de samlede søgninger giver det bedste resultat: flest af de højest ratede poster øverst i søgeresultatet
  4. Resultatet er tre forskellige relevansrankeringsalgoritmer for henholdsvis forfattersøgninger, titelsøgninger og emnesøgninger.


Funktionen der gætter på hvad brugeren søger efter
Arbejdet med denne funktion er sket på denne måde:

  1. Ethvert søgeresultat leverer en optælling af forekomst af søgeordet/søgeordene i henholdsvis forfatter-, titel, og emneordsindeks.
  2. Ud fra et større antal testsøgninger (som vi har defineret som enten forfatter-, titel-, eller emnesøgninger) ser vi på om antal forekomster i indekser alene kan fortælle hvilken type søgning der er tale om
  3. Det kan den ikke. Vi har derfor arbejdet med en forskellig vægtning af forekomst i forfatter-, titel-, og emneindekser og testet, hvornår flest søgninger blev gættet rigtigt.
  4. Den vægtning vi indtil videre bruger er forfatter=1 , titel ganges med 2, emne ganges med 6.
  5. Det giver på testmaterialet en succesrate på 80%. De søgninger der typisk fejler, er titelsøgninger der består af navne som fx ”peter pedal” (fejler vil her sige at der ikke vælges den optimale relevansrankering).

Brugergrænseflade
Som udgangspunkt rankerer vi posterne med den funktion som er beskrevet ovenfor. Brugeren får en besked:
Vælg evt. en anden sortering, fx nyeste først.

På de udvidede søgesider med feltsøgning får man naturligvis forfatterrankeringen, hvis man udelukkende har søgt i et forfatterfelt og tilsvarende med titler og emner. Vi har defineret valg af rankering, hvis brugeren indtaster data i flere felter. Søgeudtryk i kommandosøgning behandles på samme måde.

Se også ovenfor om sortering inden for en værkklynge.
Vær opmærksom på at værkmatch kan forstyrre sorteringsbilledet, fordi det måske blot er én udgave i en værkklynge som medfører at posten sorteres som den gør.