danMARC2 tegnrepertoiret

Sidst opdateret: 15.05.2012

Tegnrepertoiret tager udgangspunkt i ISO 8859-1 (også kaldet Latin-1). Dette tegnsæt rummer de almindeligt brugte vesteuropæiske tegn, herunder de danske æ, ø og å. Det mangler imidlertid en række tegn, som ofte benyttes i bibliografiske poster, fx græske tegn.

Ved at benytte en særlig metode er det gjort muligt tillige at repræsentere alle tegn fra multioktet tegnsættet ISO 10646 (også kendt som Unicode). Omvendt kan ethvert tegn i danMARC2 tegnrepertoiret oversættes til et Unicode-tegn.

Metoden er beskrevet i danMARC2s bilag K:
danMARC2 character repertoire (åbner i nyt vindue)

En uddybende beskrivelse på dansk:
danMARC2 tegnrepertoiret (pdf - åbner i nyt vindue)


Ovenstående erstatter:
DanBib, tegnrepertoire, referencetegnsæt og kodning (pdf - åbner i nyt vindue)


Note vedrørende Basis

Basis har altid kørt med et meget begrænset udsnit af danMARC2 tegnrepertoiret. Udsnittet svarer så nogenlunde til tegnmængden i det gamle fællestegnsæt fra tiderne før det nuværende danMARC2 tegnrepertoire.

Nogle af de seneste ændringer berører imidlertid dette udsnit, men er endnu ikke implementeret i Basis. Det betyder at både dataleverancer og indberetninger fortsat skal ske efter den hidtidige praksis angivet i DanBib, tegnrepertoire, referencetegnsæt og kodning (pdf - åbner i nyt vindue).

Ændringerne skal naturligvis implementeres i Basis, og på sigt skal hele tegnrepertoiret kunne håndteres.
Terminer herfor vil blive udmeldt, når de er fastlagt.