DBC-høstning fra bibliotekers OAI-repositorier (p.t. kun til bibliotek.dk)

Formål

DBC tilbyder nu at sætte en OAI-høstning af et biblioteks repositorie op.

En OAI-høstning fra et FFU-biblioteks repositorium vil gå i stedet for den velkendte afleveringsmetode via ftp bestående af en datafil og en transfil sendt fra biblioteket til DBC's posthus.

P.t. vil en høstning kun opdatere indholdet i brønden (bibliotek.dk).

DanBib vil fortsat skulle opdateres via ftp til DBC's posthus, indtil DanBib migreres til brønd-miljøet i løbet af 2017

Forudsætninger

En aftale om automatisk DBC-høstning fra et biblioteks OAI-repositorium indebærer , at repositoriet kan opfylde følgende betingelser.

Tilgang:

Repositoriet skal være tilgængeligt via en stabil URL og skal kunne tilgåes døgnet rundt.

DBC skal på forhånd orienteres om eventuelle ændringer i adgangsbetingelser,  indholdsstruktur samt evt (midlertidig) nedtagning.

Samling(er):

Samlinger, der skal høstes af DBC, skal have stabile navne indeholdende det ISIL-biblioteksnummer, posterne skal kendes under i fælleskatalogen.

Der skal være en separat samling pr. biblioteksnummer, hvis repositoriet indeholder poster fra flere biblioteksnumre.

Numrene skal korrespondere med biblioteksoplysninger i VIP-basen.

Rammeformat:

Posterne skal være være tilgængelige i XML (danmarcXchange: http://slks.dk/fileadmin/user_upload/dokumenter/bibliotek/Standarder/Katalogisering_og_metadata/Guidelines_for_exchange_of_danMARC2_records_in_MarcXchange.pdf)

Indholdsformat:

Indholdsformatet skal være de officielle felter i danMARC2 (http://www.kat-format.dk/danMARC2/).

Tegnsæt:

XML-posterne skal være i UTF8.

Det gælder alle tegn og dermed også de tegnværdier, der i DanBib-tegnsættet er repræsenteret via @-encoding.

Vær derfor opmærksom på fx. uncombined underscore i URL'er. Dette tegn skal være repræsenteret som den rigtige Unicode-værdi og ikke @0332

Delete-poster:

1) Metode 1

Poster, der ønskes slettet i DanBib/bibliotek.dk, kan oplægges med danMARC2-poststatuskoden 004 *rd.

2) Metode 2

DELETE-markering uden metadata (især for Aleph-biblioteker) - et eksempel fra KB:

<?xml version="1.0" encoding="UTF-8"?>
    <record xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
        <header status="deleted">
            <identifier>urn:repox.ist.utl.pt:marcX810010:oai:rex.kb.dk:KGL01-008927231</identifier>
            <datestamp>2016-07-01</datestamp>
            <setSpec>marcX810010</setSpec>
        </header>
        <about>
            <oaiProvenance:provenance xmlns:oaiProvenance="http://www.openarchives.org/OAI/2.0/provenance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/provenance http://www.openarchives.org/OAI/2.0/provenance.xsd">
                <oaiProvenance:originDescription altered="true" harvestDate="2016-07-01">
                    <oaiProvenance:baseURL>http://aleph-00.kb.dk/OAI</oaiProvenance:baseURL>
                    <oaiProvenance:identifier>oai:rex.kb.dk:KGL01-008927231</oaiProvenance:identifier>
                    <oaiProvenance:datestamp>2016-07-01</oaiProvenance:datestamp>
                    <oaiProvenance:metadataNamespace>http://www.loc.gov/MARC21/slim</oaiProvenance:metadataNamespace>
                </oaiProvenance:originDescription>
            </oaiProvenance:provenance>
        </about>
    </record>

Hoved-bind-poster:

Strukturen er endnu ikke afklaret i forhold til, om der skal benyttes embedning af eller linkning mellem postniveauer

Opdateringer/Totaler:

Det skal være muligt kun at høste poster, der er nye/rørt siden sidste høstning.

Repositoriet skal kunne acceptere angivelser af både Fra-dato og Til-dato i én forespørgsel.

Validering:

Posterne vil blive valideret efter det officielle danMARC2-format.

Returmails vedr. høstningen - inkl. fejlede poster - vil blive sendt til mailadresser hentet i VIP under Vejviser pkt. D Returmail: afviste poster og Returmail: dataoverførsler