B3Kat - Open Data

Der gemeinsame Verbundkatalog B3Kat des Bibliotheksverbundes Bayern (BVB) und des Kooperativen Bibliotheksverbundes Berlin-Brandenburg (KOBV) umfasst mehr als 27 Millionen bibliografische Datensätze der Universitäts-, Hochschul- und vieler weiterer Bibliotheken Bayerns, Berlins und Brandenburgs. Die Veröffentlichung erfolgt unter der Creative Commons License CC0 im Datenformat MARCXML mit den für Deutschland vereinbarten Konventionen.

Regional definierte MARC21-Felder, spezielle Feldbelegungen:

001 B3Kat-ID (Beispiel: BV018229257)
049 Besitznachweis (ISIL), vgl. die Übersicht der am B3Kat beteiligten Bibliotheken
940 Ind.1 = 1 Regionale und lokale Kodierungen (MAB 078)
  Unterfeld f: Selektionskennzeichen Sprachkreis
  Unterfeld n: Selektionskennzeichen bibliotheksübergreifende Bibliographien und Projekte
  Unterfeld q: Bibliotheksspezifische Selektionskennzeichen
940 Ind.1 = 2 Unterfeld r: ISIL der redigierenden Bibliothek (VD18-Kontext, MAB 088 Unterfeld r)
999 OAI-Identifier des Datensatzes (Beispiel: oai:aleph.bib-bvb.de:BVB01-011000001)

 

Download und OAI-Repository

Der Katalog ist mit Stand 10. Mai 2018 in 31 Teilpaketen zum Download bereitgestellt:

Open Data B3Kat Export Teil 01
Open Data B3Kat Export Teil 02
Open Data B3Kat Export Teil 03
Open Data B3Kat Export Teil 04
Open Data B3Kat Export Teil 05
Open Data B3Kat Export Teil 06
Open Data B3Kat Export Teil 07
Open Data B3Kat Export Teil 08
Open Data B3Kat Export Teil 09
Open Data B3Kat Export Teil 10
Open Data B3Kat Export Teil 11
Open Data B3Kat Export Teil 12
Open Data B3Kat Export Teil 13
Open Data B3Kat Export Teil 14
Open Data B3Kat Export Teil 15
Open Data B3Kat Export Teil 16
Open Data B3Kat Export Teil 17
Open Data B3Kat Export Teil 18
Open Data B3Kat Export Teil 19
Open Data B3Kat Export Teil 20
Open Data B3Kat Export Teil 21
Open Data B3Kat Export Teil 22
Open Data B3Kat Export Teil 23
Open Data B3Kat Export Teil 24
Open Data B3Kat Export Teil 25
Open Data B3Kat Export Teil 26
Open Data B3Kat Export Teil 27
Open Data B3Kat Export Teil 28
Open Data B3Kat Export Teil 29
Open Data B3Kat Export Teil 30
Open Data B3Kat Export Teil 31

Alle seit dem 10. Mai 2018, 11:00 UTC+01:00, neu aufgenommenen und geänderten Daten stehen in einem OAI-Repository zum Harvesting zur Verfügung. Der Request

http://bvbr.bib-bvb.de:8991/aleph-cgi/oai/oai_opendata.pl?verb=ListRecords&metadataPrefix=marc21&from=2018-05-10T10:00:00Z

liefert jederzeit das augenblickliche Delta zum obigen Gesamtabzug. Wir empfehlen jedoch dringend, mittels Angabe entsprechender from- und until-Parameter kürzere Zeitstempelbereichsabschnitte sukzessive abzurufen.

Harvesting einzelner Datensätze

Einzelne Datensätze können mit dem OAI-Befehl GetRecord abgerufen werden. Als Wert des Parameters identifier kann dazu wahlweise der OAI-Identifier oder die B3Kat-ID des gewünschten Datensatzes übergeben werden:

http://bvbr.bib-bvb.de:8991/aleph-cgi/oai/oai_opendata.pl?verb=GetRecord&metadataPrefix=marc21&identifier=oai:aleph.bib-bvb.de:BVB01-011000001

http://bvbr.bib-bvb.de:8991/aleph-cgi/oai/oai_opendata.pl?verb=GetRecord&metadataPrefix=marc21&identifier=BV018229257

Bitte beachten Sie, dass die zweite Variante lediglich den Abfragekomfort des OAI-PMH-Standards erweitert. Ein korrekter Abgleich mit dem B3Kat-Datenbestand (insbesondere im Falle von Löschungen) kann nur über den OAI-Identifier und nicht über die B3Kat-ID erfolgen!

Set-spezifisches Harvesting

Zusätzlich zu den oben beschriebenen Möglichkeiten können Sie mit einem entsprechenden set-Parameter das Harvesting auf Datensätze beschränken, die in den MARC-Feldern 024, 049 oder 940 bestimmte Inhalte aufweisen.

So lassen sich z.B. mit

abrufen.

Bitte beachten Sie, dass diese Nutzung des set-Parameters für eine Art von Freitextsuche in bestimmten Datenfeldern einerseits funktional über den OAI-PMH-Standard hinausgeht, andererseits aber den im folgenden Abschnitt beschriebenen Einschränkungen unterworfen ist.

Einschränkungen bei set-spezifischem Harvesting:

  • Die (potentiell unendlich große) Liste aller möglichen in dieser Weise definierbaren „Sets" ist nicht mit dem OAI-Befehl ListSets abrufbar.
  • Treffermengen von mehr als 30 Datensätzen werden in Teilpaketen ausgeliefert (mit einem resumptionToken am Ende jedes Pakets, über das sich ggf. das nächste anfordern lässt). Wenn Sie Ihrer Anfrage einen set-Parameter mitgeben, wird dieser vom Repository intern zunächst ignoriert. Erst unmittelbar vor der Auslieferung des Ergebnisses ohne Berücksichtigung des set-Parameters werden alle Records eines Teilpakets, die sich nicht für das spezifizierte Set qualifizieren, verworfen. Deshalb können ausgelieferte Teilpakete abgesehen vom resumptionToken durchaus wiederholt leer sein. Dies ist jedoch im OAI-PMH-Standard nicht vorgesehen (eine ListIdentifiers-Response bzw. eine ListRecords-Response muss gemäß XML-Schema OAI-PMH.xsd mindestens ein <header/>- bzw. <record/>-Element aufweisen) und könnte daher dem einen oder anderen vorgefertigten Harvester Schwierigkeiten bereiten.
  • Sie können versuchen, dieses Problem durch Reduktion des pro Anfrage abgefragten Zeitstempelbereichs zu umgehen, weil bei diesem Vorgehen grundsätzlich weniger Treffer anfallen und somit seltener bis nie die Notwendigkeit entsteht, die Antwort in Teilpaketen auszuliefern. Garantierte Abhilfe kann diese Vorgehensweise aber nicht schaffen.
  • Wenn Sie auf 100% valides OAI-PMH-XML angewiesen sind, bleibt Ihnen nur die Option, auf jeglichen set-Parameter zu verzichten und die Ausfilterung der für Sie relevanten Datensätze clientseitig selbst vorzunehmen.

Bitte behalten Sie diese Einschränkungen stets im Hinterkopf, wenn Sie das Set-spezifische Harvesting nutzen möchten!

Nach oben