B3Kat - Open Data
Der gemeinsame Verbundkatalog B3Kat des Bibliotheksverbundes Bayern (BVB) und des Kooperativen Bibliotheksverbundes Berlin-Brandenburg (KOBV) umfasst mehr als 27 Millionen bibliografische Datensätze der Universitäts-, Hochschul- und vieler weiterer Bibliotheken Bayerns, Berlins und Brandenburgs. Die Veröffentlichung erfolgt unter der Creative Commons License CC0 im Datenformat MARCXML mit den für Deutschland vereinbarten Konventionen.
Regional definierte MARC21-Felder, spezielle Feldbelegungen:
001 | B3Kat-ID (Beispiel: BV018229257) | |
049 | Besitznachweis (ISIL), vgl. die Übersicht der am B3Kat beteiligten Bibliotheken | |
940 Ind. 1 = 1 | Regionale und lokale Kodierungen (MAB 078) | |
Unterfeld f | Selektionskennzeichen Sprachkreis | |
Unterfeld n | Selektionskennzeichen bibliotheksübergreifende Bibliographien und Projekte | |
Unterfeld q | Bibliotheksspezifische Selektionskennzeichen | |
941 Ind. 1 = #, Ind. 2 = # | Unterfelder b,h,j,m,t,r,s | Strukturierte Quellenangabe (unselbständige Publikationen) |
942 Ind. 1 = 1, Ind.2 = 1 | DDC (Dewey Decimal Classification) analytisch der BSB-Klassifikation | |
Unterfeld c | Grundnotation (Sachaspekt) | |
Unterfeld f | Notation aus Hilfstafel 1 (Zeitaspekt) | |
Unterfeld g | Notation aus Hilfstafel 2 (Geographischer Aspekt) | |
Unterfeld e | Angabe der zugrunde liegenden DDC-Ausgabe | |
943 Ind. 1 = 1, Ind. 2 = # | OAI-Identifier des Datensatzes (Beispiel: oai:aleph.bib-bvb.de:BVB01-011000001) |
Download und OAI-Repository
Der Katalog ist mit Stand 8. Mai 2024 in 36 Teilpaketen zum Download bereitgestellt:
Open Data B3Kat Export Teil 01
Open Data B3Kat Export Teil 02
Open Data B3Kat Export Teil 03
Open Data B3Kat Export Teil 04
Open Data B3Kat Export Teil 05
Open Data B3Kat Export Teil 06
Open Data B3Kat Export Teil 07
Open Data B3Kat Export Teil 08
Open Data B3Kat Export Teil 09
Open Data B3Kat Export Teil 10
Open Data B3Kat Export Teil 11
Open Data B3Kat Export Teil 12
Open Data B3Kat Export Teil 13
Open Data B3Kat Export Teil 14
Open Data B3Kat Export Teil 15
Open Data B3Kat Export Teil 16
Open Data B3Kat Export Teil 17
Open Data B3Kat Export Teil 18
Open Data B3Kat Export Teil 19
Open Data B3Kat Export Teil 20
Open Data B3Kat Export Teil 21
Open Data B3Kat Export Teil 22
Open Data B3Kat Export Teil 23
Open Data B3Kat Export Teil 24
Open Data B3Kat Export Teil 25
Open Data B3Kat Export Teil 26
Open Data B3Kat Export Teil 27
Open Data B3Kat Export Teil 28
Open Data B3Kat Export Teil 29
Open Data B3Kat Export Teil 30
Open Data B3Kat Export Teil 31
Open Data B3Kat Export Teil 32
Open Data B3Kat Export Teil 33
Open Data B3Kat Export Teil 34
Open Data B3Kat Export Teil 35
Open Data B3Kat Export Teil 36
Alle seit dem 8. Mai 2024, 12:00 UTC+02:00, neu aufgenommenen und geänderten Daten stehen in einem OAI-Repository zum Harvesting zur Verfügung. Der Request
liefert jederzeit das augenblickliche Delta zum obigen Gesamtabzug. Wir empfehlen jedoch dringend, mittels Angabe entsprechender from- und until-Parameter kürzere Zeitstempelbereichsabschnitte sukzessive abzurufen.
Harvesting einzelner Datensätze
Einzelne Datensätze können mit dem OAI-Befehl GetRecord abgerufen werden. Als Wert des Parameters identifier kann dazu wahlweise der OAI-Identifier oder die B3Kat-ID des gewünschten Datensatzes übergeben werden:
Bitte beachten Sie, dass die zweite Variante lediglich den Abfragekomfort des OAI-PMH-Standards erweitert. Ein korrekter Abgleich mit dem B3Kat-Datenbestand (insbesondere im Falle von Löschungen) kann nur über den OAI-Identifier und nicht über die B3Kat-ID erfolgen!
Set-spezifisches Harvesting
Zusätzlich zu den oben beschriebenen Möglichkeiten können Sie mit einem entsprechenden set-Parameter das Harvesting auf Datensätze beschränken, die in den MARC-Feldern 024, 049, 084, 912 oder 940 bestimmte Inhalte aufweisen.
So lassen sich z.B. mit- http://bvbr.bib-bvb.de:8991/aleph-cgi/oai/oai_opendata.pl?verb=ListRecords&metadataPrefix=marc21&from=2022-06-20&until=2022-06-30&set=VD18 alle VD18-relevanten Datensätze des B3Kat, die zwischen dem 20.06.2022 und dem 30.06.2022 neu aufgenommen oder geändert wurden,
- http://bvbr.bib-bvb.de:8991/aleph-cgi/oai/oai_opendata.pl?verb=ListRecords&metadataPrefix=marc21&from=2016-01-01&set=DE-12 alle Datensätze, die seit dem 01.01.2016 neu aufgenommen oder geändert wurden und einen Besitznachweis der Bayerischen Staatsbibliothek haben,
- http://bvbr.bib-bvb.de:8991/aleph-cgi/oai/oai_opendata.pl?verb=ListRecords&metadataPrefix=marc21&from=2017-09-13T09:55:57Z&set=by alle Datensätze, die seit dem 13.09.2017 um 09:55:75 UTC neu aufgenommen oder geändert wurden und wo "by" in einer bestimmten Form (s.u.) in MARC 024, 049, 084 oder 940 vorkommt
abrufen.
Ein Datensatz wird als einem Set X zugehörig betrachtet, wenn:
- Feld 024, erster Indikator "8", Subfeld a mit X beginnt (z.B. set "VD18")
- Feld 049, Subfeld a gleich X ist ("Bestand von Bibliothek X"). Ausnahme: Bibliothekssigel von Verwaltungsgerichten.
- X gleich "kobv" ist und Feld 049, Subfeld a das Bibliothekssigel einer KOBV-Bibliothek ist ("Bestand der KOBV-Bibliotheken").
- Feld 084 Subfeld 2 gleich "fid" oder "ssgn" ist und Subfeld a gleich X ist ("Sondersammelgebiets-/Fachinformationsdienst-Nummern"). Vorsicht: SSG-Nummern enthalten Kommata "," die in Setnamen jedoch nicht erlaubt sind. Daher können für das Harvesting von Datensätzen via SSG-Nummern Kommata durch Punkte "." ersetzt werden. Um Datensätze mit der SSG-Nummer "9,2" zu harvesten muss also das OAI-Set "9.2" angegeben werden.
- X gleich "digit" ist und Feld 912 Subfeld a gleich "digit" ist ("DigiTool").
- Ein beliebiges Subfeld von Feld 940, erster Indikator "1" mit X beginnt.
Einschränkungen bei set-spezifischem Harvesting:
- Die (potentiell unendlich große) Liste aller möglichen in dieser Weise definierbaren „Sets" ist nicht mit dem OAI-Befehl ListSets abrufbar.
- Treffermengen von mehr als 30 Datensätzen werden in Teilpaketen ausgeliefert (mit einem resumptionToken am Ende jedes Pakets, über das sich ggf. das nächste anfordern lässt). Wenn Sie Ihrer Anfrage einen set-Parameter mitgeben, wird dieser vom Repository intern zunächst ignoriert. Erst unmittelbar vor der Auslieferung des Ergebnisses ohne Berücksichtigung des set-Parameters werden alle Records eines Teilpakets, die sich nicht für das spezifizierte Set qualifizieren, verworfen. Deshalb können ausgelieferte Teilpakete abgesehen vom resumptionToken durchaus wiederholt leer sein. Dies ist jedoch im OAI-PMH-Standard nicht vorgesehen (eine ListIdentifiers-Response bzw. eine ListRecords-Response muss gemäß XML-Schema OAI-PMH.xsd mindestens ein <header/>- bzw. <record/>-Element aufweisen) und könnte daher dem einen oder anderen vorgefertigten Harvester Schwierigkeiten bereiten.
- Sie können versuchen, dieses Problem durch Reduktion des pro Anfrage abgefragten Zeitstempelbereichs zu umgehen, weil bei diesem Vorgehen grundsätzlich weniger Treffer anfallen und somit seltener bis nie die Notwendigkeit entsteht, die Antwort in Teilpaketen auszuliefern. Garantierte Abhilfe kann diese Vorgehensweise aber nicht schaffen.
- Wenn Sie auf 100% valides OAI-PMH-XML angewiesen sind, bleibt Ihnen nur die Option, auf jeglichen set-Parameter zu verzichten und die Ausfilterung der für Sie relevanten Datensätze clientseitig selbst vorzunehmen.
Bitte behalten Sie diese Einschränkungen stets im Hinterkopf, wenn Sie das Set-spezifische Harvesting nutzen möchten!
Fragen oder Feedback?
Fragen oder Feedback zu den B3Kat Open Data richten Sie bitte an die E-Mail-Adresse open.data@bib-bvb.de.Weiterführende Links
- Übersicht über die am B3Kat beteiligten Bibliotheken
- BVB-INFO-Mailingliste
- Katalogisierungskonventionen für B3Kat (KKB Online)
- AG der Verbundsysteme
- Bibliothekarische Aus- und Fortbildung in Bayern
- Jobbörse
- Gemeinsamer Internetauftritt der bayerischen Hochschulbibliotheken
- Gemeinsamer Internetauftritt der regionalen Staatlichen Bibliotheken in Bayern
- Landesfachstelle für das öffentliche Bibliothekswesen