PANGAEA XML schema

From PANGAEA Wiki
Revision as of 2006-10-30T23:32:04 by Uwe Schindler (talk | contribs)
Jump to navigation Jump to search

Field names as given in the PANGAEA XML schema can be used for specific queries using the Pangaea search engine PangaVista. Queries are not case sensitive and can be combined by boolean operators. A blank is equivalent to AND, use the minus sign (-) to exclude specifications. See also the Help function of PangaVista.

Search examples:


mail von uwe 2006-10-10

Alle felder sind erstmal in der http://wiki.pangaea.de/wiki/Klorolle - diese werden gemappt nach ISO, dabei teilweise auch transformiert.

Für den bibliothekskatalog werden diese allerdings anders gemappt. Das Zielformat ist dabei das XML-Schema von Jan Brase für TIBORDER. Da dies nur Dublin Core mit einigen Erweiterungen ist, sind alle unsere Metadaten außer die bibliographischen als formatierter plain Text im Abstract (sieht m Grunde ähnlich formatiert aus wie der Text-Metaheader nur ohne Tabulatoren usw.). Das "Abstract" des Datensatzes ist dabei ganz am Anfang des TIBORDER Abstracts, danach kommen Referenzen, Events, Parameter und ganz am Schluss wie im Text-Metaheader das "Comment". Schau Dir dazu einfach einen Eintrag im TIBORDER an, den meisten hast du ja inzwischen einen Abstract verpasst. Bei den Bibliographischen Daten fehlen im TIBORDER zur Zeit nur das Source-Feld, da warte ich bis Jan & Jan was tun.

ISO ist in etwa so gemappt (hier die Hauptteile im Metaheader):

  • Bibliographische Daten -> dataIdentificationInfo/citation (abstract, title, autoren (inkl. allem aus staffs auch email/telefunz), source, doi,…)
  • Coverage (alle raumrichtungen und zeitlich) -> dataIdentificationInfo/extent
  • Referenzen -> dataQualityInfo/Lineage/Source (komplett mit bibliographischen Daten, autoren mit alles aus staffs, URL, alles)
  • Events -> dataQualityInfo/Lineage/ProcessStep (als Plain Text)
  • Geocodes+Parameter -> contentInfo
  • PIs -> dataIdentificationInfo/pointOfContact
  • Projekte -> nur als Keywords, evtl. als allg-contact
  • Keywords -> keywords
  • Size -> dataIdentificationInfo/size
  • Allgemeines zu PANGAEA -> allg-contact

Ein Bleistift: http://ws.pangaea.de/oai/?verb=GetRecord&metadataPrefix=iso19139&identifier=oai:pangaea.de:doi:10.1594/PANGAEA.80968

Schema

MetaData.png

XML variant for writing transformations