iiRDS in Theorie und Praxis. Teil 1: PI-Klassifikation und iiRDS. Ein semantisches Mapping in OWL

von Mark Schubert am 22. April 2021

Zugehörige Leistung: Intelligente Informationen und iiRDS

Der Standard iiRDS erleichtert den Austausch von Metadaten zwischen verarbeitenden Systemen, wie zum Beispiel einem Redaktionssystem und einem Content-Delivery-Portal. Doch was passiert, wenn iiRDS auf die mit Leben gefüllte PI-Klassifikation eines Redaktionssystems trifft?  

Im ersten Teil unserer Blogserie „iiRDS in Theorie und Praxis“ beschreibt Mark Schubert, Technical Consultant bei der parson AG, wie die PI-Klassifikation und iiRDS zusammengeführt werden können. Im zweiten Teil dieser Blogserie führt unser Partner plusmeta aus, wie PI-Metadaten in plusmeta mithilfe von Künstlicher Intelligenz zu iiRDS-konformen Klassifikationen werden. Lesen Sie den Artikel hier.

In der technischen Dokumentation ist die PI-Klassifikation (PI-Class®) nach Prof. Dr. Wolfgang Ziegler eine weit verbreitete Methodik, um Inhalte zu modularisieren. Die Klassifikation von Inhalten nach Produktbezug (P-Klasse) und Informationsart (I-Klasse) erlaubt, Inhaltsbausteine abzugrenzen und Wiederverwendungspotential aufzuspüren.

Sowohl Produkt- als auch Informationsklasse unterscheiden zwischen intrinsischen als auch extrinsischen Ausprägungen.

Intrinsische Klassifikationsmerkmale sind konstituierend für den Informationsbaustein. Zum Beispiel ist eine Demontage-Anweisung nicht denkbar ohne Informationen über die intrinsische I-Klasse ‚Demontage‘.

Extrinsische Klassifikationsmerkmale sind oft variantengebend. Ein Informationsbaustein würde auch weiter seine Berechtigung haben, wenn ein extrinsisches Klassifikationsmerkmal wegfällt. Zum Beispiel wäre die Demontage-Anweisung auch noch relevant, wenn eine extrinsische Produktvariante als Klassifizierungsmerkmal entfällt. Die Demontage-Anweisung würde dann einfach für andere Produktvarianten gelten.

Neben der Verwaltung von Informationsinhalten in Redaktionssystemen erleichtern die Metadaten der PI-Klassifikation auch das Finden von Informationen auf Webseiten. So genannte Content-Delivery-Portale filtern Inhalte basierend auf Metadaten. Im Idealfall erhält der Nutzer genau die Information, die er benötigt.

Austausch von Metadaten mithilfe von iiRDS

Den Austausch von Metadaten zwischen verarbeitenden Systemen, wie zum Beispiel dem Redaktionssystem und dem Content-Delivery-Portal, will der Standard iiRDS erleichtern. Der intelligent information Request and Delivery Standard (iiRDS) wird von dem iiRDS-Konsortium entwickelt und gepflegt. Das iiRDS-Konsortium ist eine Initiative der tekom und damit in der Branche Technischer Kommunikation verwurzelt.

Für den Austausch von technischer Dokumentation spezifiziert iiRDS ein Paketformat und ein Metadatenvokabular. In die Entwicklung von iiRDS sind auch Erfahrungen aus der Nutzung der PI-Klassifikation eingeflossen. Daher finden sich in dem Metadatenvokabular auch Ausprägungen der Produkt- und Informationsklasse. Die Produktklassen befinden sich in iiRDS-Sammelbecken für projektspezifische Erweiterungen. Die Merkmale der Informationsklasse sind in iiRDS hingegen Listen mit vordefinierten Merkmalen. Diese Listen stellen den Versuch dar, ein konsolidiertes Metadatenvokabular der Branche zu entwickeln, können im Sonderfall aber auch erweitert werden.

Trotz der engen fachlichen und personellen Verzahnung von PI-Klassifikation und iiRDS wurde im Diskurs der Fachöffentlichkeit PI-Klassifikation und iiRDS oft als Gegensatz wahrgenommen. Die folgenden Ausführungen stellen dieser Wahrnehmung einen praktischen Beitrag zur Verbindung von PI-Klassifikation und iiRDS entgegen.

PI-Klassifikation trifft auf iiRDS

Wenn nun das Austauschformat iiRDS auf die mit Leben gefüllte PI-Klassifikation eines Redaktionssystems trifft, stellt sich die Frage, wie beide Ansätze zusammenpassen. Häufig ist die PI-Klassifikation sehr tief verschachtelt, um Inhaltsmodule eindeutig zu klassifizieren. Aus mehrstufiger Produktklasse und mehrstufiger Informationsklasse sollte sich eine eindeutige Kombination an Merkmalen ergeben, die nur auf ein Inhaltsmodul zutrifft. Durch diese Eindeutigkeit können  Inhaltsmodule über die Metadaten der PI-Klassifikation zu Publikationen zusammengefasst werden.

In der Praxis kann dieses Streben nach Eindeutigkeit zu einem schnellen Anwachsen der Klassifikation führen. Eindeutige Kombinationen werden zu langen Metadatenausprägungen. Zum Beispiel kann die intrinsische I-Klasse „Handlungsanweisung“ nach den konkreteren Ausprägungen „Betrieb“ und „Einstellung“ unterklassifiziert werden. Das damit klassifizierte Informationsmodul wäre dann eine Handlungsanweisung für Einstellungen während des Betriebs. Dazu gesellen sich dann die mehrstufigen Merkmale der P-Klasse. Im folgenden Beispiel wird die Walze der Dosiereinheit des Farbwerks einer Druckereinheit während des Betriebs eingestellt.1 

Klassenbaum mit Kombination aus mehrstufiger intrinsischer I- und P-Klasse 

Das Metadatenvokabular von iiRDS ist hingegen flacher. Es kennt keine weiteren Unterklassen einer Anweisung mit spezifischeren Ausprägungen. Dafür hat eine Informationseinheit in iiRDS mehrere Beziehungen zu den Metadaten der Klassifikation. Die Metadaten stehen nicht in einer hierarchischen Beziehung zueinander, sondern gleichberechtigt nebeneinander.

In unserem Beispiel hat die Informationseinheit aus der Gruppe der Topics einen Bezug zu dem Topic-Typ „Anweisung“. Dieses Anweisungs-Topic hat dann weitere Relationen zu Komponenten und Produktvarianten. Darüber hinaus kann sie für bestimmte Lebenszyklusphasen des Produktes gelten.

Relationen zu Metadaten in iiRDS

Was kompliziert klingt, erlaubt ein freies Kombinieren von Metadaten, ohne die Metadatenhierarchie aufzublähen. Doch wenn ein Export aus einem CCMS in iiRDS abgebildet werden soll, müssen die Kombinationen aus intrinsischen PI-Klassifikationsmerkmalen aufgelöst und auf die einzelnen iiRDS-Metadaten abgebildet werden.

Semantisches Mapping mit OWL

Für das Abbilden der PI-Klassifikation auf iiRDS können wir uns die iiRDS zugrunde liegende Technologie von RDF und OWL zu Nutze machen. Das iiRDS-Metadatenmodel basiert auf den Technologien des semantischen Webs. Das Vokabular selbst ist in RDF und RDFS spezifiziert. Das Resource Description Framework RDF ist ein W3C-Standard, mit dem sich formalisiert Aussagen über alle nur erdenklichen Ressourcen machen lassen. Aussagen über Ressourcen werden in der Form Subjekt-Prädikat-Objekt formuliert und sind daher auch für Menschen recht gut verständlich. Diese Triple aus Subjekt-Prädikat-Objekt können aber auch maschinell verarbeitet werden. In unserem Beispiel wäre ein solches Triple die Aussage „Topic-bezieht sich auf Komponente-Printer“. Was wäre nun, wenn auch das Mapping von PI-Klassifikation auf iiRDS als semantische Triple erfolgt?

Tatsächlich erlaubt die auf RDF aufbauende Web Ontology Language OWL ein semantisch aussagekräftiges Mapping unterschiedlicher Metadatenmodelle. Dabei bleibt das Mapping getrennt von dem Export und wird formalisiert in einer Mapping-Ontologie ausgearbeitet. Die genaue Ausgestaltung der Mapping-Ontologie ist dabei natürlich projektspezifisch.  Für dieses Beispiel baut die Mapping-Ontologie unter dem iiRDS-Topic eine Klassenhierarchie auf, die der Ausprägung der PI-Klassifikation im Redaktionssystem entspricht. Jede neue Klasse entspricht einer weiteren Dimension der mehrstufigen Informations- und Produktklasse.

Mehrstufige I-Klassen als OWL-Klassenhierarchie in protégé

In diesem Beispiel wird der Klasse aus der PI-Klassifikation des Redaktionssystems, „UsageTask“ eine äquivalente OWL-Klasse für das Mapping zugewiesen. Diese Mapping-Klasse bestimmt, welche iiRDS-Eigenschaften seine Klassenmitglieder haben. In unserem Fall haben alle Mitglieder der Mapping-Klasse den Topic-Typ „Task“ und die Lebenszyklusphase „Usage“. Auch die weiteren Unterklassen der I-Klassifikation haben eine Mapping-Klasse und somit Bezüge zu Metadaten des iiRDS Vokabulars.

Für jede Dimension der mehrstufigen P-Klasse ergänzen wir ebenso Unterklassen, die nach demselben Prinzip eine iiRDS-Komponente zuweisen. Im folgenden Beispiel wird die iiRDS-Komponente „Printer“ durch eine Eigenschaftenbeschränkung der äquivalenten Mapping-Klasse in einen Bezug zu der PI-Klasse gesetzt.

Mapping von Produktklasse auf iiRDS-Komponente

Da jede Instanz einer Unterklasse auch Mitglied der übergeordneten Klassen ist, erhält die Instanz alle entsprechenden Eigenschaftswerte aus der Klassenhierarchie. Semantische Software, sogenannte Reasoner, können dann auf Grundlage des Mappings allen exportierten Modulen iiRDS-Eigenschaftswerte zuweisen. Dabei enthält der Export aus dem CCMS keine Informationen über iiRDS.

Exportiertes Modul als Ressource in RDF

Die Module sind lediglich Mitglied in einer Klasse, die der Kombination aus den mehrstufigen PI-Klassifikationsmerkmalen entspricht.

OWL-Mapping im Export-Prozess

Um die Merkmale eines exportierten Moduls mit PI-Klassifikation nach iiRDS zu überführen, ist ein mehrstufiger Prozess nötig. Die PI-Klassifikation des Moduls wird als Triple in RDF exportiert oder aus einem anderen Exportformat erstellt. Dieser Export ist frei von iiRDS-Metadaten. In einem Mapping-Schritt werden die Triple des Exports mit der Mapping-Ontology zusammengeführt. Aus der zusammengeführten Ontologie leitet ein Reasoner neue Aussagen auf Grundlage der äquivalenten Klassendefinition ab. So werden aus den PI-Klassifizierungsmerkmalen neue iiRDS-Eigenschaftswerte der Module erzeugt.

Mapping-Prozess von CCMS mit PI-Klassifikation zu iiRDS-Metadaten

Die abgeleiteten iiRDS-Eigenschaftswerte werden vom Reasoner in Form semantischer Triple ausgegeben und liegen damit in RDF vor. Damit gliedern sie sich nahtlos in bestehende iiRDS-Prozesse ein, in denen Metadaten in eben diesem Format verarbeitet werden.

Aus der Klassenzugehörigkeit abgeleitete iiRDS-Metadaten

Soll aus einem Redaktionssystem auf Basis einer PI-Klassifikation das Austauschformat iiRDS erstellt werden, lässt sich also die Mapping-Logik mit semantischen Technologien abbilden. Dabei bleibt der Export frei von iiRDS-Metadaten. Da die Mapping-Logik in einer eigenen Ontologie formalisiert ist, kann das Mapping schnell und flexibel angepasst werden.

Fazit

Die PI-Klassifikation aus einem Redaktionssystem kann mit einer Mapping-Ontologie in OWL nach iiRDS als Austauschformat überführt werden. Dabei bleibt die Export-Logik des Redaktionssystems und die Mapping-Logik getrennt. Der Austauschstandard iiRDS erleichtert so den Inhaltstransfer in das semantische Netz eines Content-Delivery-Portals.

---

This work was conducted using the Protégé resource, which is supported by grant GM10331601 from the National Institute of General Medical Sciences of the United States National Institutes of Health.

1 Beispiel nach: Prof. Dr. W. Ziegler: PI ist Klasse, tekom 2014

 

Der zweite Teil dieser Blogserie "iiRDS in Theorie und Praxis. Teil 2 - iiRDS-Pakete mit KI-Unterstützung" von unserem Partner plusmeta ist am 12. August 2021 auf dem plusmeta-Blog erschienen. Lesen Sie den Artikel hier.

Neuen Kommentar hinzufügen

Ihre E-Mail-Adresse wird nicht veröffentlicht.

Das könnte Sie auch interessieren

iiRDS im semantischen Netz

von parson am 28. November 2022

Welche Vorteile bieten Top-Level-Ontologien und intelligenter Datenaustausch für iiRDS? Was passiert, wenn Daten und Metadaten aus verschiedenen Systemen miteinander ausgetauscht werden? Welche Rolle spielen Ontologien beim Datenaustausch und wie können Top-Level-Ontologien den Austausch verbessern? mehr...