Architekturen

Architekturen

Um die Diagnosen und Prozeduren zu kodieren, nimmt Semfinder die natürlichen Formulierungen der Ärzte und analysiert sie auf ihren Inhalt hin. Semfinder ist somit ein NLP-Tool (Natural-Language-Processing-Tool).

Bei der Analyse der Texte kommt es essentiell darauf an, wie die Begriffe im Regelwerk repräsentiert werden, wobei die Architektur der Begriffsbeziehungen die entscheidende Rolle spielt.

Weil das Gebiet der medizinischen Diagnosen und Prozeduren besonders umfangreich ist, kommt für Semfinder nur die modernste Form der Begriffsrepräsentation in Frage.

Zur Verdeutlichung zeigen wir drei grundlegende Begriffsarchitekturen:

 

Die semantische Achse: Hierarchie

Die Hierarchie zeichnet sich durch Einfachheit und Stringenz aus. Sie eignet sich deshalb besonders gut für Computersysteme. Wenn umfangreichere Wissensgebiete dargestellt werden, nimmt jedoch die Zahl der benötigten Blätter (Endpunkte) explosionsartig zu. Eine Hierarchie wird meist zwei-dimensional dargestellt und enthält somit zwei Achsen, die allerdings unterschiedliche Funktionen haben: In der vertikalen Achse erfolgt die zunehmende Verästelung (Detaillierung) der Hierarchie, auf der horizontalen Achse hingegen werden die jeweiligen Bedeutungsinhalte aufgeführt. Von links nach rechts ändert sich somit die Semantik, von oben nach unten die Körnigkeit (Granularität). Wir bezeichnen die horizontale Ausdehnung der Hierarchie als "semantische Achse" und nehmen an, dass prinzipiell - d.h. auch bei mehrachsigen Systemen - auf jeder semantischen Achse eine Hierarchie von Oberbegriffen aufgebaut werden kann. Der oberste Begriff der Hierarchie entspricht dem Achsennamen (z.B. Organ, Erreger, Diagnose usw.). 


 

Multidimensionales System

Es ist sinnvoll, mehrere semantische Achsen zu kombinieren, weil dadurch die Begriffe geordneter beschrieben und einfacher spezifiziert werden können. Immer wenn Begriffe voneinander unabhängige Merkmale besitzen, baut man in der Begriffsarchitektur neue Achsen ein und erhält so eine multidimensionale (multiaxiale) Architektur. Der Nachteil einer solchen Architektur ist, dass die Zahl der Achsen mit zunehmender Anwendung immer grösser und unhandlicher wird und dass sinnlose und überflüssige Kombinationen entstehen. SNOMED (Standardized Nomenclature of Medicine) ist ein Beispiel für eine solche multidimensionale Architektur, mit allen Vor- und Nachteilen. Multidimensionale semantische Räume werden in der Literatur gelegentlich als Concept Space bezeichnet. Eine häufig beschriebene Methode besteht darin, Punkte im semantischen Raum zu definieren und aus dem Abstand von 2 Punkten Rückschlüsse auf ihre semantische Verwandschaft zu erhalten. Semfinder funktioniert nicht nach diesem Prinzip, sondern beschreibt den Bedeuzungsinhalt in all seinen Verästelungen. Dazu braucht es die Archidekturen, die nicht nur über mehrere Achsen verfügen, sondern auch die gegenseitige Anordnung der Achsen darstellen können.

Multifokales System

Die Schwäche der konventionellen multidimensionale Architektur überwindet die multifokale Architektur. Die Achsen werden jeweils spezifischen Ausgangspunkten zugeordnet und sind nur noch an diesen Knotenpunkten (Fokussen) sichtbar. Dadurch wird das ganze Achsenwerk übersichtlicher. Semfinder verwendet dieses Prinzip, um die medizinischen Inhalte zu strukturieren. Der vieldimensionale, über Knotenpunkte differenzierte semantische Raum, der durch die multifokale Architektur entsteht, ist die Basis für das Regelwerk, mit dem Semfinder die medizinischen Diagnosen- und Prozedurentexte analysiert und kodiert.

Weitergehende Informationen zu verschieden Begriffs-Architekturen enthält die folgende Publikationen.

4 Basisarchitekturen