MAL-Homepage
Inhaltsverzeichnis
MAL Dokumentation: Datensammelsystem
1. ALLGEMEINES
Das Datensammelsystem ist eine Datenbank, in die Messdaten von
verschiedenen unabhängigen medizinischen Erfassungssystemen
personenbezogen geschrieben werden können. Das System ist so
konzipiert, dass die Erfassungssysteme nicht notwendiger Weise in
einem gemeinsamen Netzwerk betrieben werden müssen.
Die Zuordnung der Messdaten zu einer Person erfolgt jeweils
über die Sozialversicherungsnummer. Daher ist es erforderlich,
dass diese bei der Messdatenerfassung (Archivierung der Messdaten
im lokalen Messdaten-Archiv)
korrekt eingegeben wird.
Die Datensanalyse ist so konzipiert, dass für verschiedene
Projekte oder Anwender Konfigurationsdaten für die
Analysen zusammengestellt werden können. Sind die Analysen
erst einmal konfiguriert, können sie mit wenigen Mausklicken
gestartet werden. Die Konfigurationsdaten sind von den
Messdaten getrennt, daher kann man einmal eingerichtete
Analysen mit neuen Daten versorgen ohne sie neu zu konfigurieren.
Für Testzwecke kann man das Demo-Messdatenarchiv
downloaden und auf
"C:\MessArchiv" expandieren. Das Demo-Datensammlung kann
von der MAL-Konsole durch Aufruf des Wortes
datensammlung
geöffnet werden. Sie enthält allerdings nur Messdaten
von einem Probanden, was für statistische Analysen in
der Regel nicht ausreicht. Der Transfer weiterer Messdaten
vom Demo-Messdatenarchiv in die Demo-Datensammlung ist im Kapitel
Klinische Befunde
beschrieben.
MAL-Homepage Inhaltsverzeichnis
2. DATENSTRUKTUR
Die Daten im Datensammelsystem werden in Baumstrukturen
abgelegt. Jedem Proband ist die Wurzel eines Baumes
zugeordnet.
MAL-Homepage Inhaltsverzeichnis
3. SAMMELN DER MESSDATEN
Das Eintragen von Daten ins Datensammelsystem muss für jedes
Erfassungssystem vom Mess-Archiv
aus manuell vorgenommen werden.
Voraussetzung ist, dass eine entsprechende Analyseroutine
(Laufband_Kraftauswertung,
Video_Schrittparameter,
Biodex_Analyse,
Posturographie_Analyse)
mit insert / Analyse in die Tabelle mit den Archivierungs- und Analyseroutinen
eingetragen wird. Vorzugsweise wählt man dabei die Varianten für
Messungsvergleich, da diese das serielle Sammeln von vielen Messungen
in einem Arbeitsschritt ermöglichen.
Mit dem Menüpunkt Konfiguration / Analyse kann unter
Ausgabeformat "Datensammlung" ausgewählt werden. Damit
wird erreicht, dass beim Start der Analyse die Ergebnisse
nicht am Bildschirm angezeigt, sondern in die Datensammlung
transferiert werden.
MAL-Homepage Inhaltsverzeichnis
4. WERTEDEFINITIONEN
Die Bedeutung der Messgrößen ist in den gerätespezifischen
Beschreibungen zu finden und zwar
MAL-Homepage Inhaltsverzeichnis
5. GRUPPEN
Eine Gruppe ist eine Menge von Probanden, die nach bestimmten
Kriterien ausgewählt wurde. Mit dem Menüpunkt Gruppen
im Hauptmenue wird die Tabelle mit den definierten Probandengruppen
geöffnent.
Mit Insert können in diese Tabelle neue Gruppen eingefügt werden,
dabei muss zunächst eine eindeutige Bezeichnung und ein Kommentar
eingegeben werden und danach stehen die Varianten
Alle Parkinson - 50 %berechnet von allen Probanden außer jenen der Gruppe 'Parkinson' 50 Prozent.
MAL-Homepage Inhaltsverzeichnis
6. KATEGORIEN
Die Kategorien dienen dazu Texte in bestimmte Klassen einzuteilen.
Zum Beispiel kann es für manche Analysen erforderlich sein,
Gruppen zusammengehöriger Diagnosen zu bilden. Beim Einrichten
einer neuen Klassifikation mit dem Menüpunkt Insert
wird zunächst die Angabe einer Bezeichnung und eines Kommentars
gefordert. Danach muss der Messwert, der in Kategorien eingeteilt
werden soll, ausgewählt werden (aus der Tabelle Wertedefinitionen).
Hier können nur Text-Messwerte (keine Skalare oder Kurven) verwendet werden.
Bei einer neu eingerichteten Klassifizierung sind zunächst
alle Texte der Kategorie '?' zugeordnet. Die Zuordnung
zu neuen Kategorien muss manuell durchgeführt werden.
Das geschieht durch einen Doppelklick auf die neue
Klassifizierung oder mit dem Menüpunkt Klassifizierung.
Im daraufhin erscheinenden Menü wählt man zunächst
Texts aus und erhält damit eine Tabelle aller auftretenden
Texte, wobei links in der Spalte 'Kategorie' die aktuelle
Kategorie des jeweiligen Textes eingetragen ist. Mit einem
Doppelklick auf einen Text (entspricht dem Menüpunkt Single)
kann dieser einer Kategorie zugeordnet werden.
Mit der Kombination von Find und All kann eine Menge von
Texten einer Kategorie zugeordnet werden, indem zum Beispiel
zuerst mit Find alle Texte, die die Zeichenfolge "Fraktur"
enthalten gesucht werden und dann alle gefundenen Einträge
mit All der Kategorie 'Frakturen' zugeordnet werden.
Der Menüpunkt Categories zeigt an, welche Kategorien bereits
definiert wurden und wie viele Texte ihnen jeweils zugeordnet
sind.
Bei der Anwendung von Kategorisierungen bei der Datenanalyse
werden jeweils die Texte durch die Namen ihrer Kategorien
ersetzt.
MAL-Homepage Inhaltsverzeichnis
MAL-Homepage Inhaltsverzeichnis
7.2. Wertelisten
Viele der Analysen benötigen eine frei wählbare Anzahl von
Eingangsvariablen. Daher wird bei der Konfiguration
derartigen Analysen meist unter dem Menüpunkt Werteliste
eine Tabelle für die Definition dieser Werte angeboten. Sie sieht
etwa wie folgt aus:
MAL-Homepage Inhaltsverzeichnis
8. HISTOGRAMME
Der einfachste Weg ein Histogramm eines Messwerts zu erhalten
ist ein Doppelklick auf den enstprechenden Messwert
in der Wertetabelle (Aufruf des Wortes
datensammlung und
Menüpunkt Wertedefinitionen).
Will man nur die Werte eine bestimmten Probandengruppe
anzeigen, so kann man zuvor den Menüpunkt Gruppe aufrufen.
Allerdings lässt sich
bei dieser Art von Histogramm die Beschriftung nicht einstellen
und ein Ausdruck der Graphik ist nicht möglich.
MAL-Homepage Inhaltsverzeichnis
8.1. Einfaches Histogramm
In die Berechnungsliste kann mit Insert / Histogramme / Einfaches Histogramm
eine neue Histogrammberechnung eingetragen werden.
Durch Markieren des neuen Eintrags und Auswahl des Menuepunkts
Konfigurieren
sind die Parameter Titel, Abszisse,
Ordinate, Wert und Gruppe einstellbar.
Die ersten drei Parameter sind für die Beschriftung der
Graphik, Wert dient zur Auswahl eines Skalarwertes aus
der Wertetabelle und
Gruppe dient zur Auswahl der
Probandengruppe aus der Gruppentabelle.
Der Parameter pro_Proband bestimmt, wie die Skalarwerte der
einzelnen Messungen jedes Probanden verknüpft oder selektiert
werden sollen. Folgende Werte sind möglich:
MAL-Homepage Inhaltsverzeichnis
8.2. Mehrfache Histogramme
Mehrfache Histogramme dienen primär dem visuellen Vergleich
mehrerer Skalarwerte. Die integrierte Varianzanalyse
(Einweg-ANOVA) ermöglicht aber auch eine statistische
Beurteilung der Abweichungen zwischen einzelnen
Messwerten und/oder Probandengruppen.
Mit Insert / Histogramme / Mehrfache Histogramme wird
eine entsprechende Berechnung eingerichtet. Welche Messwerte dargestellt
werden sollen kann man im Konfigurationsmenü mit dem
Menüpunkt Wertetabelle einstellen.
MAL-Homepage Inhaltsverzeichnis
MAL-Homepage Inhaltsverzeichnis
9.2. Quantile-Tabelle
Quantile-Tabellen können für die Berechnung
von Grenzwerten für die automatische Befundung
verwendet werden. Es kann eine Liste mehrerer
Messwerte angegeben werden.
Das Ergebnis wird in einem Editorfenster
angezeigt und kann mit Copy and Paste
in ein Excel-Sheet kopiert werden.
Beispiel:
BiodexDas Einrichten erfolgt mit Insert / Quantile / Tabelle.
Wert Stichpr. 25% 50% 75% BX Alter 158 30 67.8434 77 LB Geschwin 33 1.01535 1.10949 1.16819
MAL-Homepage Inhaltsverzeichnis
9.3. Quantile-Balkendiagramme
Quantile-Balkendiagramme ermöglichen den optischen Vergleich
von Quantilewerten mehrerer Messwerte und mehrerer Probandengruppen.
Sie werden mit Insert / Quantile / Balkendiagramm eingerichtet.
Wenn die Parametermaske etwa folgendermaßen ausgefüllt wird
MAL-Homepage Inhaltsverzeichnis
10. KORRELATIONEN 10.1. Regressionen
MAL-Homepage
Inhaltsverzeichnis
Regressionen dienen dazu, die Abhängigkeit einer Messgröße
von einer oder mehreren anderen
graphisch zu veranschaulichen. Mit Insert / Regression
wird eine neue Regression eingerichtet, wobei zwischen
einer einfachen Regression (Abhängigkeit von einer Messgröße) oder
einer multiplen Regression (Abhängigkeit von mehreren
Messgrößen) ausgewählt werden kann.
10.2. Einfache Regression
Konfiguration: Im Parameter unabhängiger_Wert
ist ein Skalarwert für die X-Achse (Abszisse) einzutragen, der
Wert für die Y-Achse ist im Parameter abhängiger_Wert
einzutragen. Die eingetragenen Namen der Skalarwerte werden auch für die
Achsenbeschriftung verwendet. Die Einheitenbezeichnungen fehlen
dabei. Sie können aus der Datenbank mit
Messdaten / Anzeigen / Anzeigen
ermittelt werden und in die Felder Einheit_Abs. bzw.
Einheit_Ord. eingetragen werden.
MAL-Homepage Inhaltsverzeichnis
10.3. Multiple Regression
Bei multiplen Regressionen kann die lineare Abhängigkeit einer
Messgröße von mehreren anderen untersucht werden. Die Messgrößen
werden ähnlich wie bei
Varianzanalysen
in eine Tabelle eingegeben,
wobei jeweils der erste Messwert in der Tabelle der
abhängige Wert ist. Der Umgang mit der Werteliste
ist im Kapitel Werteliste beschrieben.
Beispiel:
VIDEOMETRIEMan erkennt, dass die Geschwindigkeit und die Körpergröße den stärksten, die Hebehöhe weniger und das Alter der Probanden fast keinen Einfluss auf die Schrittlänge hat. Das Bestimmtheitsmaß liegt im Wertebereich 0..1 und gibt an, wie gut die abhängige Größe durch das Modell approximiert werden kann, also wie sehr sie von den unabhängigen Größen tatsächlich abhängt. Bei einem kleinen Bestimmtheitsmaß ist die Aussage der Tabelle gering.
Abhängige Größe: VI Schrittl links Mittelwe
+------------------------------------------------------+ I Wert I %-Anteil I Faktor I +------------------------------------------------------+ I VI Geschwin I 53.8869 I 32.1467 I I VI_Körpergr I 46.0428 I 9.06551 I I VI Hebehöhe links Mittelwe I 0.0690225 I 0.498507 I I VI Alter I 0.00135239 I -0.0441352 I +------------------------------------------------------+
Bestimmtheitsmass R^2: 0.849066 Stichprobe: 787
MAL-Homepage Inhaltsverzeichnis
10.4. Reliabilitätstests
Zur Überprüfung der Reproduzierbarkeit von Messergebnissen
verwendet man die Analyseart "Intraclass-Correlation".
Dabei gibt es drei Varianten:
Intraclass-Correlation
Bei der Intraclass-Correlation werden
bei mehreren Probanden zwei oder mehrere Wiederholungsmessungen
bei gleichen Bedingungen verglichen.
Eine hohe Intraclass-Correlation (Wertebereich -1..1)
erhält man, wenn die Unterschiede zwischen den Probanden
deutlich größer sind als jene zwischen den Wiederholungen
(siehe
David C. Howell, Intraclass Correlation)
Correlation-Significance
Die Variante Correlation-Significance ist eher von untergeordneter Bedeutung.
Sie berechnet den
Signifikanzwert der Korrelation zwischen erster und zweiter
Messung (der Parameter Wiederholungen sollte auf 2 eingestellt werden).
Eine Beschreibung des Berechnungsverfahren findet sich
beim Wort correlation_significance.
MAL-Homepage Inhaltsverzeichnis
10.5. Korrelationsmatrizen
Für die Suche nach signifikanten Korrelationen bei einer
größeren Menge von Messgrößen bietet sich die Analyse
per Korrelationsmatrix an. Mit
Insert / Regression / Korrelationsmatrix
wird sie eingerichtet. Man definiert dann zunächst mit
Konfigurieren / Unabhängige Werte eine Liste mit den
unabhängigen Messgrößen und mit Konfigurieren / Abhängige
Werte eine zweite Liste mit den abhängigen Messgrößen.
Der Menüpunkt Konfigurieren / Berechnen bewirkt, dass
für jede Messgröße aus der Liste der unabhängigen Werte
lineare Korrelationen zu sämtlichen Messgrößen aus der
Liste der abhängigen Werte berechnet werden (das kann längere
Zeit in Anspruch nehmen).
Bei der Einstellung der Parameter (Konfigurieren / Parameter)
kann unter anderem bei Korrelationsart eingestellt werden, ob
Korrelationen oder Kovarianzen berechnet werden sollen.
Definition der Messgrößen:
Mit den Menüpunkten Konfigurieren / Unabhängige Werte
oder Konfigurieren / Abhängige Werte wird zunächst eine
Tabelle mit allen möglichen Messwerten geöffnet. Durch einen
Doppelklick auf einen Messwert wird dieser zur bestehenden
Messwertliste dazugefügt. Will man mehrere ähnlich bezeichnete
Messgrößen dazufügen, so kann man mit Find eine Auswahl
aus der Messwerttabelle treffen und diese mit All dazufügen.
Der aktuelle Stand der Messwertliste kann mit Edit betrachtet
oder verändert werden. Die Anzahl der Einträge in der
Messwertliste kann mit dem Menüpunkt Info abgefragt werden.
Anzeige der Ergebnisse:
Nach der Berechnung kann mit Start / Matrix eine Matrix
mit den Korrelationskoeffizienten angezeigt werden. Beispiel:
VI/LB-Korrelationsmatrix Gruppe: LB_VI_ProbandenMit der Funktion Start / Ranking wird eine Liste mit den der Größe nach geordneten Korrelationskoeffizienten geöffnet und Start / Histogramm zeigt deren Verteilung an.
A B C D 1 0.32 0.08 -0.23 -0.21 2 0.23 0.36 -0.22 -0.20 3 -0.58 -0.17 0.58 0.56 4 -0.65 -0.21 0.67 0.65
Unabhängige Werte: 1 .. VI Schrittd Differen Mittelwe 2 .. VI Schrittl Differen Mittelwe 3 .. VI_Kontaktz_Differen_Mittelwe 4 .. VI_Standpha_L-R_Mittelwe
Abhängige Werte: A .. LB Schrittd Differen Mittelwe B .. LB Schrittl Differen Mittelwe C .. LB_Kontaktz_Differen_Mittelwe D .. LB_Standpha_L-R_Mittelwe
MAL-Homepage Inhaltsverzeichnis
10.6. Hauptkomponentenanalyse
Die Hauptkomponentenanalyse (Principal Components Analysis)
berechnet die Eigenwerte und Eigenvektoren der Korrelationsmatrix.
Das Einrichten erfolgt
mit Insert / Korrelation / Hauptkomponenten.
Die Konfiguration ist weitgehend wie bei der Analyse
Korrelationsmatrizen,
allerdings muss die Liste der
unabhängigen Werte stets gleich jener der abhängigen Werte
sein, daher gibt es nur eine Liste, die mit
Konfiguration / Werteliste geöffnet werden kann.
Mit Konfiguration / Berechnen wird die Berechnung der
Korrelationsmatrix und anschließend der Eigenwerte und
Eigenvektoren gestartet. Alternativ kann auch
Konfiguration / Einzeln berechnen verwendet werden.
Die beiden Varianten unterscheiden sich in der Art, wie
die einzelnen Korrelationen der Korrelationsmatrix
berechnet werden. Erstere bestimmt die Menge jener
Probanden, bei denen alle geforderten Messwerte vorhanden
sind, berechnet dann alle Messwerte und in der Folge alle
Korrelationen. Zweitere durchsucht pro Korrelation
alle Probanden aus der voreingestellten Probandengruppe
und nimmt jene in die Berechnung auf, bei denen die
zwei für die entsprechende Korrelation erforderlichen
Messwerte vorhanden sind.
Die Variante Einzeln berechnen
führt zwar zu sehr hoher Laufzeit, ermoeglicht aber
die Einbeziehung von Probanden, bei denen nicht alle
angeführten Messwerte vorhanden sind. Das ist insbesondere
von Relevanz, wenn man Messwerte von mehr als zwei
unterschiedlichen Messquellen heranzieht.
Will man zum Beispiel Werte von Videometrie, Laufband,
Biodex und Posturographie einbeziehen, so wird man
nur wenige Probanden finden, die alle vier Messungen
durchgeführt haben. Es gibt aber eine größere Menge
von Probanden, die Videometrie und Laufband absolviert
haben. Von diesen werden bei Einzeln berechnen
die entsprechenden Korrelationen zwischen Videmetrie
und Laufband berechnet. Eine andere Menge von Probanden
wird Laufband und Biodex absolviert haben. Von diesen
werden die entsprechenden Korrelationen zwischen
Laufband und Biodex berechnet.
Das bedeutet aber auch, dass die einzelnen Korrelationen
der Korrelationsmatrix auf unterschiedlichen Stichproben
basieren. Daher erscheint bei den Ergebnissen zusätzlich
eine Matrix der Stichprobengrößen. Dort wo die Stichprobe
als einzelne Zahl angeführt wird, erscheint jeweils
die kleinste in der Matrix aufgetretende Anzahl.
Hinweis: Bei Einzeln berechnen können auch
negative Eigenwerte (=Hauptkomponenten) auftreten. Der
entsprechende Balken fehlt dann im Scree-Plot. Wenn es
sich dabei um einen großen Eigenwert handelt, ist das
Ergebnis in Frage zu stellen (siehe
hier
bzw.
hier
)
Wenn die Berechnung abgeschlossen ist kann mit Start
ein Menü mit folgenden Punkten geöffnet werden:
MAL-Homepage Inhaltsverzeichnis
11. VERGLEICHE 11.1. Vergleich von Gruppen
Diese Analyse zeigt ein Balkendiagramm für einen Messwert
bei verschiedenen Probandengruppen an. Sie wird mit
Insert / Vergleich / Gruppen eingerichtet.
Die Auswahl der Probandengruppen
erfolgt bei Konfiguration unter Gruppen. Dabei
wird eine Tabelle mit allen in der Gruppentabelle
definierten Gruppen angezeigt.
Wählt man Konfiguration / Parameter so erscheint eine
Eingabemaske.
Mit dem Parameter Streuung_anzeigen kann eingestellt werden,
ob die Streuungen der Stichproben mit eingeblendet werden sollen
(0=keine Anzeige, 1=mit Anzeige).
MAL-Homepage Inhaltsverzeichnis
11.2. Vergleich per gestufter Variable
Es wird ein Skalarwert bei verschiedenen Probandengruppen verglichen,
wobei die Einteilung in Gruppen über eine gestufte Variable erfolgt.
Der Parameter
pro_Proband bestimmt sowohl für den Messwert als auch die
Stufung, wie bei Vorhandensein mehrerer Messungen bei einem
Probanden vorgegangen wird. Wird dabei "Mittelwert", "Veränderung", "Steigerung"
oder "Reduktion" ausgewählt, dann werden nur Probanden ausgewertet,
bei denen alle Messungen in die gleiche Stufe fallen.
Beispiel der Konfiguration eines Stufenvergleichs:
MAL-Homepage Inhaltsverzeichnis
11.3. Vergleich von Kategorien
Diese Analyse stellt ein Balkendiagramm für einen
Messwert aufgeschlüsselt nach einem, in Kategorien
eingeteilten, zweiten Messwert dar. Sie wird mit
Insert / Vergleich / Kategorien eingerichtet.
Folgende Parameter sind
einstellbar:
MAL-Homepage Inhaltsverzeichnis
11.4. Varianzanalysen (ANOVA)
Mit insert/Vergleich/Varianzanalyse wird eine Varianzanalyse
in die Berechnungstabelle eingetragen. Sie muss in der
Folge markiert und mit dem Menüpunkt Kofigurieren entsprechend
konfiguriert werden.
Es besteht die Möglichkeit Einweg- und Mehrweg-Varianzanalysen
durchzuführen. Wird nur ein Merkmal angegeben, so wird automatisch
eine Einweg-Varianzanalyse ausgeführt.
Mehrweg-Analysen haben
den Nachteil, das die Stichprobengröße für jede Merkmalskombination
gleich sein muss. Das Programm bestimmt daher zunächst die
kleinste auftretende Stichprobe und läßt gegebenenfalls bei
den anderen Merkmalskombinationen Werte weg. Damit aber nicht
einzelne Merkmalsausprägungen die ganze Analyse zerstören
(weil sie eine leere oder sehr kleine Stichprobe haben) besteht
die Möglichkeit diese durch Eintragen in die Ausschlussliste
(siehe unten) aus der Berechnung wegzulassen.
Setzt man die Parameter 'Gruppieren' und 'Zwischenergebnis_anzeigen'
in der Parametermaske auf eins, so erhält man einen Überblick
über die zur Analyse verwendeten Messwerte.
Die letztlich
für die Analyse verwendete Stichprobengröße erscheint in der
ANOVA-Tabelle rechts unten (n=...).
Beispiel:
+-----------------------------------------------------------------+ I Source I SS I df I MS I F I p I +-----------------------------------------------------------------+ I Rehab I 4316.43 I 1 I 4316.43 I 36.9281 I 2.01264e-09 I I Bearbeiter I 4450.33 I 6 I 741.722 I 6.34562 I 1.6244e-06 I I Rehab/Bearb I 1782.08 I 6 I 297.014 I 2.54103 I 0.0193028 I I Seite I 21.3021 I 1 I 21.3021 I 0.182244 I 0.669583 I I Rehab/Seite I 22.7429 I 1 I 22.7429 I 0.194571 I 0.659275 I I Bearb/Seite I 70.8065 I 6 I 11.8011 I 0.100961 I 0.996279 I I Reh/Bea/Sei I 15.7305 I 6 I 2.62175 I 0.0224298 I 0.999951 I I Error I 81821.1 I 700 I 116.887 I I I I Total I 92500.5 I 727 I I I n=26 I +-----------------------------------------------------------------+
(Eine Beschreibung dieser Tabelle findet
man auch bei den
Datenexporten.)
MAL-Homepage Inhaltsverzeichnis
11.5. XY-Plots
Für Betrachtungen im zweidimensionalen Merkmalsraum kann die
Analyseart XY-Plot hilfreich sein. Sie kann mit
Insert / Vergleiche / XY-Plot eingerichtet werden.
Mit einem Einfachklick wird die neu eingerichtete Analyse
markiert und mit dem Menüpunkt Konfigurieren erscheint
ein Menü mit den Punkten
MAL-Homepage Inhaltsverzeichnis
12. CLUSTER-ANALYSE
Die Cluster-Analyse teilt eine Stichprobe im multidimensionalen
Merkmalsraum in eine vorgegeben Anzahl von Gruppen möglichst
ähnlicher Probanden. Als Ähnlichkeitsfunktion wird die
euklidische Distanz (das Abstandsquadrat) zum Gruppenzentrum
(= Mittelwert der Gruppe) verwendet. Nähere Details zum
Berechnungsverfahren findet man bei der Beschreibung
des Wortes
cluster_analysis.
Das Einrichten einer Cluster-Analyse erfolgt mit
Insert / Gruppenanalyse. Mit einem Einfachklick
auf die neu eingerichtete Analyse und dem Menüpunkt
Konfigurieren erreicht man das Konfigurationsmenü,
das aus den Menüpunkten Parameter und Werteliste besteht.
Der Menüpunkt Parameter öffnet folgende Eingabemaske:
MAL-Homepage Inhaltsverzeichnis
13. KURVEN
Wählt man bei der Defintion eines Eintrags in der
Wertedefinitionstabelle
den Menüpunkt Kurven und trägt unter Berechnungsart
"Kurve" ein (siehe unten stehendes
Beispiel), so wird für jede Messung anstatt
eines Skalarwertes eine Kurve berechnet. Mit einem Doppelklick
auf den Messwert-Eintrag (entspricht dem Menüpunkt Histogramm)
wird die mittlere Kurvenform und der Streuungsbereich angezeigt.
Beispiel für die Definition eines Kurven-Messwertes:
MAL-Homepage Inhaltsverzeichnis
13.1. Gruppenvergleich von Kurven
Eine ausführlichere Darstellung von Kurven kann man erreichen,
indem man in die Berechnungstabelle mit
Insert / Kurven / Gruppenvergleich eine neu Kurvenanalyse
einträgt und diese entsprechend konfiguriert.
Zunächst erscheint beim Konfigurieren folgende Parametermaske:
MAL-Homepage Inhaltsverzeichnis
13.2. Zeitvergleich von Kurven
Ähnlich wie beim Gruppenvergleich von Kurven erscheint
auch hier beim Konfigurieren zunächst eine Parametermaske:
MAL-Homepage Inhaltsverzeichnis
14. TRENDS 14.1. Trends von Einzelwerten
MAL-Homepage
Inhaltsverzeichnis
Trendanalysen von Einzelwerten werden mit
Insert / Trend / Einzelwerte eingerichtet.
Sie zeigen den zeitlichen Verlauf eines Skalarwertes
für verschiedene Probanden auf. Die Zeitrechnung erfolgt
in Tagen bezogen auf die erste erfasste Messung (=Tag Null).
Wird im Parameter Regressionsgrad ein Wert größer Null
eingetragen, so wird eine Regressionsgerade (oder Polynom bei
Graden größer 1) eingezeichnet.
Die Werte der Trendkurven können wahlweise auf den Startwert,
den Mittelwert oder nicht normiert werden (Parameter
normieren_auf). Normieren auf den Startwert bedeutet
z.B. dass alle Werte eines Probanden durch den Wert bei
der ersten Messung dividiert werden.
Der Parameter einzeln_anzeigen dient nur für
Kontrollzwecke bzw. zur Fehlersuche. Ist er ungleich Null, so
wird für jeden Probanden ein eigenes Bild ausgegeben. Mit
der Escape-Taste kann dann jeweils das aktuelle Bild
geschlossen und zum nächsten geprungen werden. Ein Abbruch
dieser Folge ist nicht vorgesehen.
14.2. Trend-Tabellen
Analysen, die mit Insert / Trend / Tabelle eingerichtet
werden erlauben verschiedenste Darstellungen
des Rehabilitationserfolges bei mehreren Messwerten.
Verglichen wird jeweils der erste und letzte erfasste
Messwert jedes Probanden. Man muss dabei beachten, dass
bei manchen Messwerten ein kleinerer Wert als besser
angesehen werden muss (z.B. Schrittlängendifferenz).
Für diesen Falls sollte in der Messwerttabelle beim
Parameter Grad -1 eingetragen werden, dann wird
der entsprechende Wert vor der Analyse mit -1 multipliziert.
Unter dem Menüpunkt Konfiguration / Parameter erscheint
folgende Eingabemaske:
MAL-Homepage Inhaltsverzeichnis
14.3. Zeitverläufe von Einzelwerten
Zeitverläufe dienen dazu, das Langzeitverhalten von
Messgrößen zu überprüfen, um eventuelle Störeinflüsse
oder Fehler im Messverfahren entdecken zu können.
Sie können mit Insert / Trends / Zeitverlauf eingerichtet
werden.
Das folgende Beipiel zeigt Verlauf der Gehgeschwindigkeit
beim Videometrie-Schnelltest
über etwa zwei Jahre.
MAL-Homepage Inhaltsverzeichnis
15. MUSTERERKENNUNG
Das Analyseverfahren "Mustererkennung" stellt einen gemeinsamen
Bedienrahmen für Algorithmen vom Typ
Neuronale Netze,
Random Forest,
naive Bayes Klassifikation und
multiple Regression dar.
Es wird das sogennannte Supervised Learning verwendet.
Das bedeutet, dass der Mustererkennung zunächst eine
Menge von Beispieldatensätzen (das Trainingset) bestehend aus
Inputdaten und Sollvorgaben (Targets) präsentiert wird. Die
Mustererkennung versucht dabei einen Zusammenhang zwischen
Inputdaten und Sollvorgaben zu extrahieren.
Dieser Vorgang wird Training genannt.
In einem nachfolgenden Test wird anhand einer von den Beispieldaten
disjunkten Menge (genannt Testset) überprüft, wie allgemeingültig
der von der Mustererkennung gefundene Zusammenhang ist.
Je nach Beschaffenheit der Sollwerte (Target-Werte) wird
zwischen Regression und Klassifizierung unterschieden.
Bei Regressionen muss der Sollwert ein Skalar sein (Realzahl),
bei Klassifizierungen eine Klassennummer (ganze Zahl 1 .. n) oder
ein Klassenname (Textwert).
Die Inputdaten müssen in jedem Fall aus einer Menge von Skalarwerten
bestehen (Realvektor).
In der Praxis testet man mit einem bestimmten Trainings- und
Testdatensatz verschiedene Mustererkennungssysteme (verschiedene
Verfahren, verschiedene Parameter etc.) und sucht dann das
erfolgreichste aus. Weil aber die Berechnung der Daten meist
sehr zeitaufwändig ist, ist das Progamm so gestaltet, dass
die Trainings- und Testdaten nur nach Änderung der Konfiguration
neu berechnet und dann beim Analyseintrag in der Tabelle
der Berechnungen gespeichert werden.
Sind die Trainings- und Testdaten einmal berechnet, kann man
in die Liste der Algorithmen verschiedene Testverfahren eintragen,
konfigurieren und testen. Man beachte, dass Neuronale Netze
und der Random Forest mit zufälliger
Initialisierung arbeit. Das heisst, dass auch zwei gleich
konfigurierte Algorithmen unterschiedliche Lernerfolge
haben können. Daher richtet man meisst mehrere gleichartige
Lernverfahren ein, trainiert sie alle und sucht dann
das erfolgreichste aus.
MAL-Homepage Inhaltsverzeichnis
15.1. Trainings- und Testset vorbereiten
Trainings- und Testsets werden durch Einträge
in die Gruppentabelle des Datensammelsystems
definiert (Datensammlung / Gruppen).
Normalerweise nimmt man eine Grundmenge und teilt
diese zufällig in die Trainings- und die Testmenge.
Man nimmt also zum Beispiel 75% der Grundmenge
in das Trainingsset und den Rest in die Testmenge.
Um die Zuverlässigkeit des Tests zu garantieren,
sollten keine Probanden in beiden Gruppen vorkommen.
Daher muss folgendermaßen vorgegangen werden:
grundmenge 75 %
grundmenge trainingsset -
MAL-Homepage Inhaltsverzeichnis
15.2. Einrichten und Konfigurieren
Einrichten:
Wenn man vom Hauptmenü der Datensammlung aus die Tabelle
der Berechnungen geöffnet hat, kann man mit dem Menüpunkt
Insert eine neue Berechnung einfügen. Nachdem man die
Parameter
Bezeichnung und Kommentar in die Maske eingegeben hat,
erscheint ein Menü, aus dem man den Menpunkt Mustererkennung
wählt. Danach muss man entscheiden, ob man ein Regressions-
oder Klassifizierungsproblem bearbeiten möchte
(siehe oben).
Konfigurieren:
Mit einem Einfachklick auf die neue Berechnung und dem Menüpunkt
Konfigurieren wird folgendes Menü geöffnet.
MAL-Homepage Inhaltsverzeichnis
15.3. Analyse der Mustererkennungen
Mit einem Doppelklick auf einen Mustererkennungs-Eintrag
in der Tabelle der Berechnungen bzw. mit dem Menüpunkt
Start wird die Analyse gestartet. Abhängig davon, ob
es sich um eine Regressionsanalyse oder eine Klassifizierung
handelt, erscheinen in der Folge unterschiedliche Auswahlsmenüs.
Bei Regressionsanalysen erscheint ein Menü mit den Punkten
MAL-Homepage Inhaltsverzeichnis
15.4. Neuronale Netze
Neuronale Netze können sowohl für Regressions- als auch
Klassfizierungsaufgaben herangezogen werden. Es werden
vollkonnektierte, analoge Feed Forward Netze mit sigmoider
Charakteristik verwendet.
Als Lernverfahren wird die sog. Backpropagation
(supervised learning) verwendet. Nähere Details
findet man im Kapitel Neuronale Netze.
Wird in der Tabelle der Algorithmen bei
einem neuronalen Netz der Menüpunkt
Konfiguration ausgewählt, so
erscheint folgende Maske:
MAL-Homepage Inhaltsverzeichnis
15.5. Random Forest
Der Random-Forest Algorithmus zählt ähnlich wie die
neuronalen Netze
zu den Data-Mining-Algorithmen, also jenen Algorithmen die
zur Erkennung von Gesetzmäßigkeiten in multidimensionalen
Merkmalsräumen bei großen Stichproben dienen. In der hier
vorliegende Form wird der Algorithmus für die Klassifizierung
n-dimensionaler Merkmalsvektoren mit Supervised Learning, also
Lernen anhand von Beispielen bei denen die richtige Klasse
vorgegeben ist, verwendet.
Der Algorithmus stammt von Leo Breiman und Adele Cutler
(Copyright).
Das Fortran-Original ist
hier
zu finden.
Wird in der Tabelle der Algorithmen bei
einem Random Forest der Menüpunkt
Konfiguration ausgewählt, so
erscheint folgende Maske:
MAL-Homepage Inhaltsverzeichnis
15.6. Naive Bayes Klassifikation
Für das Klassifizierungsproblem können auch sogenannte
Bayesian Classifiers verwendet werden. Sie berechnen die
Wahrscheinlichkeit, mit
der ein Datensatz zu einer bestimmten Klasse gehört und ordnen
ihn dann jener Klasse mit der höchsten Wahrscheinlichkeit zu.
Beim hier verwendeten Verfahren werden zwei Annahmen getroffen:
MAL-Homepage Inhaltsverzeichnis
15.7. Mustererkennung mit multipler Regression
Es wird ein lineares Regressionsmodell mit mehreren unabhängigen
Variablen verwendet. Ähnlich wie bei der bekannten linearen
Regression nach dem Modell y=k*x+d wird eine Optimierung nach der Kleinstquadrat-Methode
durchgeführt. Eine genauere Beschreibung des mathematischen
Verfahrens findet man bei der Dokumentation des Wortes
multi_regress.
Im Gegensatz zu den meisten anderen Mustererkennungsverfahren
benötigt die multiple Regression keine Parameterisierung
und wird auch nicht zufällig initialisiert (es ist überhaupt keine
Initialisierung erforderlich). Sie liefert
also bei einem bestimmten Trainingsdatensatz exakt ein
Ergebnis.
MAL-Homepage Inhaltsverzeichnis
15.8. Die Treffermatrix
Bei Klassifizierungsaufgaben wird der Trainingserfolg
mit der Trefferrate (prozentueller Anteil der
richtig zugeordneten Probanden) und detailierter mit der
Treffermatrix beschrieben. Die Treffermatrix enthält in jeder
Spalte die Anzahl der tatsächlich vorkommenden Probanden einer
Klasse (in der letzten Zeile ist die Summe der jeweiligen Spalte).
Jede Zeile enthält die Zahl der von der Mustererkennung
zugeordneten Probanden (in der rechtesten Spalte ist die Summe
der jeweiligen Zeile). In der Hauptdiagonale finden sich
also die Anzahlen der richig zugeordneten Probanden.
+-----------------> echte Klasse | | 84 35 119 L.Insult | 29 66 95 R.Insult | | 113 101 214 V 70.1% Treffer berechnete KlasseIm vorliegenden Beispiel gibt es also 113 Patienten mit linkshirnigem Insult und 101 mit rechtshirnigem. Die Mustererkennung teilt aber 119 Probanden der Gruppe "L.Insult" und 95 der Gruppe "R.Insult" zu. Die Klasse "L.Insult" sollte also etwas weniger Gewicht erhalten. Von den 113 linkshirnigen Insulten erkennt die Mustererkennung 84 richtig und 29 werden versehentlich der Gruppe "R.Insult" zugeordnet.
MAL-Homepage Inhaltsverzeichnis
16. AUSLASTUNGSKURVEN
Auslastungskurven zeigen die Anzahl von Messungen
pro Woche, die mit einer bestimmten Messquelle
durchgeführt wurden. Die Analyse wird mit
Insert / Auslastung eingerichtet. Beim Konfigurieren
erscheint folgende Maske:
MAL-Homepage Inhaltsverzeichnis
17. EXPORTE 17.1. Export von Einzelwerten
Die einfachste Methode Einzelwerte auf Textdatei zu
schreiben ist, indem man die Tabelle
Wertedefinitionen
öffnet, den gewünschten Wert markiert und den
Menüpunkt Write to File / Values aufruft. Mit
dem Menüpunkt Gruppe kann man den Datenexport auf
eine bestimmte Probandengruppe beschränken.
Man kann aber auch einen Eintrag in der Tabelle der
Berechnungen erstellen.
Mit Exporten vom Typ Einzelwerte kann jeweils ein Skalarwert
auf eine Textdatei exportiert werden.
Hinweis: Damit die Daten von Excel korrekt gelesen werden, muss
im Windows-Startmenü unter
"Einstellungen / Systemsteuerung / Ländereinstellungen"
das Dezimaltrennzeichen auf "." (Punkt) und das Trennzeichen
für Zifferngruppen auf "," (Komma) eingestellt werden.
Als Zieldatei für den Matlab-Export kann man z.B.
"c:\Matlab6p1\work\daten.m" einstellen. Dann kann man von
Matlab aus die Daten durch Eingabe des Kommandos 'daten' einlesen.
Dabei werden neue Variable "Vorname", "Familienname" usw. eingerichtet.
Mit 'who' erhält man eine Übersicht über die neuen Variablen.
Eine dieser Variablen hat den Namen des exportierten
Skalarwertes.
MAL-Homepage Inhaltsverzeichnis
17.2. Export von Tabellen
Mit Exporten vom Typ Mehrfachwerte können Messwerttabellen
erzeugt werden.
Beim Konfigurieren erhält man mit dem Menüpunkt
Parameter folgende Eingabemaske:
MAL-Homepage Inhaltsverzeichnis
18. STYLE-SHEETS
Style-Sheets dienen für die optische Gestaltung von Graphiken.
Jedes Style-Sheet definiert für die einzelnen Elemente einer
Graphik die Schriftart, die Farben, den Hintergrund etc..
Nachdem die verschiedenen Graphiken meist änliche Elemente
enthalten, entsteht bei Verwendung eines Style-Sheets
für mehrere Graphiken ein einheitlicher Gesamteindruck.
Beispiel einer Graphik ohne Style-Sheet:
MAL-Homepage Inhaltsverzeichnis
18.1. Testen von Style-Sheets
Um Style-Sheets entwerfen zu können, ist es hilfreich sie rasch
testen zu können. Zu diesem Zweck benötigt man zuerst eine
Beispiels-Graphik im Meta-Format.
Man stellt zunächst mit dem
Menüpunkt Configuration den Parameter Enable-Printouts auf 1 und
wählt dann in der Tabelle Berechnungen die gewünschte Graphik
und startet diese. Wenn die Graphik am Bildschirm erschienen
ist kann man sie schließen. Es erscheint dann ein Menü
mit dem Titel "Graphikausgabe". Dort kann der Menüpunkt
Meta-File ausgewählt und der Name für die Meta-Datei
angegeben werden.
Mit einem Doppelklick auf einen Eintrag in der Tabelle
Style-Sheets wird das Konfigurationsmenue für das entsprechende
Style-Sheet geöffnet. Dort findet man den Menüpunkt Testen.
Wenn man diesen auswählt und den Namen der oben erstellten
Meta-Datei angibt, wird die Graphik mit diesem Style-Sheet
aufbereitet und am Schirm angezeigt.
MAL-Homepage Inhaltsverzeichnis
18.2. Entwurf von Style-Sheets
Wenn man vom Hauptmenü der Datensammlung aus den
Menüpunkt Style-Sheets gewählt hat, kann mit dem Menüpunkt
Insert ein neues Style-Sheet angelegt werden. Mit einem
Doppelklick auf den neuen Tabelleneintrag kann es konfiguriert
werden.
Jedes Style-Sheet besteht aus einer Beschreibung des
Rahmens
für die Gesamtgraphik und aus einer Tabelle in der für die
verschiedenen möglichen
Graphikelemente
Darstellungseingenschaften
eingestellt werden können.
Rahmen
Die Beschreibung des Rahmens wird durch folgende Maske
vorgenommen:
Der unter Rahmenbeschriftung eingegebene Text wird in
den Kopf des Rahmens eingeblendet. Als Rahmenart stehen
"3d-Rahmen", "2d-Rahmen" und "Rechteck" sowie ein Leerstring
(kein Rahmen) zur Verfügung.
Eine Palette der Farbnamen findet man
hier.
Graphikelemente
Die Attribute für die Graphikelemente sind in einer Tabelle
untergebracht. Die Eingabemaske für die Attribute eines
Graphikelementes sieht wie folgt aus:
Das Feld Elementname bestimmt, für welche Elemente der Graphik
die weiteren Attribute angewendet werden sollen. Dabei
können Abkürzungen verwendet werden, um bestimmte Gruppen
von Graphikelementen mit einer Maske beschreiben zu können.
Wird zum Beispiel der Elementname "Balken" eingetragen,
so gelten die Attribute für die Elemente "Balkenbeschriftung",
"Balkenreihe1", "Balkenreihe2"
u.s.w und "Balken". Soll für ein Element (oder
eine Gruppe) dann ein anderer Attributsatz verwendet werden,
so muss dieser danach in die Tabelle eingetragen werden.
Soll ein Element überhaupt nicht angezeigt werden, so muss
man in das Feld anzeigen 0 eintragen.
Farben können jeweils für alle vier Ecken des Graphikelements
angegeben werden. Damit können beliebige Farbverläufe definiert
werden. Will man eine einheitliche Farbe, so genügt die
Einstellung in einem beliebigen der vier Felder. Will man
einen Farbverlauf von oben nach unten, so kann man die
Farbangaben entweder in den Feldern ..._links_oben und
..._links_unten oder ..._rechts_oben und
..._rechts_unten machen.
Bei den Parametern Hintergrund_Randbreite, Hintergrund_Randstärke
und Hintergrund_Abrundung sind die Angaben jeweils in Promille
von der Höhe des Graphikelements zu machen. Das gleiche gilt
für den Parameter Schräglage.
Bei den Verschiebungsparametern bezieht sich die
Promillangabe aber auf die Größe des Mutterfeldes, in
dem das Element eingebettet ist (meist das Plot-Area).
MAL-Homepage Inhaltsverzeichnis
19. PROGAMMSTUKTUR
Sämtliche Worte des Datensammelsystems sind im Public-Pool
im NRZ-Folder zu finden und dem Topic
collection zugeordnet.
MAL-Homepage Inhaltsverzeichnis
19.1. Collection-Klassen
Damit die Anzeige von gespeicherten Daten und die Definition
der Berechnungen von Skalarwerten einheitlich durchgeführt
werden kann, ist für jedes Messdaten-Erfassungssystem eine
Klasse für die einzutragenden Daten definiert. Die Namen dieser
Klasse enden alle mit '_collection_class'
(z.B laufband_collection_class).
Diese Klassen benötigen abgesehen vom Konstruktor nur zwei
Funktionen, nämlich show für die Anzeige der Daten im Textformat und
define_calculation für die interaktive Definition von
Skalarwertberechnungen. Zweitere muss als Ergebnis eine
Doppelpunktdefinition liefern, die folgender Syntax genügen muss:
this -> skalar
'this' .. Instanz der entsprechenden Collection-Class.
'skalar' .. Realzahl für statistische Berechnungen.
MAL-Homepage Inhaltsverzeichnis
19.2. Berechnungs-Klassen
Die Einführung von eigenen Klassen für die einzelnen
Berechnungstypen in der Berechnungstabelle hat vor allem
den Zweck, die Konfigurationen individuell gestalten zu
können.
Daher haben die Berechnungsklassen nebst dem Konstruktor
nur die Funktionen configure (interaktive Konfiguration)
und start (Start der Berechnung).
Die Superklasse alle Berechnungsklassen ist
calculation_class.
Folgende Berechnungsklassen sind derzeit definiert:
histo_class,
quantile_class,
regress_class,
comparison_class,
trend_class
und export_class.
Die Interfaces von Berechnungsklassen müssen im Wort
calculation_interfaces
angeführt werden. Außerdem muss für neue Berechnungsklassen
im Konstruktor der Superklasse
calculation_class ein
einsprechender Menüpunkt eingetragen werden.
MAL-Homepage Inhaltsverzeichnis
19.3. Eintragen von Messdaten
Zum Eintragen von Datensätzen wird das Wort
collect_data verwendet.
Es kontrolliert, ob der entsprechende Datensatz bereits
eingetragen ist. Verwendet wird dazu die
Identifikation die
der Datensatz bei der Archivierung ins
Mess-Archiv erhalten
hat.
Neue Einträge werden an der entsprechenden Stelle in den
jeweiligen Baum eingetragen. Bei bestehenden Einträgen
wird geprüft, ob sich die Version des Messdatensatzes oder
die Version des Verarbeitungsalgorithmus geändert hat.
Nur in diesem Fall wird der Datensatz neu berechnet und
eingetragen.
Diese Methode dient dazu, die Berechnungszeiten
zu optimieren bei gleichzeitiger Garantie, dass alle
Datensätze mit der gleichen Algorithmusversion
berechnet wurden.
Für die Bestimmung der Datensatzversion und
Algorithmusversion wird jeweils die Identifikation
des letzten Logbook-Eintrages herangezogen.
Ist das Loogbook leer, so wird als Version
der String 'primary' vergeben.
Daher ist bei Veränderungen an Datensätzen
in den Mess-Archiven (z.B. Korrektur der Diagnose) ein
entsprechender Logbook-Eintrag zu machen.
Mit dem Wort collect_data
kann der Datensatz einer Messung in die Datensammlung eingetragen
werden. Um Programmlaufzeit zu sparen, werden die Messdaten
aber nur im Bedarfsfall berechnet. Daher ist das Wort
collect_data
nicht mit dem Datensatz sondern mit einer
Berechnungsroutine für den Datensatz zu versorgen.
Der Datensatz selbst muss eine Instanz einer von
collection_data_class
abgeleiteten Klasse sein.
Damit die Versorgung über den Stack nicht zu aufwändig wird,
erwartet collect_data sämtliche
Probandendaten in Form von globalen Variablen. Von einer
Auswertungsklasse aus kann das einfach erreicht werden, indem
die Variable selection mit >voc ins Vokabular geladen wird.
MAL-Homepage Inhaltsverzeichnis