Auswerten mit GTDS

Einführung

Bei der Entwicklung des GTDS wurde entschieden, daß die Anwendung auf einer möglichst redundanz- und damit widerspruchsfreien Datenbank beruhen soll. So soll zum Beispiel der Name des Patienten nicht bei jedem Tumordatensatz stehen, sondern in einer Patientenstamm-Tabelle, damit z.B. Änderungen nur an einer Stelle durchgeführt werden müssen. Des weiteren werden zum Beispiel auch Metastasen nicht in der Tumortabelle gespeichert, weil sonst z.B. nur eine begrenzte Anzahl von Metastasen gespeichert werden könnte (z.B. Metastase1 bis Metastase3). Es ist daher sinnvoller, Metastasen in einer Extra-Tabelle zu speichern. Solche Überlegungen wurden für eine Vielzahl von Informationen durchgeführt. Dieses Vorgehen, EDV-technisch "Normalisierung" genannt, führte dazu, daß die Daten innerhalb des GTDS auf eine Vielzahl von Tabellen verteilt sind.

Bei einer Auswertung möchte man andererseits häufig wissen, welcher Tumor eine Metastase verursacht hat und wie die Person heißt oder wann sie geboren ist. Zu diesem Zweck muß man Tabellen wieder zusammenführen. Die Sprache hierzu nennt sich SQL und muß relativ aufwendig erlernt werden. Darüber hinaus muß man das sogenannte Datenmodell des GTDS kennen, um die Tabellen richtig zusammenzuführen. Diese Erfahrungen können jedoch nicht an jedem Ort vorausgesetzt werden. Hier bieten sich zwei Strategien an:

  1. Programmieren fester Statistiken: Der Benutzer bestimmt, was er wissen/zählen möchte, und die Entwickler schreiben einen Bericht, den man dann zum Beispiel in der Berichtsauswahl der Leitstellen-Maske anwählen kann.
  2. Aufbereiten von Daten für eigene Zählungen: Häufig benötigte Daten aus verschiedenen Tabellen werden in einer Tabelle zusammengeführt, die dann der Benutzer selbst auswerten kann.

Das erste Vorgehen hat den Vorteil, daß es leicht zu starten ist und wenige Angaben als Parameter benötigt. Dieser Vorteil ist aber gleichzeitig ein Nachteil, denn bei allen Bemühungen um Parametrisierung sind diese Berichte relativ starr und die Wahrscheinlichkeit ist groß, daß der nächste Benutzer eine leicht veränderte Fragestellung hat, die dann nicht mehr mit den bestehenden Berichte zu lösen ist. Solche Berichte eignen sich demnach nur für Fragestellungen, die sich kaum verändern, aber häufig, z.B. wie eine monatliche Leistungsstatistik häufig gebraucht werden. Eine Liste von solchen Berichten (entsprechend Registerbezug in der Maske Dynamisches Modul) findet sich hier.

Das zweite Vorgehen hat zunächst den Nachteil, daß nach der Zusammenführung von Daten diese auch analysiert werden müssen. Hierzu muß der Benutzer meist weitere Programme wie Tabellenkalkulations-Programme (z.B. MS-Excel) oder Statistikprogramme (wie z.B. SPSS) einsetzen. Dafür können Auswertungen sehr leicht, d.h. ohne zentrale Programmierung durchgeführt werden. Diese Tabellen werden "Auswertungstabellen" genannt.

Für beide Verfahren ist ein grundsätzliches Verständnis erforderlich. Beim ersten Verfahren sollte sich der Benutzer informieren, was ein fertiger Bericht tatsächlich zählt, um die Ergebnisse richtig interpretieren zu können. Es gibt eine Vielzahl von Berichten, angesichts derer auch die Entwickler häufig im Quelltext nachsehen müssen, um adäquat Auskunft geben zu können.

Auch für die Anwendung von Auswertungstabellen muß der Benutzer wissen, welche Idee hinter der jeweiligen Tabelle und ihren Spalten steckt, um sie korrekt anzuwenden zu können. Dies soll an folgendem Beispiel erläutert werden:

Hinter der Tabelle AUSWERTUNG steckt die Idee, daß jeder Datensatz genau einen Tumor repräsentiert. Die Tabelle enthält auch einige Detailaussagen über die Therapie. Da aber bei einem Tumor jedoch häufig mehrere Therapien, beispielsweise mehrere Operationen, durchgeführt werden, können bestimmte Details nur von der ersten Therapie, also in diesem Fall der ersten Operation einbezogen werden, auch wenn die vielleicht wichtigere Operation erst im zweiten Schritt erfolgt ist. Es wäre also falsch, sich für die Analyse, welche operative Therapie erfolgt ist, nur auf diese Information zu stützen.

Praktisches Vorgehen

Eine Auswertung besteht in der Regel aus folgenden Schritten:

Jeder, der an das Register mit einem Auswertungswunsch herantritt, muß also wenigstens sprachlich formulieren können, welche Datensätze (Fälle, Therapien) er analysiert haben möchte und welche Variablen von diesen Datensätzen interessieren.

Beispiel

Das eben gesagte soll nun an einem Beispiel nachvollzogen werden. Angenommen jemand möchte, aufgeschlüsselt nach pT, wissen, wie die operative Therapie bei Mammakarzinom bei allen von Abteilung 1 mitbehandelten und in den Jahren 2001-2003 behandelten Patienten erfolgte.

Beim Aufruf der Auswertungsmaske werden alle für den Benutzer zugreifbaren, ggf. auch nur die Patienten angezeigt, die von einer bestimmten Abteilung mitbehandelten Patienten angezeigt. Nur der Benutzer OPS$TUMSYS kann wirklich alle Fälle betrachten, alle anderen Benutzer , auch sogenannte Leitstellenbenutzer, bekommen maximal diejenigen zu sehen, die von Abteilungen mitbetreut werden, auf die sie als zugriffsberechtigt eingetragen sind. In diesem Fall muß also die gefragte Abteilung 1 für den Benutzer zugreifbar sein. Im ersten Schritt geht es darum, die Grundgesamtheit einzuschränken. Zunächst sollen alle Mammakarzinome herausgesucht werden. Der Einfachheit halber (ohne Rücksicht auf den histologischen Typ) sollen diese über die Lokalisation "50" bestimmt werden. Die Maske wird mit "F7" in den Abfragemodus versetzt und der Cursor wird in das Feld LOKALISATION gesetzt.

Im Abfragemodus können gewünschte Filter-Werte einfach in das betreffende Feld gesetzt werden. "50%" heißt, daß nach der 50 beliebig viele Zeichen folgen dürfen. In diesem Fall werden also sämtliche Lokalisationscodes der Mamma erfaßt. Mit "F8" wird die Abfrage ausgeführt:

Das Ergebnis ist an diesen Testdaten sehr übersichtlich. Drückt man statt "F8" die Tastenkombination "Umschalt-F2", bekommt man die Zahl der gefundenen Datensätze in der Statuszeile angezeigt. Für die weitere Einschränkunkung der Grundgesamtheit soll die Abfrage-Hilfsfunktion benutzt werden. Nach "Speichern" der Abfrage gelangt man in das entsprechende Fenster:

Wie man sieht, ist das Filtern nach Lokalisation bereits in die WHERE-Bedingung übernommen worden. Im unteren Teil der Masker ist in "weitere" bereits das Diagnosedatum ausgewählt und der gewünschte Zeitraum eingetragen worden. Mit Hinzufügen wird dieser Teil in die Bedingung übernommen. Das gleiche wird noch für die Abteilung 1 als betreuende Abteilung durchgeführt:

Um die Abfrage später wieder auswählen zu können, wurde sie gespeichert. Sie kann auch in eine Datei exportiert und in einem anderen System wieder eingelesen werden. Auf diese Weise haben die Entwickler die Möglichkeit, kompliziertere Abfragen zu verteilen.

Der zweite Schritt umfaßt nun die Auszählung der gefragten Variablen. Eine erste Übersicht gibt die sogenannte "Standard-Auswertung" mit Angabe von Altersverteilung, Verteilung von Lokalisationen, Histologien, TNM-Kategorien und Stadien. Für die angebene Fragestellung ist dies jedoch nicht ausreichend, da auch Angaben zur operativen Therapie erwartet werden. Es bestehen jetzt folgende Optionen: