Fischer: Robuste Schätzung von Kostengewichten.

Z I M   «DRGs und verwandte PCS» (Version 1.24) Kapitel I.3       Mai 2000
Letzte Änderung: 14.05.2003


I.3
Robuste Schätzung von Kostengewichten

Wolfram Fischer

Zentrum für Informatik und wirtschaftliche Medizin
CH-9116 Wolfertswil SG (Schweiz)
http://www.fischer-zim.ch/


Kapitel I.3 aus:
Diagnosis Related Groups (DRGs) und verwandte Patientenklassifikationssysteme
Kurzbeschreibungen und Beurteilung

      
Navigation
 î  ZIM-Hauptseite
 î  Navigations-Tabellen
 î  Gesamtverzeichnis
 î  Abkürzungen
DRGs und verwandte PCS
^ Verzeichnis
<   I.2   CV-Analyse
>   I.4   Verzeichnisse
 
Querverweise
»    Analysis of CWs of AR-DRG 4
»    Are DRGs Homogeneous?
Querverweise 2
»   DRGs und Pflege
»   PCS-Buch
 
 

Inhaltsverzeichnis

 

 

I.3 Robuste Schätzung von Kostengewichten 1

 

I.3.1 Problematik der Mittelwertberechnungen von Aufenthaltsdauern und Fallkosten 2

 

I.3.2 AQTM: Eine robuste Methode zur Schätzung von Mittelwerten 11

 

I.3.3 AQTM für Lognormal- und Weibull-Verteilungen 14

 

I.3.4 Schätzung der Lage- und Streuungsparameter 17

|^·<×>·v|

I.3

 

Robuste Schätzung von Kostengewichten

1

|^·<×>·v|

I.3.1

 

Problematik der Mittelwertberechnungen von Aufenthaltsdauern und Fallkosten

2

-

Das Problem

Durch das Hinzufügen eines einzigen Falles mit einem sehr hohen Wert für die Verweildauer oder für die Kosten wird der zugehörige Mittel­wert sehr stark beeinflusst.

3

 

Beispiel

Als Beispiel sei ein Extremfall genommen: Wenn wir eine Stichprobe mit 100 Behand­lungs­fällen bei einer durch­schnitt­lichen Verweildauer von 10 Tagen haben, dann genügt das Hinzufügen eines einzigen Langliegers mit einer Verweildauer von 1000 Tagen, und schon steigt die durch­schnitt­liche Verweildauer um 100 % auf 20 Tage.

4

 

«Robuste» Methoden

Gesucht sind Methoden, die Mittel­werte und Streuungsmasse liefern, welche von zufällig in der Stichprobe vorhandenen Ausreissern möglichst nicht beeinflusst werden. Solche Methoden werden «robuste» Methoden genannt.

5

1 Vgl. Hartung et al. [Statistik, 1993]: 864.

 

Bruchpunkt

Der Bruchpunkt («breakdown point») ε* gibt den Anteil der Stichprobe an, welche verändert werden kann, ohne dass sich der Schätzwert über alle Massen verändert.1

6

   

Für das arithmetische Mittel kann ein einziger Wert genügen, um es stark zu verändern. (Dies war der Fall im obigen Beispiel.) Der Bruchpunkt des arithmetischen Mittels ist deshalb ε* = 0.

7

   

Um den Median stark zu verändern, braucht es mindestens 50 % Ausreisser in einer Stichprobe. Der Bruchpunkt des Medians erreicht den höchstmöglichen Wert von ε* = 0.5.

8

2 Lagemasse geben ein «Zentrum», eine Mitte von Beob­ach­tungs­werten an. Dazu gehören arithmetische und andere Mittel­werte, Median und Modus.

   

Der Median ist also ein sehr robustes Lagemass.2 Er hat aber den Nachteil, dass die Berechnung eine Sortierung der Stichprobe voraussetzt, was bei grossen Stichproben aufwändig ist. Ausserdem kann er nicht für so viele statistische Testverfahren eingesetzt werden wie das arithmetische Mittel. Im Weiteren ist er bei schiefen Verteilungen nicht zur Berechnung von Kosten­gewichten geeignet, da dann der gewichtete Durchschnitt aller Kosten­gewichte in der gruppierten und ge­trimmten Stichprobe nicht den durch­schnitt­lichen relativen Kosten entspricht.

9

   

Gesucht ist also ein Mittel­wert, der dem arithmetischen Mittel­wert in der Grundgesamtheit entspricht, der aber nicht oder wenigstens nur wenig durch Ausreisser in der Stichprobe beeinflusst wird.

10

|^·<×>·v|

I.3.2

 

AQTM: Eine robuste Methode zur Schätzung von Mittelwerten

11

3 Vgl. Marazzi/Ruffieux [Truncated Mean, 1999] und Marazzi/Ruffieux [AQTM, 1998], worin auch zu­sammen­gefasste Herleitungen der zu verwendenden Formeln zu finden sind. – Vgl. auch: Ruffieux et al. [Truncating LOS, 2000] und Marazzi et al. [M-Estimates, 1993].

-

«Approximated Quartile based Truncated Mean»

Eine robuste und zugleich einfache Methode zur Schätzung von Mittel­werten bei Lognormal-, Gamma- und Weibull-Verteilungen wurde von Marazzi und Ruffieux unter dem Namen «AQTM» vorgestellt.3 Die Methode arbeitet mit zwei Grenzwerten, welche zur Elimination der Ausreisser vor der Berechnung des geschätzten Mittel­wertes dienen. Diese Grenzwerte wurden ausgehend von den Quartilen festgelegt. (Daher der Name dieser Methode.)

12

 

AQTM für Gamma-Verteilungen

Als Beispiel werden hier die Regeln aufgeführt, die bei der Berechnung der Schweizerischen APDRG-Kosten­gewichte der 2. Version benutzt wurden:

  1. Der obere Grenzwert wird beim 99 %-Perzentil angesetzt.
  2. Der untere Grenzwert wird so berechnet, dass die ge­trimmte Stichprobe den gleichen Mittel­wert aufweist, wie die gewählte Verteilung, die zur Stichprobe passt. (Im Falle der APDRG-Kosten­gewichte wurde durchgehend die Gamma-Verteilung gewählt, was für viele DRGs besser vertretbar ist, als die üblicherweise gewählte Lognormal-Verteilung.)

    Zur Berechnung des unteren Grenzwertes wird zuerst der Inter­quartils­abstand der loga­rith­mi­sierten Quartilswerte der Stichprobe berechnet:
    s = ln(Q3) - ln(Q1).

    Zur Kontrolle, ob die Gamma-Verteilung zur Abbildung der beobachteten Werte verwendet werden kann, müssen als Nächstes folgende Hilfswerte berechnet werden:
    klow = 1.718 + 0.167s - 0.153s2 + 0.024s3,
    khigh = 1.7 - 0.437s + 0.071s2.

    Mit der Gamma-Verteilung kann gearbeitet werden,
    wenn klow zwischen 1.55 und 1.75 liegt,
    und wenn khigh zwischen 1.10 und 1.60 liegt.

  3. Nun können die Grenzwerte ausgehend vom Median (Q2) berechnet werden als:
    tlow = exp[ ln(Q2) - klows ]
    thigh = exp[ ln(Q2) + khighs ]
  4. Schliesslich wird der Mittel­wert berechnet als das arithmetische Mittel aller Stichprobenfälle, welche zwischen tlow und thigh liegen.

13

|^·<×>·v|

I.3.3

 

AQTM für Lognormal- und Weibull-Verteilungen

14

-

Hilfswerte für die Lognormal-Verteilung

Bei der Berechnung des Mittel­wertes bei einer beobachteten Verteilung, die mit einer Lognormal-Verteilung angenähert abgebildet werden kann, gilt grundsätzlich der gleiche Algorithmus wie oben für Gamma-Verteilungen dargestellt. Die k-Werte werden aber anders berechnet:
klow = 1.720 - 0.550s
khigh = 1.725

Mit der Lognormal-Verteilung kann gearbeitet werden, wenn klow zwischen 0.60 und 1.50 liegt.

15

 

Hilfswerte für die Weibull-Verteilung

Bei der Berechnung des Mittel­wertes bei einer beobachteten Verteilung, die mit einer Weibull-Verteilung angenähert abgebildet werden kann, gilt ebenfalls grundsätzlich der gleiche Algorithmus wie oben für Gamma-Verteilungen dargestellt. Die k-Werte werden nun wie folgt berechnet:
klow = 3.260 - 1.360s + 0.200s2
khigh = 1.200

Mit der Weibull-Verteilung kann gearbeitet werden, wenn klow zwischen 1.0 und 3.0 liegt.

16

   

 

 

|^·<×>·v|

I.3.4

 

Schätzung der Lage- und Streuungsparameter

17

-

Lognormale Verteilung

Die Lognormal-Verteilung ist bei AQTM-Berechnungen charakterisiert durch folgende Schätzungen:
Mittel­wert λ = ln(Q2).
Standard­abweichung ς = s/1.349.

18

4 Hartung et al. [Statistik, 1993]: 230 ff.

 

Weibull-Verteilung

Die Weibull-Verteilung wurde erstmals zur Beschreibung von Materialermüdungserscheinungen verwendet. Es zeigte sich, dass sie auch nützlich war bei der Beschreibung von Ausfällen von Elektronenröhren, Kugellagern usw. Die Weibull-Verteilung kann somit also auch zur Berechnung der Überlebenswahrscheinlichkeiten dienen. Übertragen auf einen Kranken­haus­aufenthalt kann damit die Wahr­schein­lich­keit angegeben werden, dass ein Patient länger als x Tage im Krankenhaus ist. Sie beträgt: exp(-αxβ).4

19

   

Die Verteilungsfunktion zur Weibull-Verteilung lautet:
F(x) = 1 - exp(-αxβ) für x > 0.
Die Dichtefunktion zur Weibull-Verteilung lautet:
f(x) = αβxβ-1exp(-αxβ) für x > 0.

20

   

Bei der AQTM-Berechnung können die Parameter der zu verwendenden Weibull-Verteilung geschätzt werden als:
α = (b-a) / [ ln(Q3)-ln(Q1) ]
β = Q2 exp(-c/α)
wobei: a = ln[ln(4/3)], b=ln[ln(4)], c=ln[ln(2)].

21

   

 

 

 

Literaturverzeichnis

 
 
Hartung et al.
Statistik
1993
Hartung J, Elpelt B, Klösener KH. Statistik. Lehr- und Handbuch der angewandten Statistik. 9. Auflage, München Wien (Oldenbourg) 1993: 975 S.

22

 
Marazzi et al.
M-Estimates
1993
Marazzi A, Ruffieux C, Paccaud F. Trimming Rules and M-Estimates for the Expected Length of Stay in Diagnosis Related Groups. In: Proceedings of the 9th PCS/E International Working Conference, München 1993: 17–24.

23

 
Marazzi/Ruffieux
AQTM
1998
Marazzi A, Ruffieux C. Rules for Removing Outliers and Tests Based on Parametric Models for Estimating and Comparing Average Length of Stay. In: Proceedings of the 14th PCS/E International Working Conference, Manchester 1998: 191–200.

24

 
Marazzi/Ruffieux
Truncated Mean
1999
Marazzi A, Ruffieux C. The Truncated Mean of an Asymmetric Distribution. In: Computational Statistics And Data Analysis 1999: 79–100. Internet: http:// www.iumsp.ch / Unites / us / Alfio / drafts / truncmn.pdf.

25

 
Ruffieux et al.
Truncating LOS
2000
Ruffieux C, Paccaud F, Marazzi A. Comparing Rules for Truncating Hospital Length of Stay. In: Casemix Quarterly 2000(2)1: 3–11. Internet: http:// www.hospvd.ch / iumsp / download / files / tmlest / comparules.pdf.

26

Z I M  -  Zentrum für Informatik und wirtschaftliche Medizin
CH-9116 Wolfertswil (SG), Steigstrasse 12, Schweiz
E-Post: , Tel: +41 71 3900 444

 
 
Vorheriges Kapitel: Inhaltsverzeichnisse: Nächstes Kapitel:
I.2
CV-Analyse
DRGs und verwandte PCS I.4
Verzeichnisse
Navigations-Tabellen
Z I M - Hauptseite

©  Z I M 
Fundstelle = http://www.fischer-zim.ch/text-pcssa/t-ga-I3-Schaetzung-CW-0003.htm
( Letztmals generiert: 10.01.2012 )