Indietro

ⓘ Stimatore di Kaplan-Meier




Stimatore di Kaplan-Meier
                                     

ⓘ Stimatore di Kaplan-Meier

Lo stimatore di Kaplan-Meier, noto anche come stimatore del prodotto limite, è uno stimatore che si usa per stimare la funzione di sopravvivenza di dati relativi alla durata di vita.

Nella ricerca medica, si usa spesso per misurare la frazione di pazienti che vivono per una certa quantità di tempo dopo il trattamento. In economia, si può usare per misurare la lunghezza del tempo in cui le persone rimangono disoccupate dopo la perdita di un lavoro. In ingegneria, si può utilizzare per misurare il tempo prima del guasto dei componenti di una macchina. In ecologia, si può impiegare per stimare quanto a lungo i frutti carnosi rimangono sulle piante prima di essere rimossi dai frugivori. Lo stimatore prende il nome da Edward L. Kaplan e Paul Meier.

Un diagramma della stima di Kaplan-Meier della funzione di sopravvivenza è una serie di gradini orizzontali di ampiezza decrescente che, quando si prende un campione abbastanza grande, approssima la vera funzione di sopravvivenza per quella popolazione. Si assume che il valore della funzione di sopravvivenza tra successive e distinte osservazioni campionate "scatti" sia costante.

Un importante vantaggio della curva di Kaplan–Meier è che il metodo può tenere conto di alcuni tipi di dati censurati, particolarmente della censura a destra, che si verifica se un paziente si ritira da uno studio, cioè se si perde dal campione prima che si osservi lesito finale. Sul diagramma, piccoli segni di spunta verticali indicano le perdite, dove il tempo di sopravvivenza di un paziente è stato censurato a destra. Quando non si verifica alcun troncamento o censura, la curva di Kaplan-Meier è il complemento della funzione di distribuzione empirica.

In statistica medica, una tipica applicazione potrebbe implicare il raggruppamento di pazienti in categorie, per esempio, quelli con il profilo del Gene A e quelli con il profilo del Gene B. Nel grafico, i pazienti con il Gene B muoiono molto più rapidamente di quelli con il Gene A. Dopo due anni, sopravvive circa l80% dei pazienti con il Gene A, ma meno della metà dei pazienti con il Gene B.

                                     

1. Formulazione

Sia S t la probabilità che un membro di una data popolazione abbia una durata di vita superiore a t. Per un campione di questa popolazione di dimensione N, siano i tempi osservati fino alla morte degli N membri del campione

t 1 ≤ t 2 ≤ t 3 ≤ ⋯ ≤ t N. {\displaystyle t_{1}\leq t_{2}\leq t_{3}\leq \cdots \leq t_{N}.}

Corrispondente a ogni t i è n i, il numero "a rischio" appena prima del tempo t i, e d i, il numero di morti al tempo t i.

Si noti che gli intervalli tra gli eventi sono tipicamente non uniformi. Ad esempio, un piccolo insieme di dati potrebbe cominciare con 10 cases. Si supponga che il soggetto 1 muoia il giorno 3, i soggetti 2 e 3 muoiano il giorno 11 e il soggetto 4 venga perso nel controllo successivo censurato il giorno 9. I dati fino al giorno 11 sarebbero i seguenti.

Lo stimatore di Kaplan–Meier è la stima non parametrica della massima verosimiglianza di S t. È un prodotto con la forma

S ^ t = ∏ t i < t n i − d i n i. {\displaystyle {\hat {S}}t=\prod \limits _{t_{i}