Articles

Stimatore di Kaplan–Meier

Posted by admin

Qui, mostriamo due derivazioni dello stimatore di Kaplan–Meier. Entrambi si basano sulla riscrittura della funzione di sopravvivenza in termini di ciò che a volte viene chiamato pericolo, o tassi di mortalità. Tuttavia, prima di fare ciò vale la pena considerare uno stimatore ingenuo.

Uno stimatore ingenuomodifica

Per comprendere la potenza dello stimatore Kaplan–Meier, vale la pena descrivere prima uno stimatore ingenuo della funzione di sopravvivenza.,

Proposizione 1: Se il tempo di censura c k {\displaystyle c_{k}} dell’evento k {\displaystyle k} supera t {\displaystyle t} ( c k ≥ t {\displaystyle c_{k}\geq t} ), allora τ ~ k = t {\displaystyle {\tilde {\tau }}_{k}=t} se e solo se τ k = t {\displaystyle \tau _{k}=t} .

Sia k {\displaystyle k} tale che c k ≥ t {\displaystyle c_ {k} \ geq t} . Dalla proposizione precedente risulta che

Prob Pro ( τ k ≥ t ) = Prob Pro (τ ~ k ≥ t ) . {\displaystyle \ operatorname {Prob} (\tau _{k} \ geq t)=\operatorname {Prob} ({\tilde {\tau }}_{k}\geq t).,} S ^ ingenuo ( t − 1 ) = 1 m ( T ) ∑ k : C K ≥ T X K = | { 1 ≤ k ≤ n : t ~ K ≥ T } | m ( T) {\displaystyle {\hat {s}}_{\text{ingenuo}}(T-1)={\frac {1}{M(T)}}\sum _{k:c_{K}\geq t}X_{K}={\frac {|\{1\leq k\leq n\,:\,{\tilde {\tau }}_{k}\geq T\}|}{M(T)}},}

dove l’ultima uguaglianza segue perché τ ~ k ≥ t {\displaystyle {\tilde {\tau }}_{K}\geq t} implica c k ≥ t {\displaystyle c_{K}\geq t} .,5″>

t-1)\operatorname {Prob} (\tau >t-1)\\&=(1-\operatorname {Prob} (\tau \leq t\mid \tau >t-1))\operatorname {Prob} (\tau >t-1)\\&=(1-\operatorname {Prob} (\tau =t\mid \tau \geq t))\operatorname {Prob} (\tau >t-1)\\&=q(t)S(t-1)\,,\end{aligned}}}

in cui l’uno, ma l’ultima uguaglianza usato che τ {\displaystyle \tau } è in numeri interi e per l’ultima riga abbiamo introdotto

q ( t ) = 1 − Prob ⁡ ( τ = t ∣ t ≥ t ) ., {\displaystyle q (t)=1-\operatorname {Prob} (\tau =t\mid \tau \geq t).}

Con un’espansione ricorsiva dell’uguaglianza S ( t ) = q ( t ) S ( t − 1 ) {\displaystyle S(t)=q(t)S(t-1)} , otteniamo

S ( t ) = q ( t ) q ( t − 1) q q ( 0 ) . {\stile di visualizzazione S (t)=q (t)q(t-1) \ cdots q(0).}

si noti che qui q ( 0 ) = 1 − Prob ⁡ ( τ = 0 ∣ τ > − 1 ) = 1 − Prob ⁡ ( τ = 0 ) {\displaystyle q(0)=1-\operatorname {Prob} (\tau =0\mid \tau >-1)=1-\operatorname {Prob} (\tau =0)} .

Prob Pro (τ = s / τ ≥ s) = Prob Pro ( τ ~ k = s) / Prob Pro ( τ ~ k ≥ s)., {\displaystyle \operatorname {Prob} (\tau =s|\tau \geq s)=\operatorname {Prob} ({\tilde {\tau }}_{k}=s)/\operatorname {Prob} ({\tilde {\tau }}_{k}\geq s).,}

da un simile ragionamento che portano alla costruzione dei ingenuo stimatore di cui sopra, si arriva al stimatore

q ^ ( s ) = 1 − | { 1 ≤ k ≤ n : c k ≥ s , t ~ k = s } | | { 1 ≤ k ≤ n : c k ≥ s , t ~ k ≥ s } | = 1 − | { 1 ≤ k ≤ N : t ~ k = s } | | { 1 ≤ k ≤ n : t ~ k ≥ s } | {\displaystyle {\hat {Q}}(s)=1-{\frac {|\{1\leq K\leq n\,:\,c_{K}\geq s,{\tilde {\Tau }}_{K}=S\}|}{|\{1\leq k \ leq n\,:\, c_{K} \ geq s, {\tilde {\tau }}_{K} \ geq s\}|}}=1-{\frac {/\{1 \ leq k \ leq n\,:\, {\tilde {\tau }}_{k} = s\}|}{|\{1\leq k \ leq n\,:\, {\tilde {\tau }}_{K} \ geq s\}/}}} S ^ (t ) = ∏ s = 0 t q ^ (s ) ., Il nostro sito utilizza cookie tecnici e di terze parti.} S ^ (t) = i i: t i ≤ t (1-d i n i). Il nostro sito utilizza cookie tecnici e di terze parti per migliorare la tua esperienza di navigazione.}

Al contrario dello stimatore ingenuo, questo stimatore può essere visto per utilizzare le informazioni disponibili in modo più efficace: nel caso speciale menzionato in precedenza, quando ci sono molti eventi iniziali registrati, lo stimatore moltiplicherà molti termini con un valore inferiore a uno e quindi terrà conto che la probabilità di sopravvivenza non può essere grande., j log ⁡ ( h j ) + ( n j d j ) log ⁡ ( 1 − h j ) ) {\displaystyle \log({\mathcal {L}})=\sum _{j=1}^{i}\left(d_{j}\log(h_{j})+(n_{j}-d_{j})\log(1-h_{j})\right)}

trovare il massimo di log verosimiglianza rispetto a h i {\displaystyle h_{i}} restituisce:

∂ log ⁡ ( L ) ∂ h i = d i h ^ i − n i − d i − 1 h ^ i = 0 ⇒ h ^ i = d i n i {\displaystyle {\frac {\partial \log({\mathcal {L}})}{\partial h_{i}}}={\frac {d_{i}}{{\widehat {h}}_{i}}}-{\frac {n_{i}-d_{i}}{1-{\widehat {h}}_{i}}}=0\Rightarrow {\widehat {h}}_{i}={\frac {d_{i}}{n_{i}}}}

dove hat è usato per indicare la stima di massima verosimiglianza., Dato questo risultato, possiamo scrivere:

S ^ ( t ) = ∏ i : t ≤ t ( 1 − h ^ i ) = ∏ i : t ≤ t ( 1 − d i n i ) {\displaystyle {\widehat {S}}(t)=\prod \limita _{i:\ t_{i}\leq t}\left(1-{\widehat {h}}_{i}\right)=\prod \limita _{i:\ t_{i}\leq t}\left(1-{\frac {d_{i}}{n_{i}}}\right)}

Leave A Comment