Articles

Estimatorul Kaplan-Meier

Posted by admin

aici, prezentăm două derivări ale estimatorului Kaplan–Meier. Ambele se bazează pe rescrierea funcției de supraviețuire în ceea ce privește ceea ce se numește uneori pericol sau rate de mortalitate. Cu toate acestea, înainte de a face acest lucru, merită luat în considerare un estimator naiv.pentru a înțelege puterea estimatorului Kaplan-Meier, merită să descriem mai întâi un estimator naiv al funcției de supraviețuire.,

Propoziția 1: Dacă timpul de cenzurare c k {\displaystyle c_{k}} de eveniment k {\displaystyle k} depășește t {\displaystyle t} ( c k ≥ t {\displaystyle c_{k}\geq t} ), atunci τ ~ k = t {\displaystyle {\tilde {\uta }}_{k}=t} dacă și numai dacă τ k = t {\displaystyle \uta _{k}=t} .

fie k {\displaystyle k} astfel încât c k ≥ t {\displaystyle C_{k} \ geq t} . Din propoziția de mai sus rezultă că

Prob ⁡ ( τ k ≥ t ) = Prob ⁡ ( τ ~ k ≥ t ) . {\displaystyle \operatorname {Pro} (\uta _{k}\geq t)=\operatorname {Pro} ({\tilde {\uta }}_{k}\geq t).,} S ^ naiv ( t − 1 ) = 1 m ( T ) ∑ k : C K ≥ T X K = | { 1 ≤ k ≤ n : τ ~ K ≥ T } | m ( T ) , {\displaystyle {\hat {s}}_{\text{naiv}}(T-1)={\frac {1}{M(T)}}\sum _{k:c_{K}\geq t}X_{K}={\frac {|\{1\leq k\leq n\,:\,{\tilde {\uta }}_{k}\geq T\}|}{M(T)}},}

în cazul în care ultima egalitate rezultă că τ ~ k ≥ t {\displaystyle {\tilde {\uta }}_{K}\geq t} presupune c k ≥ t {\displaystyle c_{K}\geq t} .,5″>

t-1)\operatorname {Pro} (\uta >t-1)\\&=(1-\operatorname {Pro} (\uta \leq t\mid \uta >t-1))\operatorname {Pro} (\uta >t-1)\\&=(1-\operatorname {Pro} (\uta =t\mid \uta \geq t))\operatorname {Pro} (\uta >t-1)\\&=q(t)S(t-1)\,,\end{aliniat}}}

în cazul în care una dar ultima egalitate folosit τ {\displaystyle \uta } este număr întreg de prim rang și pentru ultima linie am introdus

q ( t ) = 1 − Prob ⁡ ( τ = t ∣ τ ≥ t ) ., {\displaystyle q (t)=1 – \ operatorname {Prob} (\tau =t \mid \tau \ geq t).}

printr − o expansiune recursivă a egalității S ( t ) = q ( T ) S ( t-1 ) {\displaystyle S(T)=q(T)S(t − 1)} , obținem

S ( t ) = q ( T ) q ( t-1 ) ⋯ q ( 0 ) . {\displaystyle S (t) = q (t)q (T-1) \ cdots q (0).}

Rețineți că aici q ( 0 ) = 1 − Prob ⁡ ( τ = 0 ∣ τ > − 1 ) = 1 − Prob ⁡ ( τ = 0 ) {\displaystyle q(0)=1-\operatorname {Pro} (\uta =0\mid \uta >-1)=1-\operatorname {Pro} (\uta =0)} .

Prob ⁡ ( τ = s | τ ≥ s ) = Prob ⁡ ( τ ~ k = s ) / Prob ⁡ ( τ ~ k ≥ s ) ., {\displaystyle \operatorname {Pro} (\uta =s|\uta \geq s)=\operatorname {Pro} ({\tilde {\uta }}_{k}=s)/\operatorname {Pro} ({\tilde {\uta }}_{k}\geq s).,}

printr-un raționament similar, care duce la construcția de naiv estimator de mai sus, ajungem la estimatorul

q ^ ( s ) = 1 − | { 1 ≤ k ≤ n : c k ≥ s , τ ~ k = s } | | { 1 ≤ k ≤ n : c k ≥ s , τ ~ k ≥ s } | = 1 − | { 1 ≤ k ≤ N : τ ~ k = s } | | { 1 ≤ k ≤ n : τ ~ k ≥ s } | {\displaystyle {\hat {Q}}(s)=1-{\frac {|\{1\leq K\leq n\,:\,c_{K}\geq s,{\tilde {\Uta }}_{K}=S\}|}{|\{1\leq k \ leq n\,:\, c_{K} \ geq s, {\tilde {\uta }}_{K} \ geq s\}|}}=1-{\frac {/\{1 \ leq k \ leq n\,:\, {\tilde {\uta }}_{k} = s\}|}{|\{1\leq k \ leq n\,:\, {\tilde {\uta }}_{K} \ geq s\}/}}} E ^ (t ) = ∏ s = 0 t q ^ (s ) ., {\displaystyle {\hat {S}}(t)=\prod _{s=0}^{t}{\hat {q}}(s).} S ^ (t) = ∏ i: t i ≤ t (1-d i n i ) . {\displaystyle {\hat {S}}(t)=\prod _{i:t_{i}\leq t}\left(1-{\frac {d_{i}}{n_{am}}}\right).}

spre deosebire de Estimatorul naiv, acest estimator poate fi văzut că utilizează mai eficient informațiile disponibile: în cazul special menționat anterior, când sunt înregistrate multe evenimente timpurii, Estimatorul va multiplica mulți termeni cu o valoare sub unu și va lua în considerare faptul că probabilitatea de supraviețuire nu poate fi mare., j log ⁡ ( h j ) + ( n j − d j ) log ⁡ ( 1 − h j ) ) {\displaystyle \log({\mathcal {L}})=\sum _{j=1}^{i}\left(d_{j}\log(h_{j})+(n_{j}-d_{j})\log(1-h_{j})\right)}

găsirea maxim de log likelihood cu privire la h i {\displaystyle h_{i}} randamente:

∂ log ⁡ ( L ) ∂ h i = d i h ^ i − n i − d i 1 − h ^ i = 0 ⇒ h ^ i = d i n i {\displaystyle {\frac {\partial \log({\mathcal {L}})}{\partial h_{am}}}={\frac {d_{i}}{{\widehat {h}}_{i}}}-{\frac {n_{i}-d_{i}}{1-{\widehat {h}}_{i}}}=0\Rightarrow {\widehat {h}}_{i}={\frac {d_{i}}{n_{i}}}}

în cazul în care pălăria este utilizat pentru a desemna maximum likelihood estimation., Având în vedere acest rezultat, putem scrie:

S ^ ( t ) = ∏ i : t i ≤ t ( 1 − h ^ i ) = ∏ i : t i ≤ t ( 1 − d i n i ) {\displaystyle {\widehat {S}}(t)=\prod \limite _{i:\ t_{i}\leq t}\left(1-{\widehat {h}}_{i}\right)=\prod \limite _{i:\ t_{i}\leq t}\left(1-{\frac {d_{i}}{n_{am}}}\dreapta)}

Leave A Comment