Principal Outro Análise de dados de tempo até o evento

Análise de dados de tempo até o evento

Visão geral

Programas

Descrição

Sites

Leituras

Cursos

Visão geral

Esta página descreve resumidamente uma série de perguntas que devem ser consideradas ao analisar dados de tempo até o evento e fornece uma lista de recursos com anotações para mais informações.

Descrição

O que é único sobre os dados de tempo até o evento (TTE)?

Os dados de tempo até o evento (TTE) são exclusivos porque o resultado de interesse não é apenas se um evento ocorreu ou não, mas também quando esse evento ocorreu. Os métodos tradicionais de regressão logística e linear não são adequados para incluir os aspectos do evento e do tempo como o resultado no modelo. Os métodos de regressão tradicionais também não estão equipados para lidar com a censura, um tipo especial de dados perdidos que ocorre em análises de tempo para evento quando os sujeitos não experimentam o evento de interesse durante o tempo de acompanhamento. Na presença de censura, o tempo real para o evento é subestimado. Técnicas especiais para dados TTE, como será discutido abaixo, foram desenvolvidas para utilizar as informações parciais sobre cada assunto com dados censurados e fornecer estimativas de sobrevivência imparciais. Essas técnicas incorporam dados de vários pontos de tempo entre assuntos e podem ser usadas para calcular diretamente taxas, razões de tempo e razões de risco.

Quais são as considerações metodológicas importantes dos dados de tempo até o evento?

Existem 4 considerações metodológicas principais na análise do tempo até o evento ou dados de sobrevivência. É importante ter uma definição clara do evento alvo, a origem do tempo, a escala de tempo e descrever como os participantes sairão do estudo. Uma vez que eles estejam bem definidos, a análise se torna mais direta. Normalmente, há um único evento de destino, mas há extensões de análises de sobrevivência que permitem vários eventos ou eventos repetidos.

Qual é a origem do tempo?

A origem do tempo é o ponto em que o tempo de acompanhamento começa. Os dados de TTE podem empregar uma variedade de origens de tempo que são amplamente determinadas pelo desenho do estudo, cada uma tendo vantagens e desvantagens associadas. Os exemplos incluem tempo de referência ou idade de referência. As origens do tempo também podem ser determinadas por uma característica definidora, como o início da exposição ou diagnóstico. Geralmente, essa é uma escolha natural se o resultado estiver relacionado a essa característica. Outros exemplos incluem nascimento e ano civil. Para estudos de coorte, a escala de tempo é mais comumente o tempo de estudo.

Existe outra opção de escala de tempo além do tempo de estudo?

Idade é outra escala de tempo comumente usada, em que a idade da linha de base é a origem do tempo e os indivíduos saem em sua idade de evento ou censura. Modelos com idade como escala de tempo podem ser ajustados para efeitos de calendário. Alguns autores recomendam que a idade em vez do tempo de estudo seja usada como escala de tempo, pois pode fornecer estimativas menos enviesadas.

O que é censura?

Um dos desafios específicos da análise de sobrevivência é que apenas alguns indivíduos terão experimentado o evento ao final do estudo e, portanto, os tempos de sobrevivência serão desconhecidos para um subconjunto do grupo de estudo. Esse fenômeno é denominado censura e pode surgir das seguintes formas: o participante do estudo ainda não experimentou o desfecho relevante, como recaída ou morte, até o encerramento do estudo; o participante do estudo perde o acompanhamento durante o período do estudo; ou, o participante do estudo experimenta um evento diferente que torna impossível um acompanhamento posterior. Esses tempos de intervalo censurados subestimam o tempo verdadeiro, mas desconhecido, para o evento. Para a maioria das abordagens analíticas, a censura é considerada aleatória ou não informativa.

Existem três tipos principais de censura, direita, esquerda e intervalo. Se os eventos ocorrerem além do final do estudo, os dados serão censurados à direita. Os dados censurados à esquerda ocorrem quando o evento é observado, mas a hora exata do evento é desconhecida. Os dados censurados por intervalo ocorrem quando o evento é observado, mas os participantes entram e saem da observação, de modo que a hora exata do evento é desconhecida. A maioria dos métodos analíticos de sobrevivência são projetados para observações censuradas à direita, mas métodos para dados censurados de intervalo e à esquerda estão disponíveis.

Qual é a questão de interesse?

A escolha da ferramenta analítica deve ser orientada pela questão de pesquisa de interesse. Com os dados do TTE, a questão de pesquisa pode assumir várias formas, o que influencia qual função de sobrevivência é mais relevante para a questão de pesquisa. Três tipos diferentes de questões de pesquisa que podem ser de interesse para os dados TTE incluem:

  1. Qual proporção de indivíduos permanecerá livre do evento após um certo tempo?

  2. Qual a proporção de indivíduos que terão o evento após um certo tempo?

  3. Qual é o risco do evento em um determinado momento, entre aqueles que sobreviveram até aquele momento?

Cada uma dessas questões corresponde a um tipo diferente de função usada na análise de sobrevivência:

  1. Função de sobrevivência, S (t): a probabilidade de um indivíduo sobreviver além do tempo t [Pr (T> t)]

  2. Função de densidade de probabilidade, F (t), ou a função de incidência cumulativa, R (t): a probabilidade de que um indivíduo terá um tempo de sobrevivência menor ou igual a t [Pr (T≤t)]

  3. Função de risco, h (t): o potencial instantâneo de experimentar um evento no tempo t, condicionado a ter sobrevivido até aquele momento

  4. Função de risco cumulativa, H (t): a integral da função de risco do tempo 0 ao tempo t, que é igual à área sob a curva h (t) entre o tempo 0 e o tempo t

Se uma dessas funções for conhecida, as outras funções podem ser calculadas usando as seguintes fórmulas:

S (t) = 1 - F (t) A função de sobrevivência e a função de densidade de probabilidade somam 1

h (t) = f (t) / S (t) O perigo instantâneo é igual à probabilidade incondicional de

experimentando o evento no tempo t, escalado pela fração viva no tempo t

H (t) = -log [S (t)] A função de risco cumulativo é igual ao log negativo da sobrevivência

função

S (t) = e –H (t) A função de sobrevivência é igual ao perigo cumulativo negativo exponenciado

função

Essas conversões são frequentemente usadas em métodos de análise de sobrevivência, como será discutido a seguir. Geralmente, um aumento em h (t), o perigo instantâneo, levará a um aumento em H (t), o perigo cumulativo, que se traduz em uma diminuição em S (t), a função de sobrevivência.

Que suposições devem ser feitas para usar técnicas padrão para dados de tempo até o evento?

O principal pressuposto na análise dos dados do TTE é o da censura não informativa: os indivíduos censurados têm a mesma probabilidade de vivenciar um evento subsequente que os indivíduos que permanecem no estudo. A censura informativa é análoga à falta de dados não ignoráveis, o que distorce a análise. Não há uma maneira definitiva de testar se a censura é não informativa, embora explorar padrões de censura possa indicar se uma suposição de censura não informativa é razoável. Se houver suspeita de censura informativa, as análises de sensibilidade, como os cenários de melhor e pior caso, podem ser usadas para tentar quantificar o efeito que a censura informativa tem sobre a análise.

Outra suposição ao analisar os dados TTE é que há tempo de acompanhamento suficiente e número de eventos para poder estatístico adequado. Isso precisa ser considerado na fase de desenho do estudo, uma vez que a maioria das análises de sobrevida são baseadas em estudos de coorte.

Suposições simplificadoras adicionais devem ser mencionadas, pois são freqüentemente feitas em visões gerais da análise de sobrevivência. Embora essas suposições simplifiquem os modelos de sobrevivência, elas não são necessárias para conduzir análises com dados de TTE. Técnicas avançadas podem ser usadas se essas suposições forem violadas:

  • Nenhum efeito de coorte sobre a sobrevivência: para uma coorte com um longo período de recrutamento, suponha que os indivíduos que ingressam precocemente têm as mesmas probabilidades de sobrevivência que aqueles que ingressam tarde

  • Censura à direita apenas nos dados

  • Os eventos são independentes uns dos outros

Que tipo de abordagem pode ser usada para análise de sobrevivência?

Existem três abordagens principais para analisar dados TTE: abordagens não paramétricas, semi-paramétricas e paramétricas. A escolha de qual abordagem usar deve ser orientada pela questão de pesquisa de interesse. Freqüentemente, mais de uma abordagem pode ser utilizada apropriadamente na mesma análise.

O que são abordagens não paramétricas para análise de sobrevivência e quando são apropriadas?

As abordagens não paramétricas não dependem de suposições sobre a forma ou a forma dos parâmetros na população subjacente. Na análise de sobrevivência, abordagens não paramétricas são usadas para descrever os dados estimando a função de sobrevivência, S (t), juntamente com a mediana e os quartis de tempo de sobrevivência. Essas estatísticas descritivas não podem ser calculadas diretamente a partir dos dados devido à censura, que subestima o tempo real de sobrevivência em sujeitos censurados, levando a estimativas distorcidas da média, mediana e outros descritivos. Abordagens não paramétricas são freqüentemente usadas como a primeira etapa em uma análise para gerar estatísticas descritivas imparciais e são freqüentemente usadas em conjunto com abordagens paramétricas ou paramétricas.

Estimador Kaplan-Meier

A abordagem não paramétrica mais comum na literatura é o estimador de Kaplan-Meier (ou limite do produto). O estimador Kaplan-Meier funciona dividindo a estimativa de S (t) em uma série de etapas / intervalos com base em tempos de eventos observados. As observações contribuem para a estimativa de S (t) até que o evento ocorra ou até que sejam censuradas. Para cada intervalo, a probabilidade de sobreviver até o final do intervalo é calculada, visto que os indivíduos estão em risco no início do intervalo (isso é comumente notado como pj = (nj - dj) / nj). O S (t) estimado para cada valor de t é igual ao produto da sobrevivência a cada intervalo até e incluindo o tempo t. As principais premissas desse método, além da censura não informativa, é que a censura ocorre após falhas e que não há efeito de coorte na sobrevida, de modo que os sujeitos têm a mesma probabilidade de sobrevida independentemente de quando entraram no estudo.

O S (t) estimado do método de Kaplan-Meier pode ser plotado como uma função gradativa com o tempo no eixo X. Este gráfico é uma boa maneira de visualizar a experiência de sobrevivência da coorte e também pode ser usado para estimar a mediana (quando S (t) ≤0,5) ou quartis de tempo de sobrevivência. Essas estatísticas descritivas também podem ser calculadas diretamente usando o estimador Kaplan-Meier. Os intervalos de confiança de 95% (IC) para S (t) dependem das transformações de S (t) para garantir que o IC de 95% esteja entre 0 e 1. O método mais comum na literatura é o estimador de Greenwood.

Estimador da tabela de vida

O estimador da tábua de vida da função de sobrevivência é um dos primeiros exemplos de métodos estatísticos aplicados, tendo sido usado por mais de 100 anos para descrever a mortalidade em grandes populações. O estimador da tábua de vida é semelhante ao método Kaplan-Meier, exceto que os intervalos são baseados no tempo do calendário em vez de eventos observados. Uma vez que os métodos da tábua de vida são baseados nesses intervalos de calendário, e não em eventos individuais / tempos de censura, esses métodos usam o tamanho do conjunto de risco médio por intervalo para estimar S (t) e devem assumir que a censura ocorreu uniformemente ao longo do intervalo de tempo do calendário. Por esse motivo, o estimador da tábua de vida não é tão preciso quanto o estimador de Kaplan-Meier, mas os resultados serão semelhantes em amostras muito grandes.

Estimador Nelson-Aalen

Outra alternativa para Kaplan-Meier é o estimador de Nelson-Aalen, que se baseia no uso de uma abordagem de processo de contagem para estimar a função de risco cumulativo, H (t). A estimativa de H (t) pode então ser usada para estimar S (t). As estimativas de S (t) derivadas usando este método sempre serão maiores do que a estimativa K-M, mas a diferença será pequena entre os dois métodos em grandes amostras.

pixel gun 3d hack no survey apk

As abordagens não paramétricas podem ser usadas para análises univariável ou multivariável?

Abordagens não paramétricas como o estimador Kaplan-Meier podem ser usadas para conduzir análises univariadas para fatores categóricos de interesse. Os fatores devem ser categóricos (por natureza ou uma variável contínua dividida em categorias) porque a função de sobrevivência, S (t), é estimada para cada nível da variável categórica e então comparada entre esses grupos. O S estimado (t) para cada grupo pode ser traçado e comparado visualmente.

Os testes baseados em classificação também podem ser usados ​​para testar estatisticamente a diferença entre as curvas de sobrevivência. Esses testes comparam o número de eventos observados e esperados em cada ponto no tempo entre os grupos, sob a hipótese nula de que as funções de sobrevivência são iguais entre os grupos. Existem várias versões desses testes baseados em classificação, que diferem no peso dado a cada ponto de tempo no cálculo da estatística de teste. Dois dos testes baseados em classificação mais comuns vistos na literatura são o teste de log rank, que atribui peso igual a cada ponto no tempo, e o teste de Wilcoxon, que pondera cada ponto no tempo pelo número de indivíduos em risco. Com base nesse peso, o teste de Wilcoxon é mais sensível às diferenças entre as curvas no início do acompanhamento, quando mais indivíduos estão em risco. Outros testes, como o teste de Peto-Prentice, usam pesos entre os do log rank e os testes de Wilcoxon. Os testes baseados em classificação estão sujeitos à suposição adicional de que a censura é independente do grupo, e todos são limitados por pouco poder para detectar diferenças entre os grupos quando as curvas de sobrevivência se cruzam. Embora esses testes forneçam um valor p da diferença entre as curvas, eles não podem ser usados ​​para estimar tamanhos de efeito (o valor p do teste log rank, no entanto, é equivalente ao valor p para um fator categórico de interesse em um Cox univariável modelo).

Os modelos não paramétricos são limitados porque não fornecem estimativas de efeito e geralmente não podem ser usados ​​para avaliar o efeito de vários fatores de interesse (modelos multivariáveis). Por esse motivo, as abordagens não paramétricas são frequentemente usadas em conjunto com modelos semi ou totalmente paramétricos em epidemiologia, onde modelos multivariáveis ​​são normalmente usados ​​para controlar fatores de confusão.

As curvas de Kaplan-Meier podem ser ajustadas?

É um mito comum que as curvas de Kaplan-Meier não podem ser ajustadas, e isso é frequentemente citado como uma razão para usar um modelo paramétrico que pode gerar curvas de sobrevivência ajustadas por covariável. Um método foi desenvolvido, no entanto, para criar curvas de sobrevivência ajustadas usando ponderação de probabilidade inversa (IPW). No caso de apenas uma covariável, os IPWs podem ser estimados não parametricamente e são equivalentes à padronização direta das curvas de sobrevivência para a população de estudo. No caso de múltiplas covariáveis, modelos semi ou totalmente paramétricos devem ser usados ​​para estimar os pesos, que são então usados ​​para criar curvas de sobrevivência ajustadas por múltiplas covariáveis. As vantagens desse método são que ele não está sujeito à suposição de riscos proporcionais, pode ser usado para covariáveis ​​variáveis ​​no tempo e também para covariáveis ​​contínuas.

Por que precisamos de abordagens paramétricas para analisar dados de tempo até o evento?

Uma abordagem não paramétrica para a análise dos dados TTE é usada para simplesmente descrever os dados de sobrevivência em relação ao fator sob investigação. Os modelos que utilizam essa abordagem também são chamados de modelos univariáveis. Mais comumente, os investigadores estão interessados ​​na relação entre várias covariáveis ​​e o tempo até o evento. O uso de modelos semi-paramétricos e totalmente paramétricos permite que o tempo até o evento seja analisado com relação a muitos fatores simultaneamente e fornece estimativas da força do efeito para cada fator constituinte.

O que é uma abordagem semiparamétrica e por que é tão comumente usada?

O modelo Cox Proporcional é a abordagem multivariável mais comumente usada para analisar dados de sobrevivência em pesquisas médicas. É essencialmente um modelo de regressão de tempo até o evento, que descreve a relação entre a incidência do evento, conforme expressa pela função de risco, e um conjunto de covariáveis. O modelo Cox é escrito da seguinte forma:

função de risco, h (t) = h0 (t) exp {β1X1 + β2X2 +… + βpXp}

É considerada uma abordagem semiparamétrica porque o modelo contém um componente não paramétrico e um componente paramétrico. O componente não paramétrico é o risco da linha de base, h0 (t). Este é o valor do perigo quando todas as covariáveis ​​são iguais a 0, o que destaca a importância de centralizar as covariáveis ​​no modelo para interpretabilidade. Não confunda o perigo da linha de base com o perigo no momento 0. A função de risco da linha de base é estimada de forma não paramétrica e, portanto, ao contrário da maioria dos outros modelos estatísticos, os tempos de sobrevivência não são considerados como seguindo uma distribuição estatística particular e a forma da linha de base o perigo é arbitrário. A função de risco de linha de base não precisa ser estimada para fazer inferências sobre o risco relativo ou a razão de risco. Esse recurso torna o modelo de Cox mais robusto do que as abordagens paramétricas, pois não é vulnerável a erros de especificação do perigo da linha de base.

O componente paramétrico é composto pelo vetor covariável. O vetor de covariável multiplica o risco de linha de base pela mesma quantidade, independentemente do tempo, então o efeito de qualquer covariável é o mesmo em qualquer momento durante o acompanhamento, e esta é a base para a suposição de riscos proporcionais.

Qual é a suposição de riscos proporcionais?

A suposição de riscos proporcionais é vital para o uso e interpretação de um modelo de Cox.

Sob essa suposição, há uma relação constante entre o resultado ou a variável dependente e o vetor de covariável. As implicações dessa suposição são que as funções de risco para quaisquer dois indivíduos são proporcionais em qualquer ponto no tempo e a razão de risco não varia com o tempo. Em outras palavras, se um indivíduo tem um risco de morte em algum momento inicial que é duas vezes maior do que o de outro indivíduo, então em todos os momentos posteriores o risco de morte permanece duas vezes maior. Esta suposição implica que as curvas de risco para os grupos devem ser proporcionais e não devem se cruzar. Como essa suposição é tão importante, ela definitivamente deve ser testada.

Como você testa a suposição de riscos proporcionais?

Há uma variedade de técnicas, tanto gráficas quanto baseadas em testes, para avaliar a validade da suposição de riscos proporcionais. Uma técnica é simplesmente plotar as curvas de sobrevivência de Kaplan-Meier se você estiver comparando dois grupos sem covariáveis. Se as curvas se cruzarem, a suposição de riscos proporcionais pode ser violada. Uma advertência importante a esta abordagem deve ser mantida em mente para pequenos estudos. Pode haver uma grande quantidade de erro associada à estimativa das curvas de sobrevivência para estudos com um tamanho de amostra pequeno, portanto, as curvas podem se cruzar mesmo quando a suposição de riscos proporcionais é atendida. O gráfico log-log complementar é um teste mais robusto que representa o logaritmo do logaritmo negativo da função de sobrevivência estimada em relação ao logaritmo do tempo de sobrevivência. Se os perigos são proporcionais entre os grupos, este gráfico produzirá curvas paralelas. Outro método comum para testar a suposição de riscos proporcionais é incluir um termo de interação de tempo para determinar se o RH muda ao longo do tempo, uma vez que o tempo costuma ser o culpado pela não proporcionalidade dos riscos. A evidência de que o termo de interação grupo * tempo não é zero é uma evidência contra riscos proporcionais.

E se a suposição de riscos proporcionais não for válida?

Se você achar que a suposição de PH não se aplica, você não precisa necessariamente abandonar o uso do modelo Cox. Existem opções para melhorar a não proporcionalidade no modelo. Por exemplo, você pode incluir outras covariáveis ​​no modelo, sejam novas covariáveis, termos não lineares para covariáveis ​​existentes ou interações entre covariáveis. Ou você pode estratificar a análise em uma ou mais variáveis. Isso estima um modelo no qual o risco da linha de base pode ser diferente dentro de cada estrato, mas os efeitos das covariáveis ​​são iguais entre os estratos. Outras opções incluem dividir o tempo em categorias e usar variáveis ​​indicadoras para permitir que as razões de risco variem ao longo do tempo e alterar a variável de tempo de análise (por exemplo, do tempo decorrido para a idade ou vice-versa).

Como você examina o ajuste do modelo semiparamétrico?

Além de verificar se há violações da suposição de proporcionalidade, há outros aspectos do ajuste do modelo que devem ser examinados. Estatísticas semelhantes às usadas na regressão linear e logística podem ser aplicadas para realizar essas tarefas para os modelos de Cox com algumas diferenças, mas as idéias essenciais são as mesmas em todas as três configurações. É importante verificar a linearidade do vetor covariável, o que pode ser feito examinando os resíduos, assim como fazemos na regressão linear. No entanto, os resíduos nos dados TTE não são tão simples quanto na regressão linear, em parte porque o valor do resultado é desconhecido para alguns dos dados, e os resíduos costumam ser distorcidos. Vários tipos diferentes de resíduos foram desenvolvidos a fim de avaliar o ajuste do modelo de Cox para os dados de TTE. Os exemplos incluem Martingale e Schoenfeld, entre outros. Você também pode olhar os resíduos para identificar observações altamente influentes e inadequadas. Existem também testes de adequação específicos dos modelos de Cox, como o teste de Gronnesby e Borgan e o índice prognóstico de Hosmer e Lemeshow. Você também pode usar o AIC para comparar modelos diferentes, embora o uso de R2 seja problemático.

Por que usar uma abordagem paramétrica?

Uma das principais vantagens dos modelos semiparamétricos é que o risco da linha de base não precisa ser especificado para estimar as taxas de risco que descrevem as diferenças no risco relativo entre os grupos. Pode ser, entretanto, que a estimativa do risco de linha de base em si seja de interesse. Nesse caso, uma abordagem paramétrica é necessária. Em abordagens paramétricas, tanto a função de risco quanto o efeito das covariáveis ​​são especificados. A função de risco é estimada com base em uma distribuição presumida na população subjacente.

As vantagens de usar uma abordagem paramétrica para análise de sobrevivência são:

  • As abordagens paramétricas são mais informativas do que as abordagens não paramétricas e semiparamétricas. Além de calcular estimativas de efeito relativo, eles também podem ser usados ​​para prever o tempo de sobrevivência, as taxas de risco e os tempos médios e medianos de sobrevivência. Eles também podem ser usados ​​para fazer previsões de risco absoluto ao longo do tempo e para traçar curvas de sobrevivência ajustadas por covariável.

  • Quando a forma paramétrica é especificada corretamente, os modelos paramétricos têm mais poder do que os modelos semiparamétricos. Eles também são mais eficientes, levando a erros-padrão menores e estimativas mais precisas.

  • As abordagens paramétricas dependem da probabilidade máxima total para estimar os parâmetros.

  • Os resíduos dos modelos paramétricos assumem a forma familiar da diferença entre o observado e o esperado.

A principal desvantagem de usar uma abordagem paramétrica é que se baseia na suposição de que a distribuição da população subjacente foi especificada corretamente. Os modelos paramétricos não são robustos a erros de especificação, razão pela qual os modelos semiparamétricos são mais comuns na literatura e são menos arriscados de usar quando há incerteza sobre a distribuição da população subjacente.

Como você escolhe a forma paramétrica?

A escolha da forma paramétrica apropriada é a parte mais difícil da análise paramétrica de sobrevivência. A especificação da forma paramétrica deve ser orientada pela hipótese do estudo, juntamente com o conhecimento prévio e a plausibilidade biológica da forma do risco de linha de base. Por exemplo, se for sabido que o risco de morte aumenta drasticamente logo após a cirurgia e, em seguida, diminui e nivela, seria inadequado especificar a distribuição exponencial, que assume um perigo constante ao longo do tempo. Os dados podem ser usados ​​para avaliar se o formulário especificado parece se ajustar aos dados, mas esses métodos baseados em dados devem complementar, e não substituir, seleções baseadas em hipóteses.

Qual é a diferença entre um modelo de risco proporcional e um modelo de tempo de falha acelerado?

Embora o modelo de riscos proporcionais de Cox seja semiparamétrico, os modelos de riscos proporcionais também podem ser paramétricos. Os modelos de riscos proporcionais paramétricos podem ser escritos como:

h (t, X) = h0 (t) exp (Xi β) = h0 (t) λ

onde o risco de linha de base, h0 (t), depende apenas do tempo, t, mas não de X, e λ é uma função específica da unidade de covariáveis, que não depende de t, que aumenta ou diminui a função de risco de linha de base. λ não pode ser negativo. Neste modelo, a taxa de risco é uma função multiplicativa do risco da linha de base e as razões de risco podem ser interpretadas da mesma forma que no modelo de risco proporcional semiparamétrico.

Modelos de tempo de falha acelerado (AFT) são uma classe de modelos de sobrevivência paramétricos que podem ser linearizados tomando o log natural do modelo de tempo de sobrevivência. O exemplo mais simples de um modelo AFT é o modelo exponencial, que é escrito como:

ln (T) = β0 + β1X1 +…. + βpXp + ε *

A principal diferença entre os modelos AFT e os modelos PH é que os modelos AFT pressupõem que os efeitos das covariáveis ​​são multiplicativos na escala de tempo, enquanto os modelos de Cox usam a escala de risco, conforme mostrado acima. As estimativas de parâmetros de modelos AFT são interpretadas como efeitos na escala de tempo, que podem acelerar ou desacelerar o tempo de sobrevivência. Exp (β)> 1 de um modelo AFT significa que o fator acelera o tempo de sobrevivência ou leva a uma sobrevivência mais longa. Exp (β)<1 decelerates survival time (shorter survival). AFT models assume that estimated time ratios are constant across the time scale. A time ratio of 2, for example, can be interpreted as the median time to death in group 1 is double the median time to death in group 2 (indicated longer survival for group 1).

Algumas distribuições de erro podem ser escritas e interpretadas como modelos PH e AFT (ou seja, exponencial, Weibull), outras são apenas PH (ou seja, Gompertz) ou apenas modelos AFT (ou seja, log-logístico) e outros não são modelos PH ou AFT (ou seja, encaixando uma ranhura).

Que formas os modelos paramétricos podem assumir?

A função de risco pode assumir qualquer forma, desde que h (t)> 0 para todos os valores de t. Embora a consideração principal para a forma paramétrica deva ser o conhecimento prévio da forma do risco de linha de base, cada distribuição tem suas próprias vantagens e desvantagens. Algumas das formas mais comuns serão explicadas resumidamente, com mais informações disponíveis na lista de recursos.

Distribuição Exponencial

A distribuição exponencial assume que h (t) depende apenas dos coeficientes e covariáveis ​​do modelo e é constante ao longo do tempo. A principal vantagem desse modelo é que ele é um modelo de risco proporcional e um modelo de tempo de falha acelerado, de forma que as estimativas de efeito podem ser interpretadas como taxas de risco ou taxas de tempo. A principal desvantagem desse modelo é que muitas vezes é implausível assumir um perigo constante ao longo do tempo.

Distribuição Weibull

A distribuição Weibull é semelhante à distribuição exponencial. Enquanto a distribuição exponencial assume um risco constante, a distribuição Weibull assume um risco monotônico que pode ser crescente ou decrescente, mas não ambos. Possui dois parâmetros. O parâmetro de forma (σ) controla se o perigo aumenta (σ1) (na distribuição exponencial, este parâmetro é definido como 1). O parâmetro de escala, (1 / σ) exp (-β0 / σ), determina a escala desse aumento / diminuição. Uma vez que a distribuição Weibull simplifica para a distribuição exponencial quando σ = 1, a hipótese nula de que σ = 1 pode ser testada usando um teste de Wald. A principal vantagem desse modelo é que ele é tanto um modelo PH quanto AFT, de modo que as razões de risco e as razões de tempo podem ser estimadas. Novamente, a principal desvantagem é que a suposição de monotonicidade do risco de linha de base pode ser implausível em alguns casos.

Distribuição Gompertz

A distribuição de Gompertz é um modelo PH igual à distribuição log-Weibull, portanto, o log da função de risco é linear em t. Essa distribuição tem uma taxa de falha crescente exponencialmente e, muitas vezes, é apropriada para dados atuariais, pois o risco de mortalidade também aumenta exponencialmente com o tempo.

Distribuição Logística

A distribuição log-logística é um modelo AFT com um termo de erro que segue a distribuição logística padrão. Pode se ajustar a riscos não monotônicos e geralmente se ajusta melhor quando o risco subjacente atinge um pico e depois cai, o que pode ser plausível para certas doenças como a tuberculose. A distribuição log-logística não é um modelo de PH, mas é um modelo de probabilidades proporcionais. Isso significa que está sujeito à suposição de odds proporcionais, mas a vantagem é que os coeficientes de inclinação podem ser interpretados como razões de tempo e também como razões de chances. Um odds ratio de 2 de um modelo log-logístico paramétrico, por exemplo, seria interpretado como o odds de sobrevivência além do tempo t entre os indivíduos com x = 1 é o dobro das chances entre os indivíduos com x = 0.

Distribuição Gama Generalizada (GG)

A distribuição gama generalizada (GG) é na verdade uma família de distribuições que contém quase todas as distribuições mais comumente usadas, incluindo as distribuições exponencial, Weibull, log normal e gama. Isso permite comparações entre as diferentes distribuições. A família GG também inclui todos os quatro tipos mais comuns de funções de risco, o que torna a distribuição de GG particularmente útil, uma vez que a forma da função de risco pode ajudar a otimizar a seleção do modelo.

Abordagem Splines

Uma vez que a única limitação geral da especificação da função de risco da linha de base é queh (t)> 0 para todos os valores de t, os splines podem ser usados ​​para flexibilidade máxima na modelagem da forma do risco da linha de base. Splines cúbicos restritos são um método que foi recentemente recomendado na literatura para análise de sobrevivência paramétrica, uma vez que este método permite flexibilidade na forma, mas restringe a função a ser linear nas extremidades onde os dados são esparsos. As splines podem ser usadas para melhorar a estimativa e também são vantajosas para extrapolação, uma vez que maximizam o ajuste aos dados observados. Se especificado corretamente, as estimativas de efeito de modelos ajustados usando splines não devem ser enviesadas. Como em outras análises de regressão, os desafios no ajuste de splines podem incluir a escolha do número e a localização dos nós e problemas com o sobreajuste.

Como você examina o ajuste do modelo paramétrico?

O componente mais importante da avaliação do ajuste do modelo paramétrico é verificar se os dados suportam a forma paramétrica especificada. Isso pode ser avaliado visualmente por meio do gráfico do risco cumulativo baseado em modelo em relação à função de risco cumulativo estimado de Kaplan-Meier. Se a forma especificada estiver correta, o gráfico deve passar pela origem com uma inclinação de 1. O teste de adequação de Grønnesby-Borgan também pode ser usado para verificar se o número observado de eventos é significativamente diferente do número esperado de eventos em grupos diferenciados por escores de risco. Este teste é altamente sensível ao número de grupos escolhidos e tende a rejeitar a hipótese nula de ajuste adequado com muita liberalidade se muitos grupos forem escolhidos, especialmente em pequenos conjuntos de dados. O teste carece de poder para detectar violações do modelo, no entanto, se poucos grupos forem escolhidos. Por esse motivo, não parece aconselhável confiar apenas em um teste de adequação para determinar se a forma paramétrica especificada é razoável.

O AIC também pode ser usado para comparar modelos executados com diferentes formas paramétricas, com o AIC mais baixo indicativo do melhor ajuste. O AIC não pode ser usado para comparar modelos paramétricos e semiparamétricos, no entanto, uma vez que os modelos paramétricos são baseados em tempos de eventos observados e os modelos semiparamétricos são baseados na ordem dos tempos de eventos. Novamente, essas ferramentas devem ser usadas para examinar se a forma especificada se ajusta aos dados, mas a plausibilidade do perigo subjacente especificado ainda é o aspecto mais importante da escolha de uma forma paramétrica.

Uma vez que a forma paramétrica especificada foi determinada para ajustar bem os dados, métodos semelhantes aos descritos anteriormente para modelos de risco semi-proporcionais podem ser usados ​​para escolher entre diferentes modelos, como gráficos residuais e testes de adequação.

E se os preditores mudarem com o tempo?

Nas declarações do modelo escritas acima, presumimos que as exposições são constantes ao longo do acompanhamento. Exposições com valores que mudam ao longo do tempo, ou covariáveis ​​que variam no tempo, podem ser incluídas em modelos de sobrevivência alterando a unidade de análise do indivíduo para o período de tempo em que a exposição é constante. Isso divide o tempo-pessoa dos indivíduos em intervalos em que cada pessoa contribui para o conjunto de risco de exposto e não exposto para aquela covariável. A principal suposição de incluir uma covariável variável no tempo dessa maneira é que o efeito da covariável variável no tempo não depende do tempo.

Para um modelo de risco proporcional de Cox, a inclusão de uma covariável variável no tempo tomaria a forma de: h (t) = h0 (t) e ^ β1x1 (t). As covariáveis ​​variáveis ​​no tempo também podem ser incluídas em modelos paramétricos, embora sejam um pouco mais complicadas e difíceis de interpretar. Os modelos paramétricos também podem modelar covariáveis ​​variáveis ​​no tempo usando splines para maior flexibilidade.

Geralmente, covariáveis ​​que variam no tempo devem ser usadas quando há a hipótese de que o perigo depende mais dos valores posteriores da covariável do que do valor da covariável na linha de base. Os desafios que surgem com covariáveis ​​variáveis ​​no tempo são dados ausentes na covariável em pontos de tempo diferentes e um viés potencial na estimativa do perigo se a covariável variável no tempo for realmente um mediador.

O que é análise de riscos concorrentes?

Os métodos tradicionais de análise de sobrevivência assumem que ocorre apenas um tipo de evento de interesse. No entanto, existem métodos mais avançados que permitem a investigação de vários tipos de eventos em um mesmo estudo, como morte por causas múltiplas. A análise de riscos competitivos é usada para esses estudos nos quais a duração da sobrevida termina com o primeiro de vários eventos. Métodos especiais são necessários porque analisar o tempo para cada evento separadamente pode ser tendencioso. Especificamente neste contexto, o método KM tende a superestimar a proporção de sujeitos que experimentam eventos. A análise de riscos competitivos utiliza o método de incidência cumulativa, em que a probabilidade geral do evento a qualquer momento é a soma das probabilidades específicas do evento. Os modelos são geralmente implementados inserindo cada participante do estudo várias vezes - uma por tipo de evento. Para cada participante do estudo, o tempo para qualquer evento é censurado no momento em que o paciente experimentou o primeiro evento. Para obter mais informações, consulte a página advancedepidemiology.org em riscos concorrentes .

O que são modelos de fragilidade e por que eles são úteis para dados correlacionados?

Dados de sobrevivência correlacionados podem surgir devido a eventos recorrentes experimentados por um indivíduo ou quando as observações são agrupadas em grupos. Seja por falta de conhecimento ou por viabilidade, algumas covariáveis ​​relacionadas ao evento de interesse podem não ser mensuradas. Os modelos de fragilidade são responsáveis ​​pela heterogeneidade causada por covariáveis ​​não medidas adicionando efeitos aleatórios, que agem de forma multiplicativa na função de risco. Os modelos de fragilidade são essencialmente extensões do modelo de Cox com a adição de efeitos aleatórios. Embora existam vários esquemas de classificação e nomenclatura usados ​​para descrever esses modelos, quatro tipos comuns de modelos de fragilidade incluem fragilidade compartilhada, aninhada, articulada e aditiva.

Existem outras abordagens para analisar dados de eventos recorrentes?

Os dados de eventos recorrentes são correlacionados, uma vez que vários eventos podem ocorrer no mesmo assunto. Embora os modelos de fragilidade sejam um método para explicar essa correlação em análises de eventos recorrentes, uma abordagem mais simples que também pode explicar essa correlação é o uso de erros padrão robustos (SE). Com a adição de SEs robustos, a análise de eventos recorrentes pode ser feita como uma simples extensão de modelos semiparamétricos ou paramétricos.

Embora simples de implementar, existem várias maneiras de modelar dados de eventos recorrentes usando SEs robustos. Essas abordagens diferem em como definem o conjunto de riscos para cada recorrência. Dessa forma, eles respondem a questões de estudo ligeiramente diferentes, de modo que a escolha de qual abordagem de modelagem usar deve ser baseada na hipótese de estudo e na validade das premissas de modelagem.

A abordagem do processo de contagem, ou Andersen-Gill, para a modelagem de eventos recorrentes assume que cada recorrência é um evento independente e não leva em consideração a ordem ou o tipo de evento. Nesse modelo, o tempo de acompanhamento de cada sujeito começa no início do estudo e é dividido em segmentos definidos por eventos (recorrências). Os sujeitos contribuem para o risco definido para um evento, desde que estejam sob observação naquele momento (não censurados). Esses modelos são simples de ajustar como um modelo de Cox com a adição de um estimador SE robusto, e as taxas de risco são interpretadas como o efeito da covariável na taxa de recorrência durante o período de acompanhamento. Este modelo seria inapropriado, entretanto, se a suposição de independência não fosse razoável.

As abordagens condicionais assumem que um sujeito não está em risco por um evento subsequente até que um evento anterior ocorra e, portanto, levam a ordem dos eventos em consideração. Eles são ajustados usando um modelo estratificado, com o número do evento (ou número de recorrência, neste caso), como a variável de estrato e incluindo SEs robustos. Existem duas abordagens condicionais diferentes que usam escalas de tempo diferentes e, portanto, têm conjuntos de risco diferentes. A abordagem de probabilidade condicional usa o tempo desde o início do estudo para definir os intervalos de tempo e é apropriada quando o interesse está no curso completo do processo de evento recorrente. A abordagem de intervalo de tempo essencialmente zera o relógio para cada recorrência usando o tempo desde o evento anterior para definir intervalos de tempo e é mais apropriada quando as estimativas de efeito específico do evento (ou recorrência) são de interesse.

Finalmente, as abordagens marginais (também conhecidas como a abordagem WLW - Wei, Lin e Weissfeld -) consideram cada evento como um processo separado, portanto, os sujeitos estão em risco para todos os eventos desde o início do acompanhamento, independentemente de terem experimentado um evento anterior. Este modelo é adequado quando se pensa que os eventos resultam de diferentes processos subjacentes, de modo que um sujeito poderia vivenciar um 3º evento, por exemplo, sem vivenciar o 1º. Embora essa suposição pareça implausível com alguns tipos de dados, como recorrências de câncer, ela pode ser usada para modelar recorrências de lesões ao longo de um período de tempo, quando os sujeitos podem experimentar diferentes tipos de lesões ao longo do período de tempo sem ordem natural. Os modelos marginais também podem ser ajustados usando modelos estratificados com SEs robustos.

Leituras

Este projeto teve como objetivo descrever as decisões metodológicas e analíticas que alguém pode enfrentar ao trabalhar com dados time-to-event, mas não é de forma alguma exaustivo. Os recursos são fornecidos abaixo para aprofundar esses tópicos.

Livros didáticos e capítulos

Vittinghoff E, Glidden DV, Shiboski SC, McCulloch CE (2012). Regression Methods in Biostatistics, 2nd New York, NY: Springer.

  • Texto introdutório aos modelos lineares, logísticos, de sobrevivência e de medidas repetidas, ideal para quem deseja um ponto de partida básico.

  • O capítulo de análise de sobrevivência oferece uma boa visão geral, mas não em profundidade. Os exemplos são baseados em STATA.

Hosmer DW, Lemeshow S, May S. (2008) Applied Survival Analysis: Regression Modeling of Time-to-Event Data, 2nd ed. Hoboken, NJ: John Wiley & Sons, Inc.

  • Visão geral detalhada dos modelos de Cox não paramétricos, semiparamétricos e paramétricos, melhor para aqueles que têm conhecimento em outras áreas de estatística. Técnicas avançadas não são abordadas em profundidade, mas são fornecidas referências a outros livros de especialidade.

Kleinbaum DG, Klein M (2012). Survival Analysis: A Self-Learning Text, 3rd ed. Nova York, NY: Springer Science + Business Media, LLC

  • Excelente texto introdutório

Klein JP, Moeschberger ML (2005). Survival Analysis: Techniques for Censored and Truncated Data, 2nd ed. Nova York, NY: Springer Science + Business Media, LLC

  • projetado para alunos de pós-graduação, este livro fornece muitos exemplos práticos

Therneau TM, Grambsch PM (2000). Modelando Dados de Sobrevivência: Estendendo o Modelo de Cox. Nova York, NY: Springer Science + Business Media, LLC

  • Boa introdução à abordagem do processo de contagem e análise de dados de sobrevivência correlacionados. O autor também escreveu o pacote de sobrevivência em R

Allison PD (2010). Análise de sobrevivência usando SAS: A Practice Guide, 2nd ed. Cary, NC: SAS Institute

  • Um ótimo texto aplicado para usuários SAS

Bagdonavicius V, Nikulin M (2002). Modelos de Vida Acelerados: Modelagem e Análise Estatística. Boca Raton, FL: Chapman & Hall / CRC Press.

  • Bom recurso para obter mais informações sobre modelos de tempo de falha acelerada paramétricos e semiparamétricos e como eles se comparam aos modelos de risco proporcional

Artigos Metodológicos

Artigos introdutórios / gerais

Hougaard P (1999). Fundamentals of Survival Data. Biometrics 55 (1): 13-22. PMID: 11318147 .

Clark TG, Bradburn MJ, Love SB, Altman DG (2003). Análise de sobrevivência parte I: conceitos básicos e primeiras análises. Br J Cancer 89 (2): 232-8. PMID: 12865907

Clark TG, Bradburn MJ, Love SB, Altman DG (2003). Análise de sobrevivência parte II: análise multivariada de dados - uma introdução a conceitos e métodos. Br J Cancer 89 (3): 431-6. PMID: 1288808

Clark TG, Bradburn MJ, Love SB, Altman DG (2003). Análise de sobrevivência parte II: análise multivariada de dados - escolhendo um modelo e avaliando sua adequação e ajuste. Br J Cancer 89 (4): 605-11. PMID: 12951864

Clark TG, Bradburn MJ, Love SB, Altman DG (2003). Análise de sobrevivência parte IV: mais conceitos e métodos em análise de sobrevivência. Br J Cancer 89 (5): 781-6. PMID: 12942105

  • A série de quatro artigos acima é uma excelente visão geral introdutória dos métodos em análise de sobrevivência que é extremamente bem escrita e fácil de entender - é altamente recomendada.

Idade como escala de tempo

Korn EL, Graubard BI, Midthune D (1997). Análise do tempo até o evento do acompanhamento longitudinal de uma pesquisa: escolha da escala de tempo. Am J Epidemiol 145 (1): 72-80. PMID: 8982025

  • Artigo que defende o uso da idade como escala de tempo, em vez do tempo de estudo.

Ingram DD, Makuc DM, Feldman JJ (1997). Re: Análise do tempo até o evento do acompanhamento longitudinal de uma pesquisa: escolha da escala de tempo. Am J Epidemiol 146 (6): 528-9. PMID: 9290515 .

  • Comentário sobre o artigo Korn descrevendo os cuidados a serem tomados ao usar a idade como escala de tempo.

Thiébaut AC, Bénichou J (2004). Escolha da escala de tempo na análise do modelo de Cox de dados de coorte epidemiológica: um estudo de simulação. Stat Med 30; 23 (24): 3803-20. PMID: 15580597

  • Estudo de simulação mostrando a magnitude do viés para diferentes graus de associação entre a idade e a covariável de interesse ao usar o tempo de estudo como escala de tempo.

Canchola AJ, Stewart SL, Bernstein L, et al. Regressão de Cox usando diferentes escalas de tempo. Disponível em: http://www.lexjansen.com/wuss/2003/DataAnalysis/i-cox_time_scales.pdf .

  • Um bom artigo comparando 5 modelos de regressão de Cox com variações no tempo de estudo ou na idade como a escala de tempo com o código SAS.

Censura

Huang CY, Ning J, Qin J (2015). Inferência de verossimilhança semiparamétrica para dados truncados à esquerda e censurados à direita. Bioestatística [epub] PMID: 25796430 .

  • Este artigo tem uma boa introdução à análise de dados censurados e fornece um novo procedimento de estimativa para a distribuição do tempo de sobrevivência com dados truncados à esquerda e censurados à direita. É muito denso e possui um enfoque estatístico avançado.

Cain KC, Harlow SD, Little RJ, Nan B, Yosef M, Taffe JR, Elliott MR (2011). Viés devido ao truncamento à esquerda e à censura à esquerda em estudos longitudinais de processos de desenvolvimento e doenças. Am J Epidemiol 173 (9): 1078-84. PMID: 21422059 .

  • Um excelente recurso que explica o viés inerente aos dados censurados à esquerda de uma perspectiva epidemiológica.

Sun J, Sun L, Zhu C (2007). Testando o modelo de probabilidades proporcionais para dados censurados por intervalo. Life Data Anal 13: 37–50. PMID 17160547 .

  • Outro artigo estatisticamente denso sobre um aspecto matizado da análise de dados TTE, mas fornece uma boa explicação dos dados censurados por intervalo.

Robins JM (1995a) Um método analítico para ensaios randomizados com censura informativa: Parte I. Lifetime Data Anal 1: 241–254. PMID 9385104 .

Robins JM (1995b) Um método analítico para ensaios randomizados com censura informativa: Parte II. Lifetime Data Anal 1: 417–434. PMID 9385113 .

  • Dois artigos que discutem métodos para lidar com a censura informativa.

Métodos de sobrevivência não paramétricos

Borgan Ø (2005) Kaplan-Meier Estimator. Enciclopédia de Bioestatística DOI: 10.1002 / 0470011815.b2a11042

  • Excelente visão geral do estimador Kaplan-Meier e sua relação com o estimador Nelson-Aalen

Rodríguez G (2005). Estimação não paramétrica em modelos de sobrevivência. Disponível a partir de: http://data.princeton.edu/pop509/NonParametricSurvival.pdf

  • Introdução aos métodos não paramétricos e ao modelo de risco proporcional de Cox que explica as relações entre os métodos com as fórmulas matemáticas

Cole SR, Hernan MA (2004). Curvas de sobrevivência ajustadas com pesos de probabilidade inversa. Programas de métodos de computação Biomed 75 (1): 35-9. PMID: 15158046

  • Descreve o uso de IPW para criar curvas de Kaplan-Meier ajustadas. Inclui um exemplo e macro SAS.

Zhang M (2015). Métodos robustos para melhorar a eficiência e reduzir o viés na estimativa das curvas de sobrevivência em ensaios clínicos randomizados. Lifetime Data Anal 21 (1): 119-37. PMID: 24522498

  • Método proposto para curvas de sobrevivência ajustadas por covariável em RCTs

Métodos semi-paramétricos de sobrevivência

Cox DR (1972) Modelos de regressão e tabelas de vida (com discussão). J R Statist Soc B 34: 187–220.

  • A referência clássica.

Christensen E (1987) Multivariate survival analysis using Cox’s regression model. Hepatology 7: 1346–1358. PMID 3679094 .

  • Descreve o uso do modelo de Cox usando um exemplo motivador. Excelente revisão dos principais aspectos da análise do modelo de Cox, incluindo como ajustar um modelo de Cox e verificação das suposições do modelo.

Grambsch PM, Therneau TM (1994) Testes de riscos proporcionais e diagnósticos baseados em resíduos ponderados. Biometrika 81: 515–526.

  • Um artigo detalhado sobre o teste da suposição de riscos proporcionais. Boa combinação de teoria e explicação estatística avançada.

Ng’andu NH (1997) Uma comparação empírica de testes estatísticos para avaliar a suposição de riscos proporcionais do modelo de Cox. Stat Med 16: 611–626. PMID 9131751 .

  • Outro artigo aprofundado sobre o teste da suposição de riscos proporcionais, este inclui uma discussão sobre a verificação de resíduos e efeitos da censura.

Métodos paramétricos de sobrevivência

Rodríguez, G (2010). Modelos Paramétricos de Sobrevivência. Disponível a partir de: http://data.princeton.edu/pop509/ParametricSurvival.pdf

  • breve introdução às distribuições mais comuns usadas na análise paramétrica de sobrevivência

Nardi A, Schemper M (2003). Comparando Cox e modelos paramétricos em estudos clínicos.Stat Med 22 (23): 2597-610. PMID: 14652863

  • Fornece bons exemplos comparando modelos semiparamétricos com modelos que usam distribuições paramétricas comuns e foca na avaliação do ajuste do modelo

Royston P, Parmar MK (2002). Modelos flexíveis de riscos proporcionais paramétricos e probabilidades proporcionais para dados de sobrevivência censurados, com aplicação em modelagem prognóstica e estimativa dos efeitos do tratamento. Stat Med 21 (15): 2175-97. PMID: 12210632

  • Boa explicação para os fundamentos de modelos de riscos e probabilidades proporcionais e comparações com splines cúbicos

Cox C, Chu H, Schneider MF, Muñoz A (2007). Análise paramétrica de sobrevivência e taxonomia de funções de risco para a distribuição gama generalizada. Statist Med 26: 4352–4374. PMID 17342754 .

  • Fornece uma excelente visão geral dos métodos de sobrevivência paramétricos, incluindo uma taxonomia das funções de risco e uma discussão aprofundada da família de distribuição gama generalizada.

Crowther MJ, Lambert PC (2014). Uma estrutura geral para análise paramétrica de sobrevivência. Estatística Med 33 (30): 5280-97. PMID: 25220693

faculdade particular em nyc
  • Descreve suposições restritivas de distribuições paramétricas comumente usadas e explica a metodologia de spline cúbica restrita

Sparling YH, Younes N, Lachin JM, Bautista OM (2006). Modelos paramétricos de sobrevivência para dados censurados por intervalo com covariáveis ​​dependentes do tempo. Biometrics 7 (4): 599-614. PMID: 16597670

  • Extensão e exemplo de como usar modelos paramétricos com dados censurados por intervalo

Covariáveis ​​com variação de tempo

Fisher LD, Lin DY (1999). Covariáveis ​​dependentes do tempo no modelo de regressão de riscos proporcionais de Cox. Annu Rev Public Health 20: 145-57. PMID: 10352854

  • Explicação completa e fácil de entender das covariáveis ​​que variam no tempo nos modelos de Cox, com um apêndice matemático

Petersen T (1986). Ajustando modelos paramétricos de sobrevivência com covariáveis ​​dependentes do tempo. Appl Statist 35 (3): 281-88.

  • Artigo denso, mas com um exemplo aplicado útil

Análise de risco competitivo

Veja os riscos concorrentes

Tai B, Machin D, White I, Gebski V (2001) Análise de riscos competitivos de pacientes com osteossarcoma: uma comparação de quatro abordagens diferentes. Stat Med 20: 661–684. PMID 11241570 .

  • Bom artigo aprofundado que descreve quatro métodos diferentes de análise de dados de riscos concorrentes e usa dados de um estudo randomizado de pacientes com osteossarcoma para comparar essas quatro abordagens.

Checkley W., Brower RG, Muñoz A. (2010). Inferência para eventos concorrentes mutuamente exclusivos por meio de uma mistura de distribuições gama generalizadas. Epidemiology 21 (4): 557–565. PMID 20502337 .

  • Artigo sobre riscos concorrentes usando a distribuição gama generalizada.

Análise de dados agrupados e modelos de fragilidade

Yamaguchi T, Ohashi Y, Matsuyama Y (2002) Modelos de riscos proporcionais com efeitos aleatórios para examinar os efeitos do centro em ensaios clínicos multicêntricos de câncer. Stat Methods Med Res 11: 221–236. PMID 12094756 .

  • Um artigo com excelente explicação teórica e matemática de levar em conta o agrupamento ao analisar dados de sobrevivência de ensaios clínicos multicêntricos.

O’Quigley J, Stare J (2002) Modelos de riscos proporcionais com fragilidades e efeitos aleatórios. Stat Med 21: 3219–3233. PMID 12375300 .

  • Uma comparação direta de modelos de fragilidade e modelos de efeitos aleatórios.

Balakrishnan N, Peng Y (2006). Modelo generalizado de fragilidade gama. Statist Med 25: 2797–2816. PMID

  • Um artigo sobre modelos de fragilidade usando a distribuição gama generalizada como distribuição de fragilidade.

Rondeau V, Mazroui Y, Gonzalez JR (2012). fragiltypack: Um pacote R para a análise de dados de sobrevivência correlacionados com modelos de fragilidade usando estimativa de verossimilhança penalizada ou estimativa paramétrica. Journal of Statistical Software 47 (4): 1-28.

  • Vinheta do pacote R com boas informações básicas sobre modelos de fragilidade.

Schaubel DE, Cai J (2005). Análise de dados agrupados de eventos recorrentes com aplicação às taxas de hospitalização em pacientes com insuficiência renal. Bioestatística 6 (3): 404-19. PMID 15831581 .

  • Excelente artigo em que os autores apresentam dois métodos para analisar dados de eventos recorrentes agrupados e, em seguida, comparam os resultados dos modelos propostos com aqueles baseados em um modelo de fragilidade.

Gharibvand L, Liu L (2009). Análise de dados de sobrevivência com eventos agrupados. SAS Global Forum 2009 Paper 237-2009.

  • Fonte sucinta e fácil de entender para análise de dados de tempo até o evento com eventos agrupados com procedimentos SAS.

Análise de eventos recorrentes

Twisk JW, Smidt N., de Vente W. (2005). Análise aplicada de eventos recorrentes: uma visão prática. J Epidemiol Community Health 59 (8): 706-10. PMID: 16020650

  • Muito fácil de entender, introdução à modelagem de eventos recorrentes e o conceito de conjuntos de risco

Villegas R, Juliá O, Ocaña J (2013). Estudo empírico de tempos de sobrevivência correlacionados para eventos recorrentes com margens de riscos proporcionais e o efeito da correlação e censura. Método Res. BMC 13:95. PMID: 23883000

  • Usa simulações para testar a robustez de diferentes modelos para dados de eventos recorrentes

Kelly PJ, Lim LL (2000). Análise de sobrevivência para dados de eventos recorrentes: uma aplicação para doenças infecciosas infantis. Stat Med 19 (1): 13-33. PMID: 10623190

  • Exemplos aplicados das quatro abordagens principais para modelar dados de eventos recorrentes

Wei LJ, Lin DY, Weissfeld L (1989). Análise de regressão de dados multivariados de tempo de falha incompleta por modelagem de distribuições marginais. Journal of the American Statistical Association84 (108): 1065-1073

O artigo original que descreve modelos marginais para análise de eventos recorrentes

Cursos

Epidemiologia e Population Health Summer Institute da Columbia University (EPIC)

Statistical Horizons, provedor privado de seminários estatísticos especializados ministrados por especialistas na área

Consórcio Interuniversitário para Pesquisa Política e Social (ICPSR) Programa de Verão em Métodos Quantitativos de Pesquisa Social, parte do Instituto de Pesquisa Social da Universidade de Michigan

  • Seminário de 3 dias sobre análise de sobrevivência, modelagem de história de eventos e análise de duração oferecido de 22 a 24 de junho de 2015 em Berkeley, CA, ministrado por Tenko Raykov da Michigan State University. Visão geral abrangente dos métodos de sobrevivência em todas as disciplinas (não apenas saúde pública): http://www.icpsr.umich.edu/icpsrweb/sumprog/courses/0200

O Institute for Statistics Research oferece dois cursos online para análise de sobrevivência, oferecidos várias vezes por ano. Esses cursos são baseados no livro de análise aplicada por Klein e Kleinbaum (veja abaixo) e podem ser feitos à la carte ou como parte de um programa de certificação em Estatística:

  • Introdução à análise de sobrevivência, com foco em modelos semiparamétricos de Cox, ministrada por David Kleinbaum ou Matt Strickland: http://www.statistics.com/survival/

  • Análise de sobrevivência avançada, incluindo modelos paramétricos, análise de recorrência e modelos de fragilidade, ensinados por Matt Strickland: http://www.statistics.com/survival2/

O Instituto de Pesquisa e Educação Digital da UCLA oferece o que eles chamam de seminários por meio de seu site para análise de sobrevivência em diferentes softwares estatísticos. Esses seminários demonstram como conduzir a análise de sobrevivência aplicada, focando mais no código do que na teoria.

Artigos Interessantes

Escolha Do Editor

Mentalidade de crescimento: conversa na semana de convocação com Carol Dweck
Mentalidade de crescimento: conversa na semana de convocação com Carol Dweck
Carol Dweck conduziu estudos marcantes que demonstraram que crianças com comportamento de desamparo aprendido podem melhorar significativamente seu desempenho quando ensinadas a entender o fracasso como falta de esforço em vez de falta de habilidade.
Resenha: 'Dinheiro: a verdadeira história de uma coisa inventada
Resenha: 'Dinheiro: a verdadeira história de uma coisa inventada'
David Pozen
David Pozen
David Pozen ensina e escreve sobre direito constitucional, direito da informação e direito sem fins lucrativos, entre outros tópicos. Em 2019, o American Law Institute nomeou Pozen como o recebedor de sua Early Career Scholars Medal, que é concedida a cada dois anos a um ou dois professores de direito em início de carreira cujo trabalho é relevante para políticas públicas e tem o potencial de influenciar melhorias no lei. O juiz Mariano-Florentino Cuéllar, da Suprema Corte da Califórnia, o presidente do comitê de seleção, descreveu os escritos de Pozen sobre sigilo governamental e teoria constitucional como notáveis ​​e amplamente influentes, tão oportunos quanto aprendidos e tão criativos e instigantes quanto são matizados e precisos . O corpo da obra de Pozen inclui dezenas de artigos, ensaios e capítulos de livros. Ele também editou dois volumes para a Columbia University Press, sobre transparência (2018) e liberdade de expressão (2020), e foi um colaborador semirregular dos blogs Balkinization e Lawfare. Ele foi o orador principal em várias conferências acadêmicas, nos Estados Unidos e no exterior, e sua bolsa foi discutida em veículos como The New York Times, The New Yorker, The Washington Post, Harper's, Politico, American Scholar e NPR. Em 2017, Pozen se tornou o professor visitante inaugural no Instituto Knight First Amendment da Universidade de Columbia. Em 2013, a Columbia Society of International Law, administrada por estudantes, reconheceu Pozen com o prêmio Faculty Honors. De 2010 a 2012, Pozen atuou como consultor especial de Harold Hongju Koh, consultor jurídico do Departamento de Estado dos EUA. Anteriormente, Pozen foi assessor jurídico do juiz John Paul Stevens na Suprema Corte dos Estados Unidos e do juiz Merrick B. Garland na Corte de Apelações dos Estados Unidos para o Circuito do Distrito de Columbia e assistente especial do senador Edward M. Kennedy no Senado Comitê Judiciário.
Programa de apresentações de jazz de Louis Armstrong
Programa de apresentações de jazz de Louis Armstrong
Desde a sua fundação em 2001, o Louis Armstrong Jazz Performance Program (LAJPP) cresceu dramaticamente. Este programa vibrante agora compreende dezessete conjuntos de jazz, quatorze músicos de jazz profissionais talentosos que oferecem aulas particulares e treinamento de conjunto, um programa de mestre de artistas visitantes, cursos de improvisação e composição de jazz e uma concentração especial em jazz.
Como o mês do seu nascimento influencia a sua saúde
Como o mês do seu nascimento influencia a sua saúde
Soluções radicais para calvície
Soluções radicais para calvície
A pesquisa da geneticista Angela Christiano não só oferece esperança para aqueles que sofrem de queda de cabelo, mas também pode apontar o caminho para novas terapias contra o câncer.
Caso El Universo (jornal)
Caso El Universo (jornal)
O Columbia Global Freedom of Expression busca avançar no entendimento das normas e instituições internacionais e nacionais que melhor protegem o livre fluxo de informação e expressão em uma comunidade global interconectada com grandes desafios comuns a serem enfrentados. Para cumprir sua missão, a Global Freedom of Expression empreende e comissiona projetos de pesquisa e política, organiza eventos e conferências, participa e contribui para debates globais sobre a proteção da liberdade de expressão e informação no século XXI.