Análisis de Supervivencia y Visualización del Entrenamiento

El Análisis de Supervivencia es una técnica estadística no paramétrica (sin supuestos de distribución) que actualmente no es fácil de encontrar fuera del ámbito de la evaluación de tratamientos, especialmente fuera de estudios farmacéuticos; ya no os cuento en el estudio del corredor popular. A menudo, los entrenadores de atletismo manejan una gran cantidad de datos sobre los entrenamientos de sus corredores y tienen dificultad para verlos de manera global; conocen qué deben hacer cuando aprecian cierto fenómeno pero a menudo las lupas que utilizan son demasiado gruesas para apreciarlo. Así hay información, en realidad útil, que se han molestado en recoger pero que no exprimen.

Una vez situados, voy a exponer algo más de qué va esto de los análisis de supervivencia. Los estudios hablan de que los orígenes de este tipo de técnicas los encontramos en las tablas de natalidad y mortalidad elaboradas por el astrónomo Halley, sin embargo, tal como lo entendemos hoy tiene sus orígenes en el estudio de la vida útil de los diferentes materiales de estructuras y máquinas. Estos análisis toman como variable principal de estudio el tiempo que trascurre hasta que se produce un suceso (Ej: el material se estropea, la persona toma una decisión,…., un corredor llega a meta). En la evaluación de un tratamiento de prevención de recaídas, por ejemplo, podríamos decir que la variable que vamos a estudiar con esta técnica es el tiempo que trascurre hasta que la persona recae. Así, estamos ante una técnica especialmente apropiada cuando hacemos estudios de seguimiento (en los que la persona es controlada durante un periodo de tiempo). Poniéndonos en este contexto, las personas que participan en nuestra muestra pueden dejar de ser seguidas bien porque han experimentado la recaída, bien porque ha terminado el tiempo de seguimiento y la persona no ha recaído o bien por otras razones. Los dos últimos casos producen tiempos incompletos censurados por la derecha que son analizados de manera idéntica, pero que en realidad son casos muy distintos. A nadie se le escapa que no es lo mismo haber terminado un tiempo de seguimiento sin recaer que haber abandonado el estudio.

No vamos a profundizar más en este tema porque en el estudio que voy a presentar no hay censuras de ningún tipo (aunque podría haberlas).  Así que será algo que dejemos para posteriores post ya que sino aburriré tanto al estadístico que me lea como al más profano en estos menesteres.

Os presento el caso. Se trata de analizar la evolución de un atleta, tomando como variable su tiempo por km en series de 1.000 y 2.000 metros. Se van a comparar tiempos del año 2008, del año 2009 y del año 2010. También se va a comparar su actuación ante diferentes condiciones climáticas: soleado y nublado; y ante diferentes estados de activación: entrenamiento al principio del día, entrenamiento en la mitad del día y entrenamiento al final del día.

En primer lugar os presento la Tabla de Supervivencia. Tenemos que tener en cuenta que en este caso, vamos a tomar como un indicador positivo o de evolución del atleta el hecho de que su tiempo de supervivencia (tiempo por Km) sea más corto. Por otro lado, podemos tomar la probabilidad de que supervivencia a un evento como un indicador de la dificultad o el grado de esfuerzo que le supone al atleta hacer una serie en ese tiempo. Así, una probabilidad de 0,9 indicará que en el resto de series de ese año aún no habría llegado a superar el Km, por lo que estamos hablado de una serie muy difícil.

NOTA: El tiempo de las series aparece en segundos. Para convertir fácilmente 3’=180s

Año

Distancia

 Tiempo

Proporción acumulada =indicador de dificultad de la serie

Estimación

Error típico

2008

1

1K

221,000

,950

,049

2

1K

222,000

.

.

3

1K

222,000

,850

,080

4

1K

223,000

,800

,089

5

1K

224,000

,750

,097

6

1K

225,000

.

.

7

1K

225,000

,650

,107

8

1K

226,000

.

.

9

1K

226,000

,550

,111

10

1K

227,000

,500

,112

11

2K

230,000

,450

,111

12

2K

230,500

.

.

13

2K

230,500

,350

,107

14

2K

231,000

,300

,102

15

2K

231,500

,250

,097

16

2K

232,000

,200

,089

17

2K

232,500

,150

,080

18

2K

233,000

,100

,067

19

2K

234,000

,050

,049

20

2K

234,500

,000

,000

2009

1

1K

212,000

,950

,049

2

1K

213,000

,900

,067

3

1K

214,000

.

.

4

1K

214,000

.

.

5

1K

214,000

,750

,097

6

1K

215,000

.

.

7

1K

215,000

,650

,107

8

1K

216,000

,600

,110

9

1K

218,000

,550

,111

10

1K

219,000

.

.

11

2K

219,000

,450

,111

12

2K

220,000

.

.

13

2K

220,000

,350

,107

14

2K

220,500

.

.

15

2K

220,500

,250

,097

16

K2

221,000

.

.

17

2K

221,000

.

.

18

2K

221,000

,100

,067

19

2K

221,500

,050

,049

20

K2

222,000

,000

,000

2010

1

1K

198,000

,950

,049

2

1K

200,000

,900

,067

3

1K

201,000

.

.

4

1K

201,000

,800

,089

5

1K

202,000

.

.

6

1K

202,000

,700

,102

7

1K

203,000

,650

,107

8

1K

204,000

.

.

9

1K

204,000

,550

,111

10

1K

205,000

,500

,112

11

2K

208,000

,450

,111

12

2K

208,500

,400

,110

13

2K

209,000

,350

,107

14

2K

209,500

,300

,102

15

2K

210,000

,250

,097

16

2K

210,500

,200

,089

17

2K

211,000

,150

,080

18

2K

212,000

,100

,067

19

2K

212,500

,050

,049

20

2K

214,000

,000

,000

En la tabla se ve que la evolución del atleta ha sido muy buena en todas las temporadas. Así, una serie en 222s en la temporada del 2008 tenía una dificultad para el atleta de 0,85 y en la temporada 2009 de .000. Lo que significa que un ritmo de serie que le costaba mucho obtener en el 2008 para él sin embargo es pan comido en el 2009. A continuación os dejo el gráfico de supervivencia que corrobora la evolución que ya hemos visto en la tabla.

Suprv

Para interpretar el gráfico, lo primero que quiero señalar es que las partes horizontales de los escalones significan tiempo en los que no se produce el evento (tiempo en el que nuestro atleta no ha terminado ninguna serie) y la parte vertical de los escalones esta relacionada con el número de eventos que suceden en ese tiempo (cuanto mayor sea el escalón mayor será el número de eventos que han sucedido para ese tiempo). En él podemos ver como el atleta ha progresado en su rendimiento en los tres años en los que se ha hecho el estudio. además, se aprecia como el escalonamiento en la curva, por debajo de 0,5 es parecido en el 2008 y en el 2010 y un poco diferente en el 2009. Además, vemos que la evolución entre temporadas ha sido buena, ya que el solapamiento entre las curvas existe, pero no es excesivo.

Por otro lado

A continuación aparece el gráfico con las funciones de impacto de las diferentes curvas que no es más que la función de riesgos acumulada. A su vez la función de riesgos no es más que aquella que representa a la probabilidad de que el suceso pase en un instante de tiempo concreto, dentro del intervalo que se contempla en el estudio.

Suprv2

Otra de las ventajas que presentan las curvas de supervivencia, como ya hemos visto, es que podemos compararlas. La comparación gráfica siempre es muy intuitiva, pero existen otras pruebas estadísticas que nos permiten hacerlo. Entre ellas la más popular es la del log-rank: no es más que una prueba chi-cuadrado en la que se compara el número de eventos que suceden en realidad y el número de eventos que habría si entre los grupos no hubiera diferencias, en este caso, los años (2008, 2009, y 2010). En nuestro caso para una chi-cuadrado con 2 g.l. obtenemos una valor de 104 (p<.000) Así, podemos afirmar con un riego asumible que hay diferencias en el rendimiento.

Finalmente, os dejo las curva que aluden a las diferencias entre tiempos climatológicos:

-S: Soleado

-N: Nublado

Vemos que para este atleta, y para esta variable no hay diferencias.

Suprv4

Deja un comentario