martes, 21 de enero de 2014

Stat 101: Prueba t de Student

Prueba t de Student

En estadística, una prueba t de Studentprueba t-Student, o Test-T es cualquier prueba en la que el estadístico utilizado tiene una distribución t de Student si la hipótesis nula es cierta. Se aplica cuando la población estudiada sigue unadistribución normal pero el tamaño muestral es demasiado pequeño como para que el estadístico en el que está basada la inferencia esté normalmente distribuido, utilizándose una estimación de la desviación típica en lugar del valor real. Es utilizado en análisis discriminante.



Historia
El estadístico t fue introducido por William Sealy Gosset en 1908, un químico que trabajaba para la cervecería Guinness de Dublín. Student era su seudónimo de escritor.1 2 3 Gosset había sido contratado gracias a la política de Claude Guiness de reclutar a los mejores graduados de Oxford y Cambridge, y con el objetivo de aplicar los nuevos avances en bioquímica y estadística al proceso industrial de Guiness.2 Gosset desarrolló el test t como una forma sencilla de monitorizar la calidad de la famosa cerveza stout. Publicó su test en la revista inglesa Biometrika en el año 1908, pero fue forzado a utilizar un seudónimo por su empleador, para mantener en secreto los procesos industriales que se estaban utilizando en la producción. Aunque de hecho, la identidad de Gosset era conocida por varios de sus compañeros estadísticos.4

Usos

Entre los usos más frecuentes de las pruebas t se encuentran:
  • El test de locación de muestra única por el cual se comprueba si la media de una población distribuida normalmente tiene un valor especificado en una hipótesis nula.
  • El test de locación para dos muestras, por el cual se comprueba si las medias de dos poblaciones distribuidas en forma normal son iguales. Todos estos test son usualmente llamados test t de Student, a pesar de que estrictamente hablando, tal nombre sólo debería ser utilizado si las varianzas de las dos poblaciones estudiadas pueden ser asumidas como iguales; la forma de los ensayos que se utilizan cuando esta asunción se deja de lado suelen ser llamados a veces comoPrueba t de Welch. Estas pruebas suelen ser comúnmente nombradas como pruebas t desapareadas o de muestras independientes, debido a que tienen su aplicación mas típica cuando las unidades estadísticas que definen a ambas muestras que están siendo comparadas no se superponen.5
  • El test de hipótesis nula por el cual se demuestra que la diferencia entre dos respuestas medidas en las mismas unidades estadísticas es cero. Por ejemplo, supóngase que se mide el tamaño del tumor de un paciente con cáncer. Si el tratamiento resulta efectivo, lo esperable seria que el tumor de muchos pacientes disminuyera de tamaño luego de seguir el tratamiento. Esto con frecuencia es referido como prueba t de mediciones apareadas o repetidas.5 6
  • El test para comprobar si la pendiente de una regresión lineal difiere estadísticamente de cero.

Formula

La mayor parte de las pruebas estadísticas t tienen la forma T=\frac{Z}{s}, donde Z y s son funciones de los datos estudiados. Típicamente, Z se diseña de forma tal que resulte sensible a la hipótesis alternativa (p.ej. que su magnitud tienda a ser mayor cuando la hipótesis alternativa es verdadera), mientras que s es un parámetro de escala que permite que la distribución de T pueda ser determinada.
Por ejemplo, en una prueba t de muestra única, Z=\frac{\bar{X}}{\frac{\sigma}{\sqrt{n}}}, donde \bar{X} es la media muestral de los datos, n es el tamaño muestral, y σ es la desviación estándar de la población de datos; s en una prueba de muestra única es \hat{\sigma}/\sigma, donde \hat{\sigma} es la desviación estándar muestral.
Las asunciones subyacentes en una prueba t son:
  • Que Z sigue una distribución normal bajo la hipótesis nula.
  • ps2 sigue una distribución χ2 con p grados de libertad bajo la hipótesis nula, y donde p es una constante positiva.
  • Z y s son estadísticamente independientes.
En una prueba t específica, estas condiciones son consecuencias de la población que está siendo estudiada, y de la forma en que los datos han sido muestreados. Por ejemplo, en la prueba t de comparación de medias de dos muestras independientes, deberíamos realizar las siguientes asunciones:
  • Cada una de las dos poblaciones que están siendo comparadas sigue una distribución normal. Esto puede ser demostrado utilizando una prueba de normalidad, tales como una prueba Shapiro-Wilk o Kolmogórov-Smirnov, o puede ser determinado gráficamente por medio de un gráfico de cuantiles normales Q-Q plot.
  • Si se está utilizando la definición original de Student sobre su prueba t, las dos poblaciones a ser comparadas deben poseer las mismas varianzas, (esto se puede comprobar utilizando una prueba F de igualdad de varianzas, una prueba de Levene, una prueba de Bartlett, o una prueba de Brown-Forsythe, o estimarla gráficamente por medio de un gráfico Q-Q plot). Si los tamaños muestrales de los dos grupos comparados son iguales, la prueba original de Student es altamente resistente a la presencia de varianzas desiguales.7 la Prueba de Welch es insensible a la igualdad de las varianzas, independientemente de si los tamaños de muestra son similares.
  • Los datos usados ​​para llevar a cabo la prueba deben ser muestreados independientemente para cada una de las dos poblaciones que se comparan. Esto en general no es posible determinarlo a partir de los datos, pero si se conoce que los datos han sido muestreados de manera dependiente (por ejemplo si fueron muestreados por grupos), entonces la prueba t clásica que aquí se analiza, puede conducir a resultados erróneos.

Pruebas t para dos muestras apareadas y desapareadas

Las pruebas-t de dos muestras para probar la diferencia en las medias pueden ser desapareadas o en parejas. Las pruebas t pareadas son una forma de bloqueo estadístico, y poseen un mayor poder estadístico que las pruebas no apareadas cuando las unidades apareadas son similares con respecto a los "factores de ruido" que son independientes de la pertenencia a los dos grupos que se comparan [cita requerida]. En un contexto diferente, las pruebas-t apareadas pueden utilizarse para reducir los efectos de los factores de confusión en un estudio observacional.

Desapareada

Las pruebas t desapareadas o de muestras independientes, se utilizan cuando se obtienen dos grupos de muestras aleatorias, independientes e idénticamente distribuidas a partir de las dos poblaciones a ser comparadas. Por ejemplo, supóngase que estamos evaluando el efecto de un tratamiento médico, y reclutamos a 100 sujetos para el estudio. Luego elegimos aleatoriamente 50 sujetos para el grupo en tratamiento y 50 sujetos para el grupo de control. En este caso, obtenemos dos muestras independientes y podríamos utilizar la forma desapareada de la prueba t. La elección aleatoria no es esencial en este caso, si contactamos a 100 personas por teléfono y obtenemos la edad y género de cada una, y luego se utiliza una prueba t bimuestral para ver en que forma la media de edades difiere por género, esto también sería una prueba t de muestras independientes, a pesar de que los datos son observacionales.

Apareada

Las pruebas t de muestras dependientes o apareadas, consisten típicamente en una muestra de pares de valores con similares unidades estadísticas, o un grupo de unidades que han sido evaluadas en dos ocasiones diferentes (una prueba t de mediciones repetitivas). Un ejemplo típico de prueba t para mediciones repetitivas sería por ejemplo que los sujetos sean evaluados antes y después de un tratamiento.
Una prueba 't basada en la coincidencia de pares muestrales se obtiene de una muestra desapareada que luego es utilizada para formar una muestra apareada, utilizando para ello variables adicionales que fueron medidas conjuntamente con la variable de interés.8
La valoración de la coincidencia se lleva a cabo mediante la identificación de pares de valores que consisten en una observación de cada una de las dos muestras, donde las observaciones del par son similares en términos de otras variables medidas. Este enfoque se utiliza a menudo en los estudios observacionales para reducir o eliminar los efectos de los factores de confusión.

Cálculos

Las expresiones explícitas que pueden ser utilizadas para obtener varias pruebas t se dan a continuación. En cada caso, se muestra la fórmula para una prueba estadística que o bien siga exactamente o aproxime a una distribución t de Student bajo la hipótesis nula. Además, se dan los apropiados grados de libertad en cada caso. Cada una de estas estadísticas se pueden utilizar para llevar a cabo ya sea un prueba de una cola o prueba de dos colas.
Una vez que se ha determinado un valor t, es posible encontrar un valor P asociado utilizando para ello una tabla de valores de distribución t de Student. Si el valor P calulado es menor al límite elegido por significancia estadística (usualmente a niveles de significancia 0,10; 0,05 o 0,01), entonces la hipótesis nula se rechaza en favor de la hipótesis alternativa.

Prueba t para muestra única

En esta prueba se evalúa la hipótesis nula de que la media de la población estudiada es igual a un valor especificado μ0, se hace uso del estadístico:
 t = \frac{\overline{x} - \mu_0}{s/\sqrt{n}},
donde \overline{x} es la media muestral, s es la desviación estándar muestral y n es el tamaño de la muestra. Los grados de libertad utilizados en esta prueba se corresponden al valor n − 1.

Pendiente de una regresión lineal

Supóngase que se está ajustando el modelo:
 Y_i = \alpha + \beta x_i + \varepsilon_i,

donde xii = 1, ..., n son conocidos, α y β son desconocidos, y εi es el error aleatorio en los residuales que se encuentra normalmente distribuido, con un valor esperado 0 y una varianza desconocida σ2, e Yii = 1, ..., n son las observaciones.
Se desea probar la hipótesis nula de que la pendiente β es igual a algún valor especificado β0 (a menudo toma el valor 0, en cuyo caso la hipótesis es que x e y no están relacionados).
sea

\begin{align}
\widehat\alpha, \widehat\beta & = \text{estimadores de cuadrados mínimos}, \\
SE_{\widehat\alpha}, SE_{\widehat\beta} & = \text{error estándar de los estimadores de cuadrados mínimos}.
\end{align}
Luego

t_\text{valor} = \frac{\widehat\beta - \beta_0}{ SE_{\widehat\beta} }
tiene una distribución t con n − 2 grados de libertad si la hipótesis nula es verdadera. El error estándar de la pendiente:


SE_{\widehat\beta} = \frac{\sqrt{\frac{1}{n - 2}\sum_{i=1}^n (Y_i - \widehat y_i)^2}}{\sqrt{ \sum_{i=1}^n (x_i - \overline{x})^2 }}

puede ser reescrito en términos de los residuales:


\begin{align}
\widehat\varepsilon_i & = Y_i - \widehat y_i = Y_i - (\widehat\alpha + \widehat\beta x_i) = \text{residuales} = \text{errores estimados}, \\
\text{SSE} & = \sum_{i=1}^n \widehat\varepsilon_i^{\;2} = \text{suma de los cuadrados de los residuales}.
\end{align}

Luego  t_\text{valor}  se encuentra dado por:
 t_\text{valor} = \frac{(\widehat\beta - \beta_0)\sqrt{n-2}}{ \sqrt{\text{SSE}/\sum_{i=1}^n \left(x_i - \overline{x}\right)^2} }.

Prueba t para dos muestras independientes

Iguales tamaños muestrales, iguales varianzas

Esta prueba se utiliza solamente cuando:
  • los dos tamaños muestrales (esto es, el número, n, de participantes en cada grupo) son iguales;
  • se puede asumir que las dos distribuciones poseen la misma varianza.
Las violaciones a estos presupuestos se discuten más abajo.
El estadístico t a probar si las medias son diferentes se puede calcular como sigue:
t = \frac{\bar {X}_1 - \bar{X}_2}{S_{X_1X_2} \cdot \sqrt{\frac{2}{n}}}
Donde
\ S_{X_1X_2} = \sqrt{\frac{1}{2}(S_{X_1}^2+S_{X_2}^2)}
Aquí S_{X_1X_2} es la desviación estándar combinada, 1 = grupo uno, 2 = grupo 2. El denominador de t es el error estándar de la diferencia entre las dos medias.
Por prueba de significancia, los grados de libertad de esta prueba se obtienen como 2n − 2 donde n es el número de participantes en cada grupo.

Diferentes tamaños muestrales, iguales varianzas

Esta prueba se puede utilizar únicamente si se puede asumir que las dos distribuciones poseen la misma varianza. (Cuando este presupuesto se viola, mirar más abajo). El estadístico t si las medias son diferentes puede ser calculado como sigue:

t = \frac{\bar {X}_1 - \bar{X}_2}{S_{X_1X_2} \cdot \sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}
Donde
 S_{X_1X_2} = \sqrt{\frac{(n_1-1)S_{X_1}^2+(n_2-1)S_{X_2}^2}{n_1+n_2-2}}.
Nótese que las fórmulas de arriba, son generalizaciones del caso que se da cuando ambas muestras poseen igual tamaño (sustituyendo n por n1 y n2).
S_{X_1X_2} es un estimador de la desviación estándar común de ambas muestras: esto se define así para que su cuadrado sea un estimador sin sesgo de la varianza común sea o no la media iguales. En esta fórmula, n = número de participantes, 1 = grupo uno, 2 = grupo dos. n − 1 es el número de grados de libertad para cada grupo, y el tamaño muestral total menos dos (esto es, n1 + n2 − 2) es el número de grados de libertad utilizados para la prueba de significancia.

Diferentes tamaños muestrales, diferentes varianzas

Esta prueba es también conocida como prueba t de Welch y es utilizada únicamente cuando se puede asumir que las dos varianzas poblacionales son diferentes (los tamaños muestrales pueden o no ser iguales) y por lo tanto deben ser estimadas por separado. El estadístico t a probar cuando las medias poblacionales son distintas puede ser calculado como sigue:
t = {\overline{X}_1 - \overline{X}_2 \over s_{\overline{X}_1 - \overline{X}_2}}
donde
s_{\overline{X}_1 - \overline{X}_2} = \sqrt{{s_1^2 \over n_1} + {s_2^2  \over n_2}}.

Aquí s2 es el estimador sin sesgo de la varianza de las dos muestras, n = número de participantes, 1 = grupo uno, 2 = grupo dos. Nótese que en este caso,  {s_{\overline{X}_1 - \overline{X}_2}}^2  no es la varianza combinada. Para su utilización en pruebas de significancia, la distribución de este estadístico es aproximadamente igual a una distribución t ordinaria con los grados de libertad calculados según:

 \mathrm{g.l.} = \frac{(s_1^2/n_1 + s_2^2/n_2)^2}{(s_1^2/n_1)^2/(n_1-1) + (s_2^2/n_2)^2/(n_2-1)}.

Esta ecuación es llamada la ecuación Welch–Satterthwaite. Nótese que la verdadera distribución de este estadístico de hecho depende (ligeramente) de dos varianzas desconocidas.

Prueba t dependiente para muestras apareadas

Esta prueba se utiliza cuando las muestras son dependientes; esto es, cuando se trata de una única muestra que ha sido evaluada dos veces (muestras repetidas) o cuando las dos muestras han sido emparejadas o apareadas. Este es un ejemplo de un test de diferencia apareada.

t = \frac{\overline{X}_D - \mu_0}{s_D/\sqrt{n}}.

Para esta ecuación, la diferencia entre todos los pares tiene que ser calculada. Los pares se han formado ya sea con resultados de una persona antes y después de la evaluación o entre pares de personas emparejadas en grupos de significancia (por ejemplo, tomados de la misma familia o grupo de edad: véase la tabla). La media (XD) y la desviación estándar (sD) de tales diferencias se han utilizado en la ecuación. La constante μ0 es diferente de cero si se desea probar si la media de las diferencias es significativamente diferente de μ0. Los grados de libertad utilizados son n − 1.
Ejemplo de pares emparejados
ParNombreEdadTest
1Juan35250
1Joana36340
2Jaimito22460
2Jesica21200
Ejemplo de muestras repetidas
NúmeroNombreTest 1Test 2
1Miguel35%67%
2Melanie50%46%
3Melisa90%86%
4Michell78%91%

Ejemplos desarrollados

Sea A1 denotando un grupo obtenido tomando 6 muestras aleatorias a partir de un grupo mayor:
A_1=\{30,02;\ 29,99;\ 30,11;\ 29,97;\ 30,01;\ 29.99\}
y sea A2 denotando un segundo grupo obtenido de manera similar:
A_2=\{29,89;\ 29,93;\ 29,72;\ 29,98;\ 30,02;\ 29,98\}

Estos podrían ser, por ejemplo, los pesos de tornillos elegidos de un montón.
Vamos a llevar a cabo la prueba de hipótesis contando como hipótesis nula de que la media de las poblaciones de las cuales hemos tomado las muestras son iguales.
La diferencia entre las dos medias de muestras, cada uno denotado por \overline{X}_i, la cual aparece en el numerador en todos los enfoques de dos muestras discutidas anteriormente, es


\overline{X}_1 - \overline{X}_2 = 0,095.

La desviaciones estándar muestrales para las dos muestras son aproximadamente 0,05 y 0,11 respectivamente. Para muestras tan pequeñas, una prueba de igualdad entre las varianzas de las dos poblaciones no es muy poderoso. Pero ya que los tamaños muestrales son iguales, las dos formas de las dos pruebas t se pueden desarrollar en forma similar en este ejemplo.

Varianzas desiguales

Si se decide continuar con el enfoque para varianzas desiguales (discutido anteriormente), los resultados son


\sqrt{{s_1^2 \over n_1} + {s_2^2  \over n_2}} \approx 0,0485
y

\text{gl} \approx 7,03 \,

El resultado de la prueba estadística es aproximadamente 1,959. El valor P para la prueba de dos colas da un valor aproximado de 0,091 y el valor P para la prueba de una cola es aproximadamente 0,045.

Varianzas iguales

Si se sigue el enfoque para varianzas iguales (discutido anteriormente), los resultados son


S_{X_1X_2} \approx 0,084 \,
y

\text{gl} = 10 \,

Ya que el tamaño de las muestras es igual (ambas tienen 6 elementos), el resultado de la prueba estadística es nuevamente un valor que se aproxima a 1.959. Debido a que los grados de libertad son diferentes de la prueba para varianzas desiguales, los valores P difieren ligeramente de los obtenidos un poco más arriba. Aquí el valor P para la prueba de dos colas es aproximadamente 0,078, y el valor P para una cola es aproximadamente 0,039. Así, si hubiera una buena razón para creer que las varianzas poblacionales son iguales, los resultados serían algo más sugerentes de una diferencia en los pesos medios de las dos poblaciones de tornillos.

Alternativas a la prueba t para problemas de locación

La prueba t provee un mecanismo exacto para evaluar la igualdad entre las medias de dos poblaciones que tengan varianzas iguales, aunque el valor exacto de las mismas sea desconocido. El test de Welch es una prueba aproximadamente exacta para el caso en que los datos poseen una distribución normal, pero las varianzas son diferentes. Para muestras moderadamente grandes y pruebas de una cola, el estadístico t es moderadamente robusto a las violaciones de la asunción de normalidad.9
Para ser exactos tanto las pruebas t como las z requiere que las medias de las muestras sigan una distribución normal, y la prueba t adicionalmente requiere que la varianza de las muestras siga una distribución Chi-cuadrado (χ2), y que la media muestral y la varianza muestral sean estadísticamente independientes. La normalidad de los valores individuales de los datos no es un requisito para que estas condiciones se cumplan. Por el teorema del límite central, las medias muestrales de muestras moderadamente grandes también aproximan una distribución normal, incluso si los datos individuales no están normalmente distribuidos. Para datos no normales, la distribución de la varianza muestral puede desviarse sustancialmente de una distribución χ2. Sin embargo, si el tamaño muestral es grande, el teorema de Slutsky indica que la distribución de las varianzas muestrales ejerce un efecto muy pequeño en la distribución de la prueba estadística. Si los datos son substancialmente no normales, y el tamaño muestral es pequeño, la prueba t puede entregar resultados equivocados.
Cuando la asunción de normalidad no se sostiene, una alternativa no paramétrica a la prueba t puede ofrecer un mejor poder estadístico. Por ejemplo, para dos muestras independientes cuando la distribución de datos es asimétrica (esto es, que la distribución está sesgada) o la distribución tiene colas muy grandes, entonces el test de suma de posiciones (ranks) de Wilcoxon (conocido también como prueba U de Mann-Whitney) puede tener de tres a cuatro veces mayor poder estadístico que una prueba t.9 10 11
La contraparte no paramétrica a la prueba t de muestras apareadas es la prueba Wilcoxon de suma de posiciones con signo para muestras pareadas. Para una discusión sobre cuando hacer una elección entre las alternativas t y no paramétricos, consulte a Sawilowsky.12
El análisis de varianza "one-way" generaliza la prueba t de dos muestras para casos donde los datos pertenecen a más que dos grupos.

Pruebas multivariadas

Una generalización del estadístico t de Student llamada estadístico t cuadrado de Hotelling, permite la comprobación de hipótesis en múltiples (y a menudo correlacionadas) mediciones de la misma muestra. Por ejemplo, un investigador puede presentar un número de sujetos a un test de múltiples escalas de personalidad (p.ej el de cinco grandes rasgos de personalidad). Debido a que las medidas de este tipo suelen estar muy correlacionadas, no es aconsejable llevar a cabo varias pruebas univariadas, ya que esto supondría descuidar la covarianza entre las medidas e inflar la probabilidad de rechazar falsamente al menos una hipótesis (error de tipo I). En este caso una única prueba múltiple es preferible para llevar a cabo las pruebas de hipótesis. El estadístico t de Hosteling sigue una distribución T 2, sin embargo en la práctica, esta distribución se utiliza muy raramente, y en cambio se suele convertir en una distribución de tipo F.

Prueba T 2 monomuestral

Para una prueba multivariable de unica muestra, la hipótesis es que el vector medio ({\mathbf\mu}) es igual a un vector ({\mathbf\mu_0}) dado. La prueba estadística se define como:

T^2=n(\overline{\mathbf x}-{\mathbf\mu_0})'{\mathbf S}^{-1}(\overline{\mathbf x}-{\mathbf\mu_0})
Donde n es el tamaño muestral, \overline{\mathbf x} es el vector de columnas medio y {\mathbf S} una matriz de covarianza muestral m\times m.

Prueba T 2 bimuestral

Para un test multivariable de dos muestras, la hipótesis es que los vectores medios ({\mathbf\mu}_1{\mathbf\mu}_2) de las dos muestras son iguales. La prueba estadística se define como:
T^2 = \frac{n_1 n_2}{n_1+n_2}(\overline{\mathbf x}_1-\overline{\mathbf x}_2)'{\mathbf S_\text{pooled}}^{-1}(\overline{\mathbf x}_1-\overline{\mathbf x}_2).

Implementaciones

La mayoría de los programas tipo hoja de cálculo y paquetes estadísticos de lenguajes de programación, tales como QtiPlotOpenOffice.org CalcLibreOffice CalcMicrosoft ExcelSASSPSSStataDAPgretlRPython ([1]), PSPPInfostaty Minitab, incluyen implementaciones del test t de Student.

Lecturas adicionales

  • Boneau, C. Alan (1960). «The effects of violations of assumptions underlying the t test». Psychological Bulletin 57 (1):  pp. 49–64. doi:10.1037/h0041412
  • Edgell, Stephen E., & Noon, Sheila M (1984). «Effect of violation of normality on the t test of the correlation coefficient». Psychological Bulletin 95 (3):  pp. 576–583. doi:10.1037/0033-2909.95.3.576.

Referencias

  1. Ir a Richard Mankiewicz, The Story of Mathematics (Princeton University Press), p.158.
  2. ↑ Saltar a:a b O'Connor, John J.; Robertson, Edmund F., «Biografía de Prueba t de Student» (en inglés)MacTutor History of Mathematics archiveUniversidad de Saint Andrews.
  3. Ir a Fisher Box, Joan (1987). «Guinness, Gosset, Fisher, and Small Samples».Statistical Science 2 (1):  pp. 45–52. doi:10.1214/ss/1177013437.
  4. Ir a Raju TN (2005). «William Sealy Gosset and William A. Silverman: two "students" of science». Pediatrics 116 (3):  pp. 732–5. doi:10.1542/peds.2005-1134PMID 16140715.
  5. ↑ Saltar a:a b Fadem, Barbara (2008). High-Yield Behavioral Science (High-Yield Series). Hagerstwon, MD: Lippincott Williams & Wilkins. ISBN 0-7817-8258-9.
  6. Ir a Zimmerman, Donald W. (1997). «A Note on Interpretation of the Paired-Samples t Test». Journal of Educational and Behavioral Statistics 22 (3):  pp. 349–360.
  7. Ir a Markowski, Carol A; Markowski, Edward P. (1990). «Conditions for the Effectiveness of a Preliminary Test of Variance». The American Statistician 44(4):  pp. 322–326. doi:10.2307/2684360.
  8. Ir a David, HA; Gunnink, Jason L (1997). «The Paired t Test Under Artificial Pairing». The American Statistician 51 (1):  pp. 9–12. doi:10.2307/2684684.
  9. ↑ Saltar a:a b Sawilowsky S., Blair R. C. (1992). «A more realistic look at the robustness and type II error properties of the t test to departures from population normality». Psychological Bulletin 111 (2):  pp. 353–360. doi:10.1037/0033-2909.111.2.352.
  10. Ir a Blair, R. C.; Higgins, J.J. (1980). «A comparison of the power of Wilcoxon’s rank-sum statistic to that of Student’s t statistic under various nonnormal distributions.». Journal of Educational Statistics 5 (4):  pp. 309–334.doi:10.2307/1164905.
  11. Ir a Fay, MP; Proschan, MA (2010). «Wilcoxon-Mann-Whitney or t-test? On assumptions for hypothesis tests and multiple interpretations of decision rules». Statistics Surveys 4:  pp. 1–39. doi:10.1214/09-SS051PMID20414472PMC 2857732.
  12. Ir a Sawilowsky S (2005). «Misconceptions leading to choosing the t test over the Wilcoxon Mann-Whitney U test for shift in location parameter». Journal of Modern Applied Statistical Methods 4 (2):  pp. 598–600.

Wikipedia

lunes, 20 de enero de 2014

Café gratis, se paga el tiempo

En este restaurante todo es gratis, menos el tiempo

CURIOSIDAD
El café Ziferblat cobra por el tiempo que se permanezca en sus instalaciones y no por lo que se consuma.


No cobran por la comida pero a cambio las personas preparan las bebidas y lavan los platos.
Foto: Alex Lentati. www.standard.co.uk

Hay restaurantes típicos, otros que tienen sus ‘horas felices’ y hasta algunos en los que por un precio determinado se come lo que se desee. Sin embargo, un restaurante ruso tiene otra idea muy diferente y un poco extraña de cobrarle a sus clientes.

El café Ziferblat cobra por el tiempo que se permanezca en sus instalaciones y no por lo que se consuma. En este sitio todo es gratis, menos el tiempo.

Cada minuto que se pase en el café cuesta cinco centavos de dólar (aproximadamente 20 pesos).
En el lugar hay cientos de opciones, la especialidad son el té y las galletas. “Aquí se puede hacer lo que se quiera. Conocer gente, trabajar, descansar. Se puede comer y beber todo lo que se desee, y gratis”, ha dicho Ivan Meetin, dueño del café.

La pequeña trampa del lugar consiste en que es el cliente el que se tiene que preparar las bebidas y quien tiene que lavar lo que ensucie antes de abandonar el sitio. Este podría ser un elemento que disuada a algunas personas, pero otras, acostumbradas a un ritmo de vida agitado donde todo lo deben hacer por su cuenta, no le ven ningún problema.

El local funciona como una casa, hay libros, conexión para Wifi y hasta tocadiscos y rockolas.

El modelo de negocio ha funcionado en Rusia, donde hasta el momento hay 10 Ziferblat y acaban de abrir uno en Londres. A pesar de que se pueda pensar que no es un buen negocio dejar que el cliente coma sin pagar, por más de que le exijan preparar los alimentos y lavar, su dueño le ha dicho a CNN: “Es un buen negocio. Y si es rentable quiere decir que lo estamos haciendo bien".

domingo, 19 de enero de 2014

El mercado de órganos: Un análisis económico

Cash for Kidneys: The Case for a Market for Organs
There is a clear remedy for the growing shortage of organ donors, say Gary S. Becker and Julio J. Elias
By GARY S. BECKER and JULIO J. ELIAS
Wall Street Journal

In 2012, 95,000 American men, women and children were on the waiting list for new kidneys, the most commonly transplanted organ. Yet only about 16,500 kidney transplant operations were performed that year. Taking into account the number of people who die while waiting for a transplant, this implies an average wait of 4.5 years for a kidney transplant in the U.S.




The situation is far worse than it was just a decade ago, when nearly 54,000 people were on the waiting list, with an average wait of 2.9 years. For all the recent attention devoted to the health-care overhaul, the long and growing waiting times for tens of thousands of individuals who badly need organ transplants hasn't been addressed.

Finding a way to increase the supply of organs would reduce wait times and deaths, and it would greatly ease the suffering that many sick individuals now endure while they hope for a transplant. The most effective change, we believe, would be to provide compensation to people who give their organs—that is, we recommend establishing a market for organs.

Organ transplants are one of the extraordinary developments of modern science. They began in 1954 with a kidney transplant performed at Brigham & Women's hospital in Boston. But the practice only took off in the 1970s with the development of immunosuppressive drugs that could prevent the rejection of transplanted organs. Since then, the number of kidney and other organ transplants has grown rapidly, but not nearly as rapidly as the growth in the number of people with defective organs who need transplants. The result has been longer and longer delays to receive organs.

Many of those waiting for kidneys are on dialysis, and life expectancy while on dialysis isn't long. For example, people age 45 to 49 live, on average, eight additional years if they remain on dialysis, but they live an additional 23 years if they get a kidney transplant. That is why in 2012, almost 4,500 persons died while waiting for kidney transplants. Although some of those waiting would have died anyway, the great majority died because they were unable to replace their defective kidneys quickly enough.



The toll on those waiting for kidneys and on their families is enormous, from both greatly reduced life expectancy and the many hardships of being on dialysis. Most of those on dialysis cannot work, and the annual cost of dialysis averages about $80,000. The total cost over the average 4.5-year waiting period before receiving a kidney transplant is $350,000, which is much larger than the $150,000 cost of the transplant itself.

Individuals can live a normal life with only one kidney, so about 34% of all kidneys used in transplants come from live donors. The majority of transplant kidneys come from parents, children, siblings and other relatives of those who need transplants. The rest come from individuals who want to help those in need of transplants.

In recent years, kidney exchanges—in which pairs of living would-be donors and recipients who prove incompatible look for another pair or pairs of donors and recipients who would be compatible for transplants, cutting their wait time—have become more widespread. Although these exchanges have grown rapidly in the U.S. since 2005, they still account for only 9% of live donations and just 3% of all kidney donations, including after-death donations. The relatively minor role of exchanges in total donations isn't an accident, because exchanges are really a form of barter, and barter is always an inefficient way to arrange transactions.

Exhortations and other efforts to encourage more organ donations have failed to significantly close the large gap between supply and demand. For example, some countries use an implied consent approach, in which organs from cadavers are assumed to be available for transplant unless, before death, individuals indicate that they don't want their organs to be used. (The U.S. continues to use informed consent, requiring people to make an active declaration of their wish to donate.) In our own highly preliminary study of a few countries—Argentina, Austria, Brazil, Chile and Denmark—that have made the shift to implied consent from informed consent or vice versa, we found that the switch didn't lead to consistent changes in the number of transplant surgeries.



A surgeon stands next to a monitor showing a donor kidney in 2012. The average cost of a kidney transplant is $150,000. Annual cost of dialysis: $80,000 Reuters

Other studies have found more positive effects from switching to implied consent, but none of the effects would be large enough to eliminate the sizable shortfall in the supply of organs in the U.S. That shortfall isn't just an American problem. It exists in most other countries as well, even when they use different methods to procure organs and have different cultures and traditions.

Paying donors for their organs would finally eliminate the supply-demand gap. In particular, sufficient payment to kidney donors would increase the supply of kidneys by a large percentage, without greatly increasing the total cost of a kidney transplant.

We have estimated how much individuals would need to be paid for kidneys to be willing to sell them for transplants. These estimates take account of the slight risk to donors from transplant surgery, the number of weeks of work lost during the surgery and recovery periods, and the small risk of reduction in the quality of life.

Our conclusion is that a very large number of both live and cadaveric kidney donations would be available by paying about $15,000 for each kidney. That estimate isn't exact, and the true cost could be as high as $25,000 or as low as $5,000—but even the high estimate wouldn't increase the total cost of kidney transplants by a large percentage.

Few countries have ever allowed the open purchase and sale of organs, but Iran permits the sale of kidneys by living donors. Scattered and incomplete evidence from Iran indicates that the price of kidneys there is about $4,000 and that waiting times to get kidneys have been largely eliminated. Since Iran's per capita income is one-quarter of that of the U.S., this evidence supports our $15,000 estimate. Other countries are also starting to think along these lines: Singapore and Australia have recently introduced limited payments to live donors that compensate mainly for time lost from work.

Since the number of kidneys available at a reasonable price would be far more than needed to close the gap between the demand and supply of kidneys, there would no longer be any significant waiting time to get a kidney transplant. The number of people on dialysis would decline dramatically, and deaths due to long waits for a transplant would essentially disappear.



Today, finding a compatible kidney isn't easy. There are four basic blood types, and tissue matching is complex and involves the combination of six proteins. Blood and tissue type determine the chance that a kidney will help a recipient in the long run. But the sale of organs would result in a large supply of most kidney types, and with large numbers of kidneys available, transplant surgeries could be arranged to suit the health of recipients (and donors) because surgeons would be confident that compatible kidneys would be available.

The system that we're proposing would include payment to individuals who agree that their organs can be used after they die. This is important because transplants for heart and lungs and most liver transplants only use organs from the deceased. Under a new system, individuals would sell their organs "forward" (that is, for future use), with payment going to their heirs after their organs are harvested. Relatives sometimes refuse to have organs used even when a deceased family member has explicitly requested it, and they would be more inclined to honor such wishes if they received substantial compensation for their assent.

The idea of paying organ donors has met with strong opposition from some (but not all) transplant surgeons and other doctors, as well as various academics, political leaders and others. Critics have claimed that paying for organs would be ineffective, that payment would be immoral because it involves the sale of body parts and that the main donors would be the desperate poor, who could come to regret their decision. In short, critics believe that monetary payments for organs would be repugnant.

But the claim that payments would be ineffective in eliminating the shortage of organs isn't consistent with what we know about the supply of other parts of the body for medical use. For example, the U.S. allows market-determined payments to surrogate mothers—and surrogacy takes time, involves great discomfort and is somewhat risky. Yet in the U.S., the average payment to a surrogate mother is only about $20,000.

Another illuminating example is the all-volunteer U.S. military. Critics once asserted that it wouldn't be possible to get enough capable volunteers by offering them only reasonable pay, especially in wartime. But the all-volunteer force has worked well in the U.S., even during wars, and the cost of these recruits hasn't been excessive.

Whether paying donors is immoral because it involves the sale of organs is a much more subjective matter, but we question this assertion, given the very serious problems with the present system. Any claim about the supposed immorality of organ sales should be weighed against the morality of preventing thousands of deaths each year and improving the quality of life of those waiting for organs. How can paying for organs to increase their supply be more immoral than the injustice of the present system?

Under the type of system we propose, safeguards could be created against impulsive behavior or exploitation. For example, to reduce the likelihood of rash donations, a period of three months or longer could be required before someone would be allowed to donate their kidneys or other organs. This would give donors a chance to re-evaluate their decisions, and they could change their minds at any time before the surgery. They could also receive guidance from counselors on the wisdom of these decisions.

Though the poor would be more likely to sell their kidneys and other organs, they also suffer more than others from the current scarcity. Today, the rich often don't wait as long as others for organs since some of them go to countries such as India, where they can arrange for transplants in the underground medical sector, and others (such as the late Steve Jobs ) manage to jump the queue by having residence in several states or other means. The sale of organs would make them more available to the poor, and Medicaid could help pay for the added cost of transplant surgery.

The altruistic giving of organs might decline with an open market, since the incentive to give organs to a relative, friend or anyone else would be weaker when organs are readily available to buy. On the other hand, the altruistic giving of money to those in need of organs could increase to help them pay for the cost of organ transplants.

Paying for organs would lead to more transplants—and thereby, perhaps, to a large increase in the overall medical costs of transplantation. But it would save the cost of dialysis for people waiting for kidney transplants and other costs to individuals waiting for other organs. More important, it would prevent thousands of deaths and improve the quality of life among those who now must wait years before getting the organs they need.

Initially, a market in the purchase and sale of organs would seem strange, and many might continue to consider that market "repugnant." Over time, however, the sale of organs would grow to be accepted, just as the voluntary military now has widespread support.

Eventually, the advantages of allowing payment for organs would become obvious. At that point, people will wonder why it took so long to adopt such an obvious and sensible solution to the shortage of organs for transplant.

Mr. Becker is a Nobel Prize-winning professor of economics at the University of Chicago and a senior fellow at the Hoover Institution. Mr. Elias is an economics professor at the Universidad del CEMA in Argentina.

sábado, 18 de enero de 2014

Consejos de Goldman Sachs a sus inversores ricos



Here's The Advice Goldman Sachs Is Giving Its Millionaire Clients



After witnessing the S&P 500 surge 30% in 2013, and return 200% since the market trough in March 2009, investors are wondering what they should do next.
Goldman Sachs' Sharmin Mossavar-Rahmani and Brett Nelson are recommending that the firm's private wealth clients should "stay fully invested at their strategic allocation to U.S. equities."
Goldman's Private Wealth Investment Management division will manage money for folks with at least $10 million.
While this recommendation is the same as recommendations they made in Dec. 2008, Apr. 2012, and Apr. 2013, Goldman says their current view is a more "nuanced" this time because valuations aren't the tailwind they once were.
"We believe that having a long-term investment horizon is particularly important at this time because it gives our clients a comparative advantage over other investors whose investment horizons are hampered by institutional constraints such as quarterly reporting periods or public finance considerations," Mossavar-Rahmani and Nelson write.
"In addition, the current monetary policy environment of zero interest rates makes cash and high-quality fixed income assets much less attractive over the next one and five years, which, in turn, increases the attractiveness of equities."
They point out that the "the penalty of being wrong when underweighting US equities are very high."
Another factor in this recommendation is that bull markets "do not die of old age." Instead, they need some shock to trigger a bear market. In the past, these triggers have been tighter monetary policy or an external shock like the dot com bubble or housing bust and there seem to be no signs of any such triggers at the moment.
Of course, there are a few key things that pose a risk to U.S. equity markets: 1. The U.S. economy stalls and goes into recession; 2. The Fed's exit from quantitative easing is more disruptive than anticipated; 3. The eurozone sovereign debt crisis bubbles over; 4. Confidence in Japan's three arrows of Abenomics wanes; 5. Emerging market countries see a hard landing; 6. There are geopolitical disruptions through military engagement.
Meanwhile, here are Goldman's key investment themes for 2014:
  • Underweight investment grade bonds, including intermediate municipal bonds and 10-year Treasuries, because they are expected to have slightly negative total returns for 2014 and modest positive returns over the next five years.
  • Overweight high-yield bonds and bank loans as they are expected to outpeform investment grade bonds and cash in the near term and over next five years.
  • Maintain exposure to hedge funds as they should have mid-single-digit returns and should outperform bonds.
  • Stay fully invested in U.S. equities will have modest single-digit returns of about 3% in 2014 and slightly higher returns over the next five years.
  • Overweight Euro Stoxx 50 because they "will continue to have some of the most attractive near-term and long-term returns."
  • "US banks will have more subdued returns than last year but will still be quite attractive in absolute terms."
  • "Emerging market equities are likely to provide higher returns than investment-grade bonds and US equities, but we expect emerging market bonds to lag US high-yield bonds and bank loans."
Overall, Goldman is more cautious now, and is proceeding with "extra vigilance, knowing that the summit is in sight."


Read more: http://www.businessinsider.com/what-goldman-is-telling-wealthy-clients-2014-1#ixzz2qJKGuJzO

viernes, 17 de enero de 2014

Superintendencia de "precios justos": La estupidez dirige Venezuela

Venezuela: Maduro creó la Superintendencia de "los precios justos"
Fue dentro de las nuevas modificaciones que impuso en su gobierno. Esperan que un millón de inspectores, con una gran mayoría de militares, salgan a las calles a fiscalizar precios.


SALUDO. Maduro, durante su discurso.

El presidente de Venezuela, Nicolás Maduro, sigue realizando modificaciones en su gobierno, en momentos en los que su país vive una creciente crisis económica. Así anunció la salida del ministro de Finanzas, una reforma del sistema de control de divisas y la continuidad del tipo de cambio en su tasa actual de 6,3 bolívares por dólar y el lanzamiento de la Superintendencia de "precios justos".

El mandatario afirmó que el organismo será cívico militar y se espera que gran parte del millón de inspectores que salgan a las calles a fiscalizar los precios sean militares. Maduro sostuvo que los cambios se hacen en función del plan de desarrollo que se ha venido "priorizando" y para "la expansión de un sistema financiero al servicio de la patria".

En la lectura ante el Parlamento de su informe de gestión del 2013, Maduro anunció además la eliminación de la estatal Comisión Estatal de Administración de Divisas (Cadivi), que será absorbida por el nuevo Centro Nacional de Comercio Exterior. El objetivo es "reestructurar todos los mecanismos de acceso a las divisas en función de acelerar esos procesos complejos", dijo el presidente.

En Venezuela existe un sistema de control de cambios que deja en manos del Estado el monopolio de la gestión y administración de las divisas en el país, a las que se accede mediante un engorroso proceso administrativo al que el sector privado responsabiliza de los problemas de desabastecimiento.

TN