Introducción

El artículo científico se ha concebido como un medio para transmitir la verdad científica. Constituye una prueba documental de la creatividad y productividad del investigador y como tal involucra una gran responsabilidad, tanto por el contenido como por las conclusiones que de él se deriven. Se advierte entonces la necesidad de un uso racional, eficiente y óptimo del sistema.

Los miembros de la comunidad científica y profesional utilizan la literatura científica para estar al tanto de los nuevos desarrollos y es importante que ellos sean capaces de acceder a ella. Hoy en día, la comunidad científica y en especial los editores de las revistas requieren que los investigadores trabajen sus materias y sus resultados con métodos y análisis estadísticos adecuados que le otorguen un sólido respaldo probabilístico.

Por otra parte, es sabido que ultimamente se ha generado sobre el académico y el investigador científico una fuerte presión para publicar cuanto sea posible y que se resume en la frase 'publicar o perecer', razón por la cual el control de cada etapa del método científico, especialmente la aplicación de los 'engorrosos' métodos estadísticos frecuentemente no ha recibido la adecuada atención.

La utilización de métodos estadísticos en ciencias veterinarias se ha constituido en una importante herramienta para su desarrollo, especialmente como consecuen­cia de la introducción del uso del compu­tador y el manejo masivo de información. Una investigación revela que el 97% de las tesis de grado de medicina veterinaria en la Universidad de Chile, usan en promedio 3 métodos estadísticos distintos, sin considerar las repeticiones, otorgándoles un importante papel en el método científico ya sea en el diseño, en el muestreo, análisis, resumen, interpretación y comunicación de los hallazgos (Ibarra, 1988).

Son varios también los trabajos que revelan el uso erróneo de la estadística en muchos artículos en el área médica humana, aún en prestigiosas revistas (Avram et al., 1985; Gardner et al., 1986; Glantz, 1980; Gore et al., 1977; O'Fallon et al., 1978 y también en medicina veterinaria (Ibarra y Urcelay, 1989). Altman (1980), enfatiza la seriedad del problema señalando que el mal uso de la estadística se perfila como un problema ético.

Tanto, programas de estudio insuficientes en estadística, como la no internalización adecuada del conocimiento, o el olvido conceptual o metodológico como consecuencia del uso ocasional, puede inducir a error en alguna de las etapas de la investigación y que puede llevar a invalidar un trabajo.

Objetivo

Es entonces relevante un control de calidad de las publicaciones científicas, particularmente en aquellos aspectos metodológicos que validan las conclusiones. En virtud de lo anterior se ha considerado de interés elaborar el presente trabajo que tiene como objetivo entregar algunas indicaciones que contribuyen a ese control, y que al mismo tiempo apoyen a los investigadores y lec­tores en la comprensión de algunos con­ceptos estadísticos de uso frecuente.

Los aspectos que se describen están referidos a publicaciones en general, focalizando la atención en aquellos elementos metodológicos más importantes que una publicación científica debe considerar.

El esquema de presentación seguirá la secuencia habitual de las etapas sugeridas en la mayoría de las revistas científicas.

La primera consideración en un escrito es establecer claramente el objetivo de la in­vestigación. Este puede traducirse opciona­lmente en una hipótesis de investigación, si ello es necesario, a fin de que el lector sea capaz de identificar el problema central en estudio.

Material y método

Entre los aspectos que deben ser revisados en un escrito se encuentran los siguientes:

A.- Diseño.

El diseño de la investigación debe estar claramente descrito y debe ser apropiado para lograr el objetivo propuesto. Entre los puntos relevantes se deben considerar:

1.- Población de referencia. Corresponde a aquella desde donde se obtiene la muestra y a la cual se intenta inferir los resul­tados. Esta puede ser definida usando factores espaciales o geográficos, individuales como raza, edad, factores de manejo etc., y deben ser explicitados en cierto nivel de detalle.

2.- Selección de la muestra. Se debe describir el método de muestreo usado para la obtención de las observaciones, dado que éste influye en la representatividad de la muestra.

3.- Forma de asignación de los tratamientos a las observaciones. La mayoría de los métodos estadísticos supone una asig­nación aleatoria.

4.- Existencia de grupo control. En muchos experimentos para poder demostrar los efectos de tratamiento, debe conside­rarse un grupo control y describir sus características. El uso del propio grupo como control puede demostrar un cambio en las variables, pero no se demuestra científicamente el efecto debido a tratamiento.

5.- Determinación del tamaño muestra. Se deben entregar las bases de la elección del tamaño de muestra, es decir, cuántas unidades de observación son necesarias para detectar el efecto deseado en el experimento.  Al respecto se debe informar sobre el nivel de significación usado (error tipo l, o alfa) y si corresponde, la potencia de la prueba para el propósito del experimento.

En muchos casos es aconsejable usar unas pocas unidades experimentales más que las mínimas requeridas, por si la variabilidad es mayor que la estimada, o previendo eventuales pérdidas de unidades experimentales. En la literatura es posi­ble encontrar fórmulas de estimación del tamaño muestra para una gama de experimentos (Cochran 1971; Fleiss, 1981; Pasternack y Shore, 1982).

B.- Análisis

Se deben describir todos los métodos es­tadísticos de análisis de los datos y donde son usados. Esta indicación se entrega con el objetivo que el lector se forme un juicio de la atigencia de éstos métodos y de la validez de las conclusiones obtenidas.

Algunos métodos de uso frecuente no necesitan referencias, como es el caso de un coeficiente de correlación o una des­cripción estadística, pero la aplicación de formas de análisis poco usuales, debe ser justificada especialmente y en lo posible con alguna referencia.

Resultados

A.- Descripción estadística

Los resultados deben consultar una buena descripción estadística de los datos, antes del análisis formal. Ella debe incluir al menos una medida de posición (media, mediana, moda), una de dispersión (desviación típi­ca, varianza) y alguna referencia acerca del tipo de distribución de los datos.

Este último antecedente es importante dado que algunos métodos estadísticos - como análisis de regresión, análisis de varianza y otros - dependen de ciertos supuestos acerca de la distribución de la variable en análisis. Técnicamente se asume que los datos provienen de poblaciones con errores normalmente distribuidos y que la variabili­dad dentro de los grupos es la misma, si son varios los grupos a comparar.

B.- Transformaciones

Si los supuestos mencionados no se cumplen, no es posible entregar en forma absoluta el grado de invalidez que afecta el análisis. Este problema se observa especialmente en variables como recuentos microbianos, recuentos parasitarios, títulos serológicos, porcentajes y otras, que para hacer posible su análisis requieren de una adecuada transformación (logaritmo, raíz cuadrada u otra) que permita el cumplimiento de los supuestos (Steel y Torrie, 1960).

Dos consideraciones deben tenerse presente ante la situación descrita.

I.- Una vez realizado el análisis es necesario recuperar la escala original para la presentación de los resultados. II.- Chequear si la transformación opera los resultados esperados.

Alternativamente la estadística pone a disposición del usuario, métodos llamados 'no paramétricos' de libre distribución basados fundamentalmente en un análisis de ordinalidad, que hacen innecesaria la transformación descrita (Hollander y Wolfe, 1973).

C.- Nivel de significación

En los experimentos el efecto de tratamiento observado (es decir la diferencia simple entre el grupo control y el grupo tratado) se usa para estimar el verdadero efecto del tratamiento (que corresponde al efecto que se lograría después de un número infinito de ensayos). Como el procedimiento utilizado corresponde a una inferencia inductiva es posible que se puedan cometer errores, uno conocido como error tipo I (o alfa) que corresponde al nivel de significación y el otro, error tipo II (o beta), (Schefler, 1981). El error tipo I ocurre cuando se declara, basado en los resultados del ensayo, que hay una diferencia verdadera dada por el tratamiento, cuando en verdad no existe el efecto. Expresado de otra manera, el nivel de significación corresponde a la probabilidad que la diferencia observada entre el grupo control y el de tratamiento sea origi­nada por el azar. Al ser esta probabilidad tan pequeña, se asume que puede ser causada por el tratamiento efectuado y no por un factor aleatorio.

El error tipo II ocurre cuando se declara, en base a los resultados del ensayo, que no hay efecto del tratamiento cuando en verdad existe y la muestra no fue capaz de detectarlo.

Usualmente el valor más frecuente de error tipo I, por convención, ha sido igual o menor a 0,05, es decir tomar a lo más una muestra equivocada en 20 veces. Por otra parte la probabilidad de cometer error tipo 11 frecuentemente. ha sido igual o menor a 0,20.

Si la probabilidad del error tipo 11 se sustrae de 1, el resultado en cuestión se denomina potencia de la prueba. La potencia es la probabilidad de detectar una verdadera diferencia, en el efecto de los tratamientos. En general errores I y II muy pequeños, determinan tamaños muestrales mayores. Lo importante de señalar es que la magnitud de los errores debe ser determinada previo al experimento y sólo después de una cuidadosa evaluación del costo, desde el punto de vista biológico, humano y de recursos económicos, de ser cometidos.

D.- Interpretación

Si los datos no muestran una significación estadística, por ejemplo en la relación entre dos variables, es incorrecto concluir que no existe asociación. Lo que se indica es que en esa muestra no hay evidencia estadística de asociación, la que eventualmente podría ser detectada en un estudio más sensible (Hartung et al., 1983).

La situación se explica porque en general los métodos estadísticos han sido diseñados intencionadamente para mostrar evidencias de efecto. Desafortunadamente se ha puesto poca atención en los procedimientos que muestran una falta de efecto. Tal vez sea porque ello requiere de muestras más grandes que las necesarias para detectar diferencias o relaciones.

Por otro lado, si se rechaza la hipótesis nula se concluye que existe evidencia estadística de asociación con una probabilidad menor   o  igual al alfa utilizado que ella sea originada por el azar.

Se debe tener presente que, la significancia estadística depende en gran medida del tamaño de muestra elegido. Su incremento como es el caso de muestras grandes, como por ejemplo cuando se usan registros con muchos datos, puede llevar a resultados que son estadísticamente significativos, aún con correlaciones bajas, pero que desde el punto de vista médico o productivo son triviales considerando su magnitud.

Discusión

Se han descrito importantes errores en el diseño y uso de técnicas estadísticas, en un considerable número de escritos (Avram et al., 1985; Gardner et al., 1986; Glantz, 1980; Gore et al., 1977; O'Fallon et al., 1978; Ibarra y Urcelay, 1989).

Como por ejemplo la prueba de 't' para 2 muestras independientes, usada para la comparación de varios grupos. Este error puede inducir a que los investigadores infieran diferencias entre determinados tratamientos, cuando en el hecho, los datos no permiten tal conclusión. En este caso debe realizarse un análisis de varianza y comparaciones múltiples posteriores que garanticen la conservación del nivel de significación original.

El uso impropio de técnicas estadísticas se manifiesta también en la aplicación de ellas, cuando los datos recogidos no lo justifican. La situación se verifica, por ejemplo, cuando se utiliza la prueba de independencia mediante chi cuadrado, para estudiar la relación de una variable cualitativa y una cuantitativa forzando una estratificación. La prueba ha sido concebida para el análisis de variables cualitativas, por lo que se debe recurrir a otra técnica, como una prueba de comparación de medias, si los supuestos de ella se cumplen (Cumsille, 1987).

Se señala también que la afirmación probabilística no es tan exacta cuando se usa chi cuadrado con celdas con menos de 5 observaciones. Un procedimiento alternativo es el uso de la prueba propuesta por Fisher-Irwin para evaluar la probabilidad exacta (Fleiss, 1981).

El uso, en ensayos de muestras pareados, de técnicas para grupos independientes es otra de las situaciones detectadas y que pueden alterar las conclusiones en un experimento.

La pregunta que surge es; ¿por qué están sucediendo estos errores?. Muchas personas cometen estos errores debido a la escasa exigencia sobre los investigadores en cuanto al cuidadoso uso de las técnicas estadísticas. Al respecto, las revistas deben ser extremadamente rigurosas en el control de calidad de los trabajos científicos. Muchas publicaciones reconocen que los árbitros regulares no son competentes para revisar los métodos estadísticos aplicados en los trabajos sometidos a publicación y por ello han modificado su criterio y por lo general consultan a algún experto, quién revisa los manuscritos antes de su publicación.

Sin embargo, existen editores que aparentemente asumen que los árbitros examinan la parte estadística tan cuidado­samente como lo hacen con los contenidos de su especialidad (Altman, 1981).

Entre las soluciones que se proponen, para evitar la reiteración de los errores comentados y otros no analizados, se señala la necesidad que la planificación y diseño de las investigaciones sean especificadas antes de recoger los datos, con el objeto que el experimento sea un proceso sólo para evidenciar la hipótesis de investigación. Como los errores en el diseño no pueden ser corregidos a posteriori del experimento, la ayuda del estadístico debe ser obtenida en el planeamiento del proyecto de investigación, más que en el análisis de los datos.

Al respecto no deben ser aprobados para publicación, trabajos pobremente diseñados o cuyos resultados no son analizados correctamente. De esta manera se presiona a los investigadores a un buen uso de la herramienta o a recurrir a la ayuda del experto si es necesario.

Los editores de revistas científicas deben insistir en que los métodos estadísticos deben ser usados correctamente, enfatizando las implicancias éticas en la realización y publicación de trabajos con deficiencias estadísticas.

Existe evidencia empírica que las políticas de control de las estadísticas en los trabajos mejora efectivamente la calidad. Es por ellos que se ha sugerido incorporar estadísticos en los paneles editoriales (Smith, 1982; Shuster et al., 1976; Rosen y Hoffman, 1978). Se debe crear conciencia también que si un árbitro no puede acceder al análisis ejecutado, debe ser capaz de decírselo al editor. En este sentido se deben ampliar los canales de comunicación entre estadísticos, investigadores y editores.

Muchas revistas entregan instrucciones para los autores, pero pocas mencionan los requisitos estadísticos mínimos. Sería deseable algún grado de acuerdo al respecto de la misma manera como se ha logrado en la forma de las referencias.

Por otra parte, es necesario mejorar la educación en los investigadores en cuanto a estadística aplicada, especialmente en los programas de posgrado de formación de investigación como son los programas de magister, por cuanto constituye parte del conocimiento básico de todo investigador. Es necesario solucionar el problema a la mayor brevedad, lo cual no es fácil, pero es imperativo abordarlo ya que en el futuro el lenguaje estadístico, debido al incremento en métodos estadísticos más sofisticados, puede transformar a la literatura científica en una verdadera Torre de Babel, y más que una herramienta de ayuda a la investigación, se transforme en un verdadero cadalso para ella.

Bibliografía seleccionada

Altman, D. (1980). Statistic and ethics in medical research. Br. Med. J. 281: 1182­-1184.

Altman, D. (1081). Statistics and ethics in medical research. VIII-Improving the quality of statistics in medical journals. Br. Med. J. 282: 44-47.

Avram, M.: Shanks, C.; Dykes, M.; Stiers, W. (1985). Statistical methods in anes­thesia articles: an evaluacion of two american journals during two six-month periods. Anesth Analg. 64: 607-611.

Cochran, W. (1971).Técnicas de muestreo. Compañía EditorialContinental, S.A. México.

Cumsille, J.(1987). Consideraciones a las aplicaciones de algunos métodos estadísticos. Cuad. Med. Soc. XXVIII; 4: 161-166.

Fleiss, J. (1981). Statistical methods for rates and proportions. Wiley. Second Edition. USA.

Gardner, M; Machin, D.; Campbell. M. (1986). Use of check lists in assessing the statistical content of medical studies. Br. Med. J. 292: 810-812.

Glantz, S. (1980). Biostatistics: How to detect, correct and prevent errors in the medical literature. Circulation 61; 1:1-7.

Gore, S.; Jones, I.; Rytter, E. (1977). Misuse of statistical methods; critical assesment of articles in BMJ from Janua­ry to March 1976. Br. Med. J. 1: 85-87.

Hartung, J.; Cottrell, J.; Giffin, J.(1983).Absence of evidence is not evidence of absence.Anesthesiology 58; 3: 298-300.

Hollander, M.; Wolfe, D. (1973). Non­parametric statistical methods.Wiley. New York.

Ibarra, L. (1988). Uso de métodos es­tadísticos en publicaciones científicas: evaluación de las tesis de pregrado de la carrera de Medicina Veterinaria de la Universidad de Chile. Tesis para optar al grado de Magister en Bioestadística. Escuela de Medicina. Universidad de Chi­le.

Ibarra, L.; Urcelay, S. (1989).Informa­ción científica en Ciencias Veterinarias y sus errores en el uso de métodos estadísticos. Arch. Med. Vet. XXI. 2: 95-­101. O'Fallon, J.; Dubey, S.; Salsburg, D.; Edmonson, J; Soffer, A.; Colton, T. (1978).

Should there be statistical guidelines for medical research paper? Biometrics 34; 687-695.

Pasternack, B.; Shore, R. (1982).Sample sizes for individually matched case-con­trol studies. Am. J. Epidemiol. 5: 778-­784.

Rosen, M; Hoffman, B. (1978).Statistics, biomedical, scientist and Circulation Re­search. Circulation Research 42; 6: Edito­rial.

Schefler, W. (1981) Bioestadística.Fondo Educativo Interamericano, USA.

Steel, R.; Torrie, J. (1960). Principales and Procedures of statistics. McGraw Hill. New York.

Shuster, J.; Binion, J.; Moxley, J.; Walrath, N.; Grassmuck, D.; Mahnks, D.; Schmidt, J. (1976).

Stadistical review process: recommended procedures for biomedical research ar­ticles. (Editorial). J. Am. Med. Assoc. 235; 534.

Smith, R. (1982). Steaming up windows and refereeing medical papers.Br. Med. J. 285; 1259-1261.