curva normal

curva normal

domingo, 16 de septiembre de 2007

sábado, 8 de septiembre de 2007

TEMA 4

TEMA 4: Representaciones gráficas. Representación de variables cualitativas y cuantitativas discretas; diagramas de barras, segmentos y puntos. diagrama de sectores. Representación de variables continuas: histogramas y polígono de frecuencia. Representaciones cartesianas. Otras formas de descripción gráfica.

En el tema anterior hemos visto las distintas formas de organización de los datos de una muestra en tablas o distribuciones de frecuencias, de modo que la persona que vea los datos pueda hacerse una idea clara y global acerca de las observaciones obtenidas.
Sin embargo es más fácil captar el significado que éstos puedan tener por medio de las representaciones gráficas adecuadas. La ventaja más importante de las gráficas o diagramas sobre las tablas de datos estriba en el hecho de que llaman la atención de la persona que las lee con mucha más fuerza. Por otra parte su comprensión es más intuitiva. Ambos factores proporcionan en conjunto a las gráficas un mayor valor explicativo que las tablas. El lector, o el propio investigador, pueda hacerse una idea clara y global acerca del significado de las observaciones obtenidas.
Antes de considerar los distintos tipos de diagramas que existen para representar los datos, es importante repasar una serie de instrucciones generales o indicaciones formales que existen para la construcción y presentación de las gráficas.
Puesto que la función de una gráfica es esencialmente explicativa o aclaratoria, la regla fundamental que debe seguirse es la de conocer y utilizar todos los recursos posibles, de manera que la gráfica construida sea lo más simple y, al mismo tiempo, lo más exacta posible; es decir, que se pueda entender con facilidad y que no lleve a errores de interpretación por parte del que la estudia. Por ejemplo:

· El título de la gráfica, que usualmente se coloca en la parte inferior de ésta, debe especificar muy claramente qué es lo que intenta representar, e incluso debe añadir explicaciones complementarias si es necesario.
· El número de la gráfica va delante del título y, generalmente, se utiliza la numeración arábiga.

La forma concreta de las gráficas o diagramas depende, hasta cierto punto, del tipo de variables que se quieran representar, pero en la mayor parte de los casos suele basarse en un sistema de dos ejes de coordenadas, cuya intersección forma un ángulo recto:

· En el eje de las abscisas (eje horizontal) se representan los distintos valores de la variable, mientras que el eje de ordenadas (eje vertical) se utiliza para reseñar las frecuencias de cada clase o categoría de la variable.
No obstante, en toda gráfica debe explicarse con toda exactitud lo que se representa en cada eje, colocando los números correspondientes a sus distintos valores a la izquierda del eje vertical y en la parte inferior, a lo largo del eje horizontal. El eje vertical suele leerse de abajo arriba, mientras que el horizontal se hace de izquierda a derecha. Siempre que sea posible, en el eje vertical debe aparecer el cero de la escala; en caso contrario, debe indicarse mediante una interrupción horizontal en el eje.
La relación entre la altura y la anchura de un gráfico de este tipo debe ser, según diferentes autores, de 2/3, 3/4 ó 4/5; esto es, en resumen, siempre la altura inferior a la anchura.
Este tipo de gráficas es el que se utiliza cuando queremos representar los datos mediante magnitudes lineales. Los pictogramas, diagrama circular y otros tipos de representaciones gráficas similares utilizan áreas o volúmenes; pero esta forma de representación puede llevar al lector a errores dada su poca precisión, a pesar de ser muy empleados en propaganda, divulga­ción, etc., con destino a personas no especializadas.
Vamos a considerar las gráficas que se emplean en la representación de datos de distintos tipos de escalas.


Para las escalas nominales, los diagramas de barras, los circulares y los pictogramas son las gráficas más adecuadas. El diagrama de barras es un conjunto de barras o rectángulos que se alzan sobre el eje de abscisas. La base de los rectángulos es siempre de la misma longitud, y cada uno de ellos representa una clase o categoría de la variable. La altura de la barra está determinada por la frecuencia de observaciones de la categoría representada. Algunos autores opinan que deben existir espacios en blanco entre las barras, puesto que no hay una continuidad en las categorías; otros, en cambio, no dan importancia a tal objeción y representan las barras sin separación de ningún tipo.

El diagrama circular, mas divulgado y popular, consiste en un circulo (a veces, en un semicírculo), cuya área se reparte en partes proporcionales a las frecuencias de las categorías partiendo del centro del circulo. En general, se suele calcular el número de grados del total (360º) que correspon­de a cada clase en función de su frecuencia relativa. El diagrama circular es especialmente recomendable cuando se quiere representar porcentajes y compararlos entre sí.

El pictograma, muy utilizado en la divulgación de datos estadísticos, es un dibujo esquemático, cuyo tamaño indica la frecuencia con que se da la clase o categoría (producción de petróleo en distintos países, número de alumnos matriculados en distintas facultades, etc., estarían representados por medio de dibujos que aludieran con facilidad a estas variables, cuyo tamaño indicara la frecuencia con que se han dado).

Los datos de una escala ordinal suelen representarse por medio de diagramas de barras, donde los rectángulos deben preservar el orden de las clases, al igual que ocurría en las tablas de datos.
También se utilizan los diagramas circulares y los pictogramas en el caso de escalas ordinales, teniendo siempre en cuenta el orden de las categorías.

Las escalas de intervalo utilizan para su representación los diagramas lineales, variante de los diagramas de barras, en los que las barras son sustituidas por líneas que se alzan en cada uno de los puntos del eje de abscisas que representan los distintos valores de la variable, cuando los datos no están agrupados en intervalos. La altura de cada línea, como siempre, está determinada por la frecuencia con que se ha dado ese valor de la variable.
El histograma, otra forma del diagrama de barras, sustituye al diagrama lineal cuando los datos están agrupados en intervalos. La base de cada rectángulo está comprendida entre los limites reales de cada intervalo, mientras que la altura indica la frecuencia correspondiente al intervalo.

Por supuesto, en éste como en el resto de los diagramas que se han tratado hasta ahora las frecuencias pueden considerarse como frecuencias absolutas o como frecuencias relativas. De hecho, es corriente encontrar gráficas en las que las frecuencias se tratan como porcentajes, dado que éstos son de más fácil comprensión.

TEMA 3

TEMA 2

TEMA 2: población y muestra, variable estadística: concepto y tipos de variables. Elección de las variables en estudio: el muestreo. Factores que determinan la representatividad de las muestras. el problema del tamaño de la muestra. Aleatoriedad. Homogeneidad.

Población y muestra, variable estadística: concepto y tipos de variables
Se denomina INDIVIDUO a cada uno de los elementos que integra el colectivo en estudio, a partir de los cuales va a obtenerse la información.
POBLACIÓN, o universo, es el conjunto exhaustivo de todos los elementos que cumplen una o varias condiciones por las cuales queda definido. Puede ser finita, cuando conocemos el número exacto de individuos que la componen o infinita, cuando no se pueden conocer todos los individuos que componen la población.
MUESTRA, es una parte de la población. Se dice que una muestra es representativa cuando presenta todas las características de la población de la cual se extrajo. (hablaremos más de la muestra cuando veamos las técnicas del muestreo)
VARIABLE ESTADISTICA, es cualquier atributo o valor cuantificable que puede adoptar diferentes modalidades en los elementos de un colectivo, comportándose de forma aleatoria, y frente a la cual quiere estudiarse el comportamiento de dicho colectivo.
Las variables se clasifican en:
Cualitativa: son aquellas que no pueden medirse cuantitativamente, es decir, el valor que se les asigna no expresa cantidad. Miden una cualidad (como el sexo, la raza, el color del pelo, la presencia o no de una enfermedad…) dentro de las cualitativas hay un tipo que por su frecuencia es necesario nombrar, son las dicotómicas (sólo tienen dos categorías). Las policotómicas son aquellas que tienen más de dos categorías.
Cuasicuantitativa u ordinal. Están a caballo entre las cualitativas y las cuantitativas, son variables clasificatorias que establecen una ordenación de menor a mayor. Por ejemplo, grados de mejoría de los pacientes:
- Alto.
- Moderado.
- Leve.
Sin que el grado moderado signifique que la mejoría es doble que leve ni alto triple que moderado.
Cuantitativa. Son aquellas que pueden medirse numéricamente, es decir, cuantificarse. En este sentido se dice que las variables cuantitativas pueden tomar valores con significado matemático y que deben acompañarse de unas determinadas unidades de medida. Pueden ser de dos tipos:
· Discreta, cuando entre dos valores consecutivos de la variable no puede haber valores intermedios p. e. el número de hijos que poseen las familias, número de enfermos ingresados….
· Continua. Cuando entre dos valores consecutivos de la variable podemos encontrar infinitos valores p. e. el peso de una persona, la altura, la temperatura corporal, la cifra de glucemia…
Se denomina discretizar o categorizar una variable cuantitativa a convertirla en cualitativa u ordinal. Servirá como ejemplo la tensión arterial diastólica (TAD): se puede tener el valor de TAD en mm Hg con tanta precisión como un determinado aparato sea capaz (entonces es cuantitativa continua), tomar sólo los valores enteros porque no se puede discriminar con tanta finura (entonces es cuantitativa discreta) o categorizarla en:
<90>100 mm Hg hipertenso grave.
Y considerarla entonces una variable ordinal (con más o menos categorías), y, por último, se puede categorizar en normotensos (TAD <> 65 años anciano.
Y entonces la edad se considera una variable ordinal. El adulto joven (categoría 3) no tiene el triple de edad de los niños (categoría 1), sino simplemente más edad que éstos y que los adolescentes, menos que el adulto maduro y menos que el anciano. Por último, se ha realizado estudios en los que se ha observado que la capacidad de aprendizaje disminuye a partir de los 24 años y puede ser interesante dividir a los individuos según este punto de corte, convirtiendo así la edad en una variable dicotómica.
Con las variables cuantitativas el investigador puede decidir el modo de recogerlas y, por tanto, el tipo en la clasificación anterior al que pertenecen. Las variables cualitativas sólo pueden ser cualitativas.
Los índices que definen una muestra se denominan estadísticos. Si los mismos índices se calculan sobres los datos de una población se denominan parámetros.
Elección de las variables en estudio: el muestreo.
En la mayoría de las ocasiones es imposible acceder a todos los elementos de una población, para contrastar en ellos las variables objeto de estudio. En tales casos halaremos de recurrir a la extracción de muestras.
Por regla general, el muestreo es necesario cuando:
· La población tienda a infinito.
· La población sea inaccesible al investigador.
· Se desarrolla un estudio con grupos experimentales y de control.
· Se lleva a cabo un estudio piloto, previo a otro de mayor escala.
· Se precisa una investigación de carácter urgente.
La selección de la muestra es de gran importancia para la fidelidad de los resultados que se obtengan, de tal forma que una muestra mal extraída invalidará absolutamente los datos obtenidos y hará imposible la inferencia de éstos a la población.
Los factores determinantes que influyen en la representatividad de las muestras son:
· Tamaño.
· Aleatoriedad.
· Homogeneidad.


Tamaño:
Dependiendo de la variable que se quiera estudiar, la muestra deberá ser lo suficientemente amplia como para mostrarla con las mismas características que lo hace la población. En función de esto, es preferible escoger muestras amplias, sin que ello haga imposible la realización del muestreo o suponga un coste excepcional.
Para determinar de forma fiable el tamaño es necesario un conocimiento previo del colectivo que va a estudiarse y aplicar el método de estimación, que será explicado más adelante. Se procede a la elección de una primera muestra reducida y en función de los datos que arrojen se deduce el tamaño apropiado a partir del error de estimación que desea admitirse.
Aleatoriedad.
Con ello se obtienen muestras probabilísticas, en las que los elementos son elegidos al azar. Pueden ser:
Muestreo aleatorio simple.
Muestreo aleatorio sistemático.
1- Muestreo aleatorio simple: ha de cumplirse que:
a) Cualquier elemento de la población tenga la misma probabilidad de ser elegido.
b) La selección de un elemento es independiente de la selección de cualquier otro.
Puede hacerse con o sin remplazamiento, es decir, que el mismo elementos pueda o no ser nuevamente elegido.
2- Muestreo aleatorio Sistemático: Resulta de una variante del anterior, en la que es elegido al azar sólo el primer elemento, y el resto lo es a intervalos regulares.
Homogeneidad:
Además de aleatoriedad, hay que procurar que la muestra sea homogénea, es decir, que conserve la misma estructura que la población, manteniendo las mismas proporciones en todos aquellos caracteres que tengan influencia en el experimento que se va a realizar. Para ello hay que proceder al denominado muestreo estratificado.
Por ejemplo: Una población contiene 38% de hombres y 62% de mujeres. Si el sexo es un factor que deba considerarse, la muestra debe mantener esa misma proporción. Una muestra de 50 individuos se compondría de:
- 19 hombres.
- 31 mujeres.
Esta exigencia presupone un conocimiento previo de las características de la población sobre la que se extrae la muestra. En la medida de lo posible habrá que llegar a éste a través de sondeos previos.
ELECCION DE LOS ELEMENTOS DE UNA MUESTRA.
Una vez determinados el tamaño y la composición de la muestra, cualquiera que sea el tipo de muestreo a realizar, hay que proceder a la elección de los elementos de la misma. El procedimiento correcto es confeccionar una lista con todos los integrantes de la población, identificados mediante un código (número, historia clínica, número de la seguridad social, etc.) y se procede a la extracción al azar de los elementos muestrales.
Para aleatorizar el proceso se utilizan tablas de números equiprobables, bombos de sortear, dispositivos informáticos, etc.
En caso de muestreo estratificado se delimita previamente el número de elementos por cada estrato a efectuar y se procede a la elección por el mismo método.
Cuando tras la elección de los elementos integrantes, uno o varios de ellos no pueden ser utilizados por ausencias, falta de datos, etc. Habrá que evaluar si tales faltas afectarán la homogeneidad de la muestra. Si consideramos que sí, estamos obligados a confeccionarla nuevamente, de lo contrario bastará sólo con la elección de los elementos que falten hasta completarla.

TEMA 1

TEMA 1: INTRODUCCIÓN
Definición de estadística, fenómenos causales y casuales: la variabilidad, El método estadístico: estadística descriptiva e inferencial. Necesidad de método estadístico en ciencias de la salud. Modelo de aplicación.

Definición de estadística
La estadística es un método de razonamiento, basado en el modelo matemático, que permite interpretar un tipo de datos muy particular que nos ofrecen, fundamentalmente la ciencia de la vida y cuyo carácter esencial es la “variabilidad”.
Permite la recopilación, clasificación, presentación y análisis de datos extraídos de colectivos, así como la toma de decisiones razonables acerca de ellos, fijando márgenes de error aceptables.
Frente a fenómenos causales, sometidos a factores conocidos y controlables, la estadística es de aplicación en los denominados casuales, cuya naturaleza es multifactorial y por tanto corresponde a causas no controlables y a menudo desconocidas que producen resultados variables que se dicen al azar.
Los fenómenos biológicos están sujetos a variabilidad por el complejo sistema de factores que rigen a los seres vivos. Son por tanto casuales y objeto de estudio de una rama específica de la Estadística, la Bioestadística, que podría definirse como el conjunto de procedimientos estadísticos que tienen como objetivo el estudio cuantitativo de los seres vivos y sus manifestaciones.

El método estadístico
Podemos constituirlo integrado por dos partes:
Estadística descriptiva: Tiene como finalidad describir un colectivo, es decir, observar fenómenos, recoger datos, ordenar esos datos, sintetizarlos y relacionarlos, por tanto se encarga de organizar, sintetizar y presentar los datos. General mente pueden describirse de tres maneras:
· Descripción tabular: Mediante tablas de distribución de frecuencias.
· Descripción gráfica: construcción de esquemas, histogramas, diagramas, etc.
· Descripción aritmética: mediante el cálculo de números: media, mediana, desviación típica, etc.
Estadística inferencial o inductiva: permite la generalización de conclusiones a la población, a partir de estudios de muestras representativas de la misma. Tal generalización ha de admitir márgenes de error, que el propio método es capaz de cuantificar, es decir, permite la estimación de parámetros poblaciona­les a partir de parámetros muestrales (¿cuál es la media de colesterol en la población general?, ¿qué porcen­taje de fumadores hay en la población general?) y el contraste de hipótesis: investigar la verdad o la falsedad de una hipótesis a cerca de luna población.(¿es más alto el colesterol en los hombres que en las mujeres?, ¿fuman más los hombres que las mujeres?).

Necesidad de método estadístico en ciencias de la salud
No se puede concebir hoy día un estudio de carácter experimental de cualquier índole, sobre seres vivos, sin la aplicación de un riguroso tratamiento estadístico que avale las conclusiones extraídas. La importancia de los conocimientos del método estadístico es pues clara no sólo para todo aquel que quiera dedicarse a la investigación, sino para todos los profesionales, ya que la lectura de cualquier trabajo de investigación requiere unos conocimientos básicos de dicho método.
Aprenderemos pues a juzgar el valor de las conclusiones obtenidas por otros investigadores y a presentar a la consideración de los demás, con rigor científico, los trabajos propios.
No hay que confundir la estadística con “las estadísticas”; el método científico con uno de sus productos parciales, precisamente el de menor elaboración, complejidad y novedad de esta reciente disciplina matemática. La Bioestadística va mucho más allá de la simple recopilación y adecuada presentación de datos: enseña y ayuda a investigar en todas las áreas de la vida, en que la variabilidad no es excepción sino regla.
No se concibe que se puedan llevar a cabo investigaciones cuyos resultados no puedan ser expresado en forma numérica; se precisan datos concretos.
Por otra parte no existe personal sanitario alguno que, consciente o inconscientemente, no haga uso constante de la Estadística: frecuencia de situaciones patológicas, grado de seguridad de signos clínicos, probabilidad de éxito ante una intervención quirúrgica, o cualquier proceso terapéutico, pronóstico de una enfermedad, probabilidad de un diagnóstico, elección de uno u otro medicamento en función de la eficacia esperada.
Hoy día se ha llegado al convencimiento de que ya no es posible coleccionar cifras y esperar después a que un estadístico más o menos ajeno al equipo extraiga conclusiones de ellas. El enfoque estadístico, por el contrario, se ha de remontar al planteamiento inicial del experimento. Por omisión o por mal uso del método estadístico, gran número de comunicaciones o publicaciones médicas llegan a conclusiones falsas. Los errores pueden proceder de la toma de datos, de su elaboración o de la deducción de conclusiones.
No se necesita un conocimiento exhaustivo de esta ciencia, tampoco se trata de proporcionar un recetario de fórmulas de aplicación habitual, se pretende mostrar cuál es la originalidad del método; cómo debe intervenir el razonamiento para este enfoque científico; en que se fundamenta la lógica de las pruebas estadísticas de constante aplicación; donde reside la base conceptual clara de cada una de ellas; porqué debe elegir una u otra en cada situación específica; que ofrece a su investigación el método estadístico y cómo debe acudir a él para lograrlo.

Modelo de aplicación del método estadístico.
Para llevar a cabo el método estadístico y que las conclusiones que se extraigan tengan validez es necesario atender a una serie de requisitos que afecten desde el propio diseño del proceso experimental que se desea realizar, hasta la interpretación misma de los resultados.
El modelo a seguir es el siguiente:
1. PLANIFICACIÓN.
· Definición de los objetivos del estudio.
· Determinación de la muestra (característica, tamaño, etc.)
· Homologación de términos a utilizar por el equipo investigador.
· Determinación de las unidades de medida.
· Necesidad o no de elección de un grupo de control.
· Determinación de la fuente de obtención de datos.
· Forma de obtener los datos.
· Tiempo de duración del trabajo y de cada una de las etapas.
2. RECOLECCIÓN DE DATOS.
· Teoría del muestreo. Es importante señalar que de la calidad de la información obtenida dependerá la fiabilidad de la investigación emprendida.
3. ELABORACIÓN DE LOS DATOS.
· Estadística descriptiva. Clasificación, tabulación y representación gráfica, numérica de los mismos.

4. ANÁLISIS E INTERPRETACIÓN.
· Inferencia estadística. Con los datos agrupados, aplicación de las teorías de Estimación, Decisión y Correlación, para obtener la mayor cantidad de información posible.
5. CONCLUSIONES:
· Como consecuencia de las fases precedentes se pueden establecer unas conclusiones definitivas, dando por finalizado el estudio.