Estadística no paramétrica – Visión general, tipos y ejemplos

Qué es la estadística no paramétrica?

La estadística no paramétrica es un método que realiza inferencias estadísticas sin tener en cuenta ninguna distribución subyacente. El método se ajusta a una distribución normal sin ningún tipo de suposición. Habitualmente, el enfoque utiliza datos que suelen ser ordinalesDatos ordinalesEn estadística, los datos ordinales son el tipo de datos en los que los valores siguen un orden natural. Una de las características más notables de los datos ordinales es que, al basarse en clasificaciones y no en números.

La estadística no paramétrica puede contrastarse con la estadística paramétrica. Este último enfoque hace suposiciones explícitas sobre la distribución de los datos observados y estima los parámetros de la distribución utilizando los mismos datos.

Resumen

    Comprender la estadística no paramétrica

    Considere los datos con parámetros desconocidos µ (media) y σ2 (varianza). Mientras que la estadística paramétrica asume que los datos se han extraído de una distribución normalDistribución normalLa distribución normal también se conoce como distribución de Gauss o de Gauss. Este tipo de distribución se utiliza ampliamente en las ciencias naturales y sociales. El, un estadístico no paramétrico no asume que los datos se distribuyen normalmente o son cuantitativos. En este sentido, la estadística no paramétrica estimaría la forma de la propia distribución en lugar de estimar la µ y σ2.

    Por otro lado, la estadística paramétrica emplearía la media y la desviación típica de la muestra para estimar los valores de µ y σ2, respectivamente. La estructura del modelo de la estadística no paramétrica se deduce a partir de los datos observados, en lugar de una especificación a priori. El propio término no paramétrico implica que el número y la naturaleza de los parámetros son flexibles y no que carecen totalmente de parámetros.

    Tipos de estadísticas no paramétricas

    Hay dos tipos principales de métodos estadísticos no paramétricos. El primer método trata de descubrir la distribución subyacente desconocida de los datos observados, mientras que el segundo trata de hacer una inferencia estadística sobre la distribución subyacente.

    Métodos kernel e histogramasHistogramaUn histograma se utiliza para resumir datos discretos o continuos. En otras palabras, un histograma proporciona una interpretación visual de los datos numéricos mostrando el número de puntos de datos que caen dentro de un rango específico de valores (llamado “bins”). Un histograma es similar a un gráfico de barras verticales. Sin embargo, un histograma, se suelen utilizar para estimar los valores de los parámetros en el primer enfoque. Por el contrario, el último método implica la comprobación de hipótesis sin los valores reales de los datos, sino que se basa en la ordenación de los mismos.

    Las pruebas de la estadística no paramétrica suelen ser más fáciles de aplicar que la estadística paramétrica, dada la falta de suposición sobre los parámetros de la población. Los procedimientos matemáticos estándar para la comprobación de hipótesis no hacen ninguna suposición sobre las distribuciones de probabilidad – incluyendo las pruebas t de distribución, las pruebas de signos y las inferencias de una sola población.

    Por ejemplo, al probar la hipótesis de que “hay una diferencia en las medianas,” las dos variables aleatorias, X e Y, definen dos distribuciones continuas entre las que se realiza la hipótesis, y se extraen muestras pareadas. Además de tener una aplicabilidad general, la prueba también carece de la potencia estadística de otras pruebas, dado que funciona bajo unos cuantos supuestos.

    Ejemplos de estadísticas no paramétricas

    Supongamos que un investigador está interesado en estimar el número de bebés nacidos con ictericia en el estado de California. Se puede realizar un análisis del conjunto de datos tomando una muestra de 5.000 bebés. La medida derivada es una estimación de toda la población de bebés con ictericia nacidos al año siguiente.

    Para un segundo caso, considere dos grupos de investigadores diferentes. Les interesa saber si el marketing general o el marketing comercial están asociados a la rapidez con la que una empresa gana posicionamiento de marca. Suponiendo que el tamaño de la muestra se elija de forma aleatoria, su distribución en cuanto a la rapidez con la que una empresa realiza un posicionamiento de marcaPosicionamiento en el mercadoEl posicionamiento en el mercado se refiere a la capacidad de influir en la percepción del consumidor con respecto a una marca o un producto en relación con los competidores. Se puede suponer que el objetivo del mercado es normal. Sin embargo, un experimento que mide la empresa’No se puede suponer que los objetivos estratégicos de la empresa para abordar la dinámica del mercado (que también determina el posicionamiento de la marca) adopten una distribución normal.

    La idea principal del fenómeno es que los datos seleccionados al azar pueden contener factores como la dinámica del mercado. En el otro extremo, si entran en juego factores como el segmento de mercado y la competencia, la empresa’Los objetivos estratégicos de los investigadores no suelen influir en el tamaño de la muestra. Este enfoque es eficaz cuando los datos carecen de una interpretación numérica clara.

    Por ejemplo, las pruebas sobre si los clientes prefieren un determinado producto por su valor nutricional pueden incluir la clasificación de sus parámetros como muy de acuerdo, de acuerdo, indiferente, en desacuerdo y muy en desacuerdo. En este caso, un método no paramétrico resulta muy útil.

    Puntos clave

    El uso de enfoques estadísticos no paramétricos en la investigación exige la debida diligencia sobre sus puntos débiles, sus puntos fuertes y sus posibles escollos. En el caso de una distribución de datos con exceso de curtosis o asimetría, las pruebas no paramétricas basadas en el rango resultan más potentes que las paramétricas.

    Aun así, no en todos los casos, si no se cumplen los supuestos paramétricos, adoptamos la estadística no paramétrica como método sustitutivo debido al grado de confianza comparativamente bajo que se obtiene de la estadística anterior.

    Las estadísticas no paramétricas son apreciadas porque pueden aplicarse con facilidad. Los datos son más aplicables a diversas pruebas, ya que los parámetros no son obligatorios. Lo más importante es que la estadística puede utilizarse en ausencia de información vital, como la media, la desviación estándar o el tamaño de la muestra. Las características hacen que la estadística no paramétrica tenga un ámbito de aplicación más amplio en comparación con la estadística paramétrica.

    Recursos adicionales

    nuestro sitio web es el proveedor oficial de la Inteligencia de Negocios global & Analista de Datos (BIDA)®Conviértase en un Analista de Datos & Analista de datos (BIDA)™De Power BI a SQL & El Aprendizaje Automático, la Certificación de Inteligencia Empresarial (BIDA) de nuestro sitio web, le ayudará a dominar sus superpoderes analíticos. programa de certificación, diseñado para ayudar a cualquier persona a convertirse en un analista financiero de primera clase. Para seguir avanzando en su carrera, los recursos adicionales de nuestro sitio web que aparecen a continuación le serán útiles:

      Deja un comentario