PAQUETE ESTADISTICO
SPSS APLICADO A LAS CIENCIAS
SOCIALES.
COMPILADOR. Dr NESTOR JOSE MALAVE MATA.
Dentro de los factores o agentes que conforman la dialéctica educativa universitaria, es importante aclarar la trascendencia de varios correlación de elementos para emprendeer una investigación bajo el enfoque cualitativo o cuantitativo que permita a las ciencias sociales, políticas, antropológicas, sociológicas, económicas, administrativas, contables, entre otras opciones formativa que interaccionan con vectores de diversa naturaleza ligados a al desarrollo de la investigación científica. es importante aclarar que la dinámica educativa en las universidades es diversa y compleja, sin embargo es selección y justificación de un modelo o paradigma teórico y prácticos fundamentado en la clave de aclarar la precisión de un sistema operativo como el spss, por ejemplo o el minitab, para ejecutar procesos, planes, programas o proyectos de investigaciñon de corte universitario.
SPSS es un programa
estadístico informático muy usado en las ciencias sociales y
aplicadas, además de las empresas de investigación de mercado. El nombre
originario correspondía al acrónimo de Statistical Package for the
Social Sciences (SPSS), reflejando la orientación a su mercado original,
aunque este programa es también muy utilizado en otros campos como las ciencias
sociales y la mercadotecnia. Sin embargo, en la actualidad la parte SPSS del
nombre completo del software (IBM SPSS) no es acrónimo de nada.1
Es uno de los
programas estadísticos más conocidos teniendo en cuenta su capacidad para
trabajar con grandes bases de datos y una sencilla interfaz para la mayoría de
los análisis. En la versión 12 de SPSS se podían realizar análisis con dos
millones de registros y 250.000 variables. El programa consiste en un módulo de
base y módulos anexos que se han ido actualizando constantemente con nuevos
procedimientos estadísticos. Cada uno de estos módulos se compra por separado.
Por ejemplo SPSS puede
ser utilizado para evaluar cuestiones educativas.
Actualmente, compite
no sólo con programas licenciados como lo son SAS, MATLAB, Statistica, Stata, sino también con software de código
abierto y libre, de los cuales el más destacado es el Lenguaje R.
Recientemente ha sido desarrollado un paquete libre llamado PSPP, con una interfaz llamada PSPPire que ha sido compilada para diversos
sistemas operativos como Linux,
además de versiones para Windows y macOS. Este último paquete pretende ser un
clon de código abierto que
Fue creado en 1968 por Norman H. Nie, C. Hadlai (Tex)
Hull y Dale H. Bent. Entre 1969 y 1975 la Universidad de Chicagopor medio de su National
Opinion Research Center estuvo a cargo del desarrollo, distribución y
venta del programa. A partir de 1975 corresponde a SPSS Inc.
Originalmente el
programa fue creado para grandes computadores. En 1970 se publica el primer manual de
usuario del SPSS por Nie y Hall. Este manual populariza el programa entre las
instituciones de educación superior en Estados Unidos.
En 1984 sale la
primera versión para computadores personales.
Desde la versión 14,
pero más específicamente desde la versión 15 se ha implantado la posibilidad de
hacer uso de las librerías de objetos del SPSS desde diversos lenguajes de
programación. Aunque principalmente se ha implementado para Python, también
existe la posibilidad de trabajar desde Visual Basic, C++ y otros lenguajes.
Versiones del SPSS
SPSS Inc. desarrolla un módulo básico del paquete estadístico SPSS, del que han
aparecido las siguientes versiones:
·
SPSS 1 - 1968
·
SPSSx release 2 - 1983 (para grandes servidores tipo UNIX)
·
SPSS 5.0 - diciembre 1993
·
SPSS 6.1 - febrero 1995
·
SPSS 7.5 - enero 1997
·
SPSS 8.0 - 1998
·
SPSS 9.0 - marzo 1999
·
SPSS 10.0.5 - diciembre 1999
·
SPSS 10.0.7 - julio 2000
·
SPSS 10.1.4 - enero 2002
·
SPSS 11.0.1 - abril 2002
·
SPSS 11.5.1 - abril 2003
·
SPSS 12.0.1 - julio 2004
·
SPSS 13.0.1 - marzo 2005 (Permite por primera vez trabajar con múltiples
bases de datos al mismo tiempo.)
·
SPSS 14.0.1 - enero 2006
·
SPSS 15.0.1 - noviembre 2006
·
SPSS 16.0.1 - noviembre 2007 (En la lista de usuarios de SPSS "SPSSX
(r) Discussion [SPSSX-L@LISTSERV. UGA. EDU]" varios funcionarios de la
empresa anunciaron previamente la salida de la versión 16 de este software. En
ella se incorporó una interfaz basada en Java que permite realizar algunas mejoras en las
facilidades de uso del sistema.)
·
SPSS 16.0.2 - abril 2008
·
SPSS Statistics 17.0.1 - diciembre 2008 (Incorpora aportes importantes como
el ser multilenguaje, pudiendo cambiar de idioma en las opciones siempre que
queramos. También incluye modificaciones en el editor de sintaxis de forma tal
que resalta las palabras claves y comandos, haciendo sugerencias mientras se
escribe. En este sentido se aproxima a los sistemas IDE que se utilizan en
programación.)
·
SPSS Statistics 17.0.2 - marzo 2009
·
PASW Statistics 17.0.3 - septiembre 2009 (IBM adquiere los derechos y
cambia su denominación de SPSS por PASW 18)
·
PASW Statistics 18.0 - agosto 2009
·
PASW Statistics 18.0.1 - diciembre 2009
·
PASW Statistics 18.0.2 - abril 2010
·
PASW Statistics 18.0.3 - septiembre 2010
·
IBM SPSS Statistics 19.0 - agosto 2010 (Pasa a denominarse IBM SPSS)
·
IBM SPSS Statistics 19.0.1 - diciembre 2010
·
IBM SPSS Statistics 20.0 - agosto 2011
·
IBM SPSS Statistics 20.0.1 - marzo 2012
·
IBM SPSS Statistics 21.0 - agosto 2012
·
IBM SPSS Statistics 22.0 - agosto 2013
·
IBM SPSS Statistics 23.0 - agosto 2014
·
IBM SPSS Statistics 24.0 - junio 2016
El sistema de módulos
de SPSS, como los de otros programas (similar al de algunos lenguajes de
programación) provee toda una serie de capacidades adicionales a las existentes
en el sistema base. Algunos de los módulos disponibles son:
·
Modelos de Regresión
·
Modelos Avanzados
·
Reducción de datos: Permite crear variables sintéticas a
partir de variables colineales por medio del Análisis Factorial.
·
Clasificación: Permite realizar agrupaciones de
observaciones o de variables (cluster analysis) mediante tres algoritmos
distintos.
·
Pruebas no paramétricas: Permite realizar
distintas pruebas estadísticas especializadas en distribuciones no normales.
·
Tablas: Permite al usuario dar un formato
especial a las salidas de los datos para su uso posterior. Existe una cierta
tendencia dentro de los usuarios y de los desarrolladores del software por
dejar de lado el sistema original de TABLES para hacer uso más extensivo de las
llamadas CUSTOM TABLES.
·
Tendencias
·
Categorías: Permite realizar análisis
multivariados de variables normalmente categorías. También se pueden usar
variables métricas siempre que se realice el proceso de recodificación adecuado
de las mismas.
·
Análisis
Conjunto: Permite realizar el análisis de datos recogidos para
este tipo específico de pruebas estadísticas.
·
Mapas: Permite la representación geográfica
de la información contenida en un fichero (descontinuado para SPSS 16).
·
Pruebas Exactas: permite realizar pruebas estadísticas
en muestras pequeñas.
·
Análisis de Valores Perdidos: Regresión simple
basada en imputaciones sobre los valores ausentes.
·
Muestras Complejas: permite trabajar para la creación de
muestras estratificadas, por conglomerados u otros tipos de muestras.
·
SamplePower (cálculo de tamaños muestrales)
·
Árboles de Clasificación: Permite formular
árboles de clasificación y/o decisión con lo cual se puede identificar la
conformación de grupos y predecir la conducta de sus miembros.
·
Validación de Datos: Permite al usuario realizar revisiones
lógicas de la información contenida en un fichero ".sav" y obtener
reportes de los valores considerados atípicos. Es similar al uso de sintaxis o
scripts para realizar revisiones de los ficheros. De la misma forma que estos
mecanismos es posterior a la digitalización de los datos.
·
SPSS Programmability Extension (SPSS 14 en
adelante). Permite utilizar el lenguaje de programación Python para un
mejor control de diversos procesos dentro del programa que hasta ahora eran
realizados principalmente mediante scripts (con el lenguaje SAX Basic). Existe
también la posibilidad de usar las tecnologías .NET de Microsoft para hacer uso de las
librerías del SPSS. Aunque algunos usuarios han cuestionado sobre la necesidad
de incluir otros lenguajes, la empresa no tiene esto entre sus objetivos
inmediatos.
Desde el SPSS/PC hay
una versión adjunta denomina SPSS Student que es un programa
completo de la versión correspondiente pero limitada en su capacidad en cuanto
al número de registros y variables que puede procesar. Esta versión es para
fines de enseñanza del manejo del programa
SPSS tiene un sistema
de ficheros en el cual el principal son los archivos de datos (extensión. SAV).
Aparte de este tipo existen otros dos tipos de uso frecuente:
·
Archivos de salida (output, extensión. SPO): en estos se despliega toda la
información de manipulación de los datos que realizan los usuarios mediante las
ventanas de comandos. Son susceptibles de ser exportados con varios formatos
(originalmente HTML, RTF o TXT, actualmente la versión 15 incorpora la
exportación a PDF junto a los formatos XLS y DOC que ya se encontraban en la
versión 12)
·
Archivos de sintaxis (extensión. SPS): Casi todas las ventanas de SPSS
cuentan con un botón que permite hacer el pegado del proceso que el usuario
desea realizar. Lo anterior genera un archivo de sintaxis donde se van
guardando todas las instrucciones que llevan a cabo los comandos del SPSS. Este
archivo es susceptible de ser modificado por el usuario. Muchos de los primeros
usuarios del SPSS suelen escribir estos archivos en vez de utilizar el sistema
de pegado del programa.
Existe un tercer tipo
de fichero: el fichero de scripts (extensión. SBS). Este fichero es utilizado
por los usuarios más avanzados del software para generar rutinas que permiten
automatizar procesos muy largos y/o complejos. Muchos de estos procesos suelen
no ser parte de las salidas estándar de los comandos del SPSS, aunque parten de
estas salidas. Buena parte de la funcionalidad de los archivos de scripts ha
sido ahora asumida por la inserción del lenguaje de programación Python en las
rutinas de sintaxis del SPSS. Procedimientos que antes solo se podían realizar
mediante scripts ahora se pueden hacer desde la sintaxis mismo.
El programa cuando se
instala trae un determinado número de ejemplos o utilidades de casi todos los
ficheros en cuestión. Estos son usados para ilustrar algunos de los ejemplos de
uso del programa.
Aquí está una pequeña
lista de cosas que se pueden hacer mediante este programa:
1.Introducción de
datos:
Vamos a vista de datos
y se introducen en DISTINTAS columnas (porque son distintas variables) de
arriba abajo
2.Cálculos básicos:
-para hacer
operaciones: ANALIZAR>>estadísticos descriptivos>>frecuencias (para
tablas de frecuencias) ahí llevas la variable que te interese al otro lado y le
das a estadísticos donde marcaremos todo lo que queramos saber (media, moda,
mediana, cuartiles). Nos aparecerá una pantalla nueva con los resultados. Si
necesitamos saber P2,5 o P97,5 habría que hacerlo aquí.
-ANALIZAR>>estadísticos
descriptivos>>explorar: ahí introducimos la variable en el primer campo
(lista de dependientes) y le damos a aceptar. Aquí nos da toda la información
de antes pero ADEMÁS nos da el intervalo de confianza y estimación muestral así
como el error típico de la media ENCIMA nos da las gráficas del diagrama tronco
hojas y el de cajas.
-Para la ASIMETRIA y
la KURTOSIS: En simetría: si es negativo está sesgada a la IZQUIERDA si es 0 es
simétrica y si es positivo está sesgada a la DERECHA. En curtosis: si está
rondando el 0 es mesocurtica, si es negativo platicúrtica y si es positiva
leptocúrtica.
-ANALIZAR>>estadísticos
descriptivos>>frecuencias>>gráficos esto es útil para ver la FORMA
DE LA DISTRIBUCIÓN ya que podemos superponer la curva de la normal. Si la curva
se parece al histograma podemos decir que es simétrica.
-Si por ejemplo
queremos hacer una nube de puntos o un diagrama de dispersión para ver dos
variables cuantitativas, vamos a Gráficos>>cuadro de diálogos
antiguos>>dispersión puntos>>dispersión
simple>>definir>> OJO hay que saber cual es la dependiente y cual
la independiente. En función de será la X (dependiente (Y) e independiente
(X)[la edad por ejemplo sería independiente en la mayoría de los casos])
-Otra cosa que podemos
sacar es el coeficiente de correlación lineal de Pearson
ANALIZAR>>correlaciones>>bivariadas. Ahí nos aparecerá una tabla.
En una diagonal siempre nos saldrá 1 (no hacer caso) en el otro te aparecerá
otro valor, que será el importante.
-El coeficiente de
regresión y el coeficiente de determinación:
ANALIZAR>>regresión>>lineal. De todas las tablas que hay, hay que
fijarse en la que pone RESUMEN DEL MODELO y fijarse en la R2 (coeficiente de
determinación). Para sacar el coeficiente de regresión (b) hay que mirar en una
tabla llama COEFICIENTES. Ahí vemos dos números debajo de la B. La primera se
llama constante (también denominada a) y el segundo es el coeficiente B de
regresión. En resumen hay que coger el SEGUNDO.
-Si queremos
contrastar dos medias: ANALIZAR>> comparar medias>>prueba t para
muestras independientes>>definir grupos.
-Para hacer una
selección de datos de una variable: DATOS>>Seleccionar casos>>Si
satisface la condición>>Pones la variable a la derecha=(lo que quieras
comparar) Ahora ya vamos a ANALIZAR>>explorar.
-ANALIZAR>>Estadístico
descriptivo>>tablas de contingencia>>casillas>>% en
filas>> aceptar
-ANALIZAR>>Estadísticos
descriptivos>>Tablas de contingencia>>Mostrar gráfico de barras
agrupados Y estadísticos>>(el estadístico que se quiera)
-ANALIZAR>>Comparar
medias>>Prueba T para 1 muestra>>(ponemos el valor en valor
de prueba)>>Aceptar `[Miramos en Sig]
-Si queremos cambiar el nombre
a las variables para que sea más cómodo, se puede en VISTA DE VARIABLES
(pestaña derecha) y clickas en el nombre.