R interaccion con java

134
UNIVERSIDAD AUTÓNOMA DEL ESTADO DE MEXICO CENTRO UNIVERSITARIO UAEM TEXCOCO “INTERACCIÓN DE JAVA CON EL SOFTWARE ESTADÍSTICO R PARA EL CÁLCULO DEL DESEMPLEO EN MÉXICO” T E S I S PARA OBTENER EL TITULO DE INGENIERO EN COMPUTACIÓN PRESENTADA POR: JOANI ROSALES JUÁREZ DIRECTOR DR. en C. OZIEL LUGO ESPINOSA REVISORES DR. en C. ALFONSO ZARCO HIDALGO DR. en E. JOEL AYALA DE LA VEGA M.C en ISC. IRENE AGUILAR JUAREZ 2012

description

estadistica

Transcript of R interaccion con java

UNIVERSIDAD AUTNOMA DEL ESTADO DE MEXICO

CENTRO UNIVERSITARIO UAEM TEXCOCO

INTERACCIN DE JAVA CON EL SOFTWARE ESTADSTICO R PARA EL CLCULO DEL DESEMPLEO EN MXICO

TESISPARA OBTENER EL TITULO DE INGENIERO EN COMPUTACIN PRESENTADA POR: JOANI ROSALES JUREZ

DIRECTOR DR. en C. OZIEL LUGO ESPINOSA

REVISORES DR. en C. ALFONSO ZARCO HIDALGO DR. en E. JOEL AYALA DE LA VEGA M.C en ISC. IRENE AGUILAR JUAREZ

2012

Bien aventurados el hombre que halla la sabidura y obtiene la inteligencia por que su ganancia es mas que la ganancia de la plata sus beneficios mas que el oro fino!!Pr. 3:13

mira que le mando que te esfuerces y seas valiente no temas ni desmayes porque Jehov tu Dios estar contigo en dondequiera que vayasJos. 1:9

Todo lo puedo en cristo que me fortaleceFlp. 4:14

AGRADECIMIENTOS A dios Quien me ha amado desde antes de la fecundacin, quien escucha mis plegarias antes de que mi boca la diga, quien lo ha dado todo hasta a su unignito para el perdn de mis pecados pasados, presentes y futuros, por darme la vida, por permitirme ser una nueva criatura; El que me llevara el sustento da a da, mi salvacin, mi esperanza mi fe.

A mi madre Mara del Carmen Jurez Martnez Quien se ha esforzado cada da por sacarme adelante, por los desvelos, las preocupaciones, quien la que me ha dicho hijo tu puedes en mi noches de angustia, por defenderme de este mundo, por no haberme dado todo lo que pido, pero si lo necesario, por lo que nunca podre pagar ni con los tesoros mas grandes del mundo tus esfuerzos. Gracias madre, por amarme

A mi padre Jorge Rosales Irazaba Quien se ha esforzado cada da por sacarme adelante, el que me dio cada consejo necesario para desarrollarme en la vida y en el trabajo, s que no estuviste presente fsicamente, pero tus llamadas y cada consejo que me diste era valioso para mi y que nunca podre pagar ni con todos los tesoros del mundo. Gracias padre, por amarme, gracias.

A mis hermanos: Abigain y Estephanie y a mi sobrino Emiliano Con los que he pasado gran parte de mi vida y he vivido, las risas, los enojos, las situaciones difciles, los errores pero s que eso nos formara como personas de bien, a mi pequeo sobrino que me ha dado en este tiempo la mayor de las felicidades y la dicha de verlo crecer Gracias hermanos y sobrino por amarme.

A mi abuela Felisa Martnez y a mi ta Patricia Jurez y mi primo Fernando A la que me vio crecer y me cuido cuando mi madre se iba a trabajar y aguanto mis desplantes y viv gran parte de mi vida con ella, a mi ta que siempre me alent a salir adelante y me apoyo en situaciones adversas, a mi primo por ser una persona de bien y una persona alegre Gracias por quererme, gracias A mis abuelos Santiago Rosales Vzquez y Antonia Irazaba A los que me dieron el consejo pleno de que la educacin me abrira el camino a grandes posibilidades, y que mi abuelo donde quiera que este, quiero decirle que lo he logrado gracias por que este consejo, nunca lo olvidare, como nunca te olvidare a ti, gracias. A mi primo Ivn Al que me ayudo en los momentos de angustia y medio su brazo para llorar y aconsejarme en las diferentes situaciones de la vida, de antemano primo gracias por tu ayuda y nimos. A mis primos Luis Enrique y Pilar A los que estuvieron all para ayudarme en los momentos que viv en mi desarrollo acadmico y personal y me dijeron no desesperes, chale ganas de antemano muchas gracias A mi to Ral y mi ta Mara de la Luz A los que me ayudaron en forma material pero sobre todo en forma moral, y darme los consejos necesarios para salir adelante de antemano muchas gracias. Al Dr. Oziel Lugo Espinoza, al Dr. Alfonso Zarco Hidalgo, al Dr. Joel Ayala de la Vega y a la M.C Irene Aguilar Lpez Por ayudarme ala realizacin de esta tesis; Al Dr. Oziel por ensearme que la limitacin es uno mismo, y ha sus grandes enseanzas en programacin, y por ser un gran amigo, al Dr. Alfonso por sus conocimientos en estadstica y por ser un gran amigo quien me escucho en los momentos mas difciles, a la M.C Irene por haber sido mi asesor en la elaboracin de esta tesis, al Dr. Joel por haber sido mi asesor y alentarme a seguir a delante muchas gracias.

A la Dra. Esther Figueroa Hernndez Por haberme proporcionados los datos necesarios para la realizacin de esta tesis y ayudarme en las dudas que tuve sobre diversos temas sobre economa, Muchas gracias Al Ing. Jos Roberto Ramrez Cervantes y a la M.C Leticia Arvalo Cedillo Por ayudarme a realizar mis prcticas y facilitarme los medios para realizarlas a la Maestra Leticia por su conocimientos en ingeniera de software y darme los consejos necesarios para superarme da con da, Muchas gracias. Al Ing. Fernando Robles Gil Por ensearme que los aspectos bsicos, te pueden conducir a que la ingeniera sea mas fcil de entender Muchas gracias. Al M.C. Jair Vzquez Palma y al M.C. Flix Ramrez Cervantes Por brindarme su tiempo y ensearme aspectos fundamentales de la ingeniera y por ser mis amigos y apoyarme en todo momento Muchas gracias. A la escuela Por abrir sus puertas y albergarme durante estos aos para darme una formacin acadmica. A mis compaeros de escuela De la escuela, con los que pase gran parte de mi vida y aprend algo de ellos.

Muchas gracias, lo logramos

Joani Rosales Jurez

CONTENIDOI. INTRODUCCIN .......................................................................................................................... 1 1.1 Introduccin................................................................................................................................. 1 1.2 Justificacin................................................................................................................................. 4 1.3 Planteamiento del problema..................................................................................................... 5 1.4 Objetivos ..................................................................................................................................... 8 1.4.1 Objetivo general .................................................................................................................. 8 1.4.2 Objetivos especficos ......................................................................................................... 8 1.5 Hiptesis...................................................................................................................................... 9 II. ANTECEDENTES ...................................................................................................................... 10 2.1 Antecedentes Generales .................................................................................................... 10 III. MARCO TERICO ................................................................................................................... 13 3.1 Interfaces de usuario ............................................................................................................... 13 3.2 Modelos de proceso de software ........................................................................................... 16 3.3 Metodologa RAD ..................................................................................................................... 16 3.3.1 Fases de RAD ................................................................................................................... 16 3.3.2 Caractersticas de RAD ................................................................................................... 17 3.4 Paquetes estadsticos ............................................................................................................. 19 3.4.1 SAS ..................................................................................................................................... 19 3.4.2 Modo de uso de SAS ....................................................................................................... 21 3.4.3 Inicio de SAS ..................................................................................................................... 22 3.4.4 Utilizacin de comandos en SAS ................................................................................... 23 3.4.5 Libreras de SAS............................................................................................................... 27 3.4.6 Plataformas de SAS ......................................................................................................... 28 3.5 Software estadstico R ............................................................................................................ 29 3.5.1 Que es GNU? ................................................................................................................. 30 3.5.2 Que es software libre? .................................................................................................. 30 3.5.3 Estructura bsica en R .................................................................................................... 30 3.5.4 Utilizacin de comandos en R ........................................................................................ 31 3.5.5Instalacin de libreras en R ............................................................................................ 34 3.5.6 Plataformas de R .............................................................................................................. 36 3.5.7 Interfaces graficas para R ............................................................................................... 37

3.6 Java............................................................................................................................................ 40 3.7 Conceptos econmicos........................................................................................................... 41 3.7.1 Qu es el desempleo? .................................................................................................. 41 3.7.2 Causas del desempleo .................................................................................................... 41 3.7.3 Efectos del desempleo .................................................................................................... 42 3.8 Conceptos de variables econmicas no coloque ideas principales en ........................... 43 3.9 Conceptos estadsticos ........................................................................................................... 44 3.10 Regresin lineal mltiple ...................................................................................................... 44 IV. MTODOS Y PROCEDIMIENTOS ................................................................................ 47 4.1 Fase de planeacin ................................................................................................................. 47 4.2 Fase 2, Taller diseo RAD ................................................................................................. 48 4.2.1 Diagramas de caso de uso ............................................................................................. 52 4.2.2 Diagrama de clases ......................................................................................................... 58 4.2.3 Diagrama de secuencia .................................................................................................. 59 4.3 Diseo de la interfaz de la aplicacin Regresin MED ..................................................... 60 4.4 Requerimientos de regresin MED ...................................................................................... 64 4.4.1 Requisitos de software..................................................................................................... 64 4.4.2 Requisitos de hardware ................................................................................................... 64 4.5 Fase 3 Implementacin .......................................................................................................... 65 V. ANLISIS DE RESULTADOS ............................................................................................... 66 5.1 Comparativa R vs SAS ........................................................................................................... 66 5.2 R como herramienta estadstica ........................................................................................... 70 5.3 Creacin de interfaces de usuario en java .......................................................................... 72 5.4 Facilidad de uso de la aplicacin .......................................................................................... 72 VI. CONCLUSIONES Y RECOMENDACIONES ................................................................ 73 6.1 Conclusiones ............................................................................................................................ 73 6.2 Recomendaciones e investigaciones futuras ..................................................................... 74 ANEXO 1 Diagrama de caso de uso ,diagramas de secuencia,diagrama de clases y flujo de datos .......................................................................................................................................... 75 ANEXO 2 Manual de Usuario de Regresion MED .................................................................... 80 VII. BIBLIOGRAFA ........................................................................................................... 120

Figura 1. Tasa de desempleo de los miembros de la OCDE .................................................... 1 Figura 2. Tasa de desempleo en Mxico en diversos aos ...................................................... 2 Figura 3. Consola de SAS ejecutando un programa y salida de datos .................................. 5 Figura 4. Consola de R Project ...................................................................................................... 6 Figura 5. Flujo de datos de la propuesta de investigacin......................................................... 7 Figura 6. Componentes del marco terico ................................................................................. 13 Figura 7. Ventanas principales del Software estadstico SAS ................................................ 22 Figura 8. Ecuacin de Modelo de regresin lineal mltiple para el clculo del desempleo en Mxico......................................................................................................................................... 23 Figura 9. Logotipo de R ................................................................................................................. 29 Figura 10. Interface de R............................................................................................................... 31 Figura 11. Instalacin de paquetes en R .................................................................................... 35 Figura 12. Imagen de interfaz R-studio ....................................................................................... 38 Figura 13. Interfaz grafica RKward .............................................................................................. 38 Figura 14. Interfaz Grafica Tinn-R ............................................................................................... 39 Figura 15. Logotipo de Java ......................................................................................................... 40 Figura 16.Diseo prototipos preliminares de las ventanas de la aplicacin ......................... 49 Figura 17. Diagrama sobre interconexin de Java con R ........................................................ 51 Figura 18. Casos de uso de la aplicacin en general ............................................................... 52 Figura 19. Casos de uso del comportamiento de la aplicacin............................................... 55 Figura 20. Diagrama de clases de la aplicacin ........................................................................ 58 Figura 21.Diagrama de secuencia de la aplicacin .................................................................. 59 Figura 22. Pantalla de presentacin de la aplicacin ............................................................... 60 Figura 23. Pantalla de opciones de la aplicacin ...................................................................... 61 Figura 24. Botn Cargar de la aplicacin ................................................................................... 61 Figura 25. Ventana de bsqueda de archivos de la aplicacin............................................... 62 Figura 26. Ventanas de mensaje que proporciona la aplicacin ............................................ 62 Figura 27. Imagen del Botn Mostrar de la aplicacin ............................................................. 63 Figura 28. Diagrama de flujo de datos de la aplicacin ........................................................... 65

Cuadro 1. Principios de diseo de las interfaces de usuario................................................... 15 Cuadro 2. Ejemplo de Regresin Lineal en SAS....................................................................... 24 Cuadro 3. Plataformas en las que se puede ejecutar SAS ..................................................... 28 Cuadro 4. Ejemplo de un vector en R con clculos estadsticos bsicos ............................. 31 Cuadro 5. Ejemplo de programa a de regresin lineal en R ................................................... 34 Cuadro 6. Libreras importantes de R ......................................................................................... 35 Cuadro 7. Plataformas en las que se ejecuta R ........................................................................ 36 Cuadro 8. Tabla de anlisis de varianza R vs SAS .................................................................. 67 Cuadro 9. Continuacin de tabla de anlisis de varianza ........................................................ 67 Cuadro 10. Regresin lineal de R vs SAS.................................................................................. 68 Cuadro 11.Variable Durbin-Watson R vs SAS........................................................................... 69

RESUMEN En el presente trabajo se muestra la integracin de tres ramas de la ciencia, economa, estadstica y cmputo para generar una herramienta de software que facilita el clculo y estadsticas del ndice de desempleo en Mxico. La falta de empleo ha sido, por muchos aos, el problema social ms grave de Mxico. Entre los principales efectos nocivos que provoca el desempleo a la sociedad son la emigracin, suicidio, reduccin del consumo, concentracin del ingreso, pobreza, economa informal y delincuencia. Para tener una estimacin sobre el valor del desempleo en Mxico, se tom el desarrollo de un modelo de regresin lineal con la interaccin de variables econmicas que intervienen en el fenmeno del desempleo, el uso del modelo conlleva el uso de software estadstico y el aprendizaje de comandos para su correcto clculo. Como resultado de la investigacin se realiz la integracin de R con la plataforma Java; R para el calculo estadistico del modelo econmico y Java para la generacion de interfaces de usuario de tal manera que se elimina la pronunciada curva de aprendizaje de software estadistico, disminucin de costos en el uso de licencias de software y una reduccin en el tiempo de procesamiento para generar resultado

I INTRODUCCIN 1.1 Introduccin La tecnologa de la computacin ha modificado de manera importante la forma de trabajar en las instituciones, sean de gobierno o entornos educativos, ya que sin el uso de esta tecnologa, tomara ms tiempo elaborar tareas, clculos, tramites y actividades planeadas en instituciones publicas y privadas. En la actualidad mltiples problemas acechan al mundo entero, sin embargo hay algunos que afectan directamente el desarrollo social; el desempleo es uno de ellos, y por desgracia, est en incremento ao con ao no solo en nuestro pas, sino en el mundo entero debido a la inestabilidad financiera y programas ineficaces gubernamentales, Durante el ao 2010 la Organizacin para la Cooperacin del Desarrollo Econmico (OCDE) public resultados desalentadores sobre el desempleo en sus pases miembros, entre ellos Mxico, el cual ocupo el sptimo lugar con menor ndice de desempleo teniendo un ndice de 5.4%, Corea se ha colocado como el pas con la menor tasa de personas no laborables alcanzando un 3.7%, seguido de Holanda con 4.5%; en el centro del campo se encuentra Chile con 8.2% por ciento. La Figura 1 que se presenta a continuacin, muestra una grfica con los porcentajes de desempleo en pases pertenecientes a la OCDE.

Desempleo en %25 20 15 10 5 0 Porcentaje

Pais

Figura 1. Tasa de desempleo de los miembros de la OCDE

1

De acuerdo a los datos recolectados, el mayor porcentaje de desempleados se encuentran en Espaa con 20.1%, seguido de la Repblica Eslovaca con 13.5%. Entre estos porcentajes se encuentra un sector poblacional que representa el futuro productivo mundial; la juventud, que para el ao 2010 ha alcanzado los 81 millones de desempleados en una edad entre 15 y 24 aos, considerada econmicamente actual segn el informe Tendencias Mundiales del Empleo Juvenil 2010 (TMEJ). Los jvenes representa en la mayora de las ocasiones, una mano de obra abaratada resultado del excedente de trabajadores y salarios mnimos que llevan a limitar los consumos cotidianos como: alimentos, salud y educacin. Sin los consumidores suficientes para mantener una industria, las personas se ven en la necesidad de trasladarse al extranjero acarreando consigo un mayor nmero de desempleados en su pas de origen. Este ciclo concluye con la bsqueda de una mejor vida en otras partes del mundo. Para el ao 2010, 91.5 millones de personas migraron a pases desarrollados segn la OCDE, y lo realmente preocupante es que el nmero de mexicanos migrantes aumenta cada vez ms con el tiempo. La Figura 2, presenta de manera grfica el desempleo en Mxico en el periodo 2000-2010.

Millones de habitantes

Tasa de Desempleo (%)5.5 4 3.2 5.6

6 5 4 3 2 1 0

3.3 2.5

3.2

3.6

2000 2.5

2004 3.3

2005 3.2

2006 3.6

2007 3.2

2008 4

2009 5.5

2010 5.6

Mexico

Figura 2. Tasa de desempleo en Mxico en diversos aos

2

Nuestro pas cuenta con cerca de 107 millones de habitantes, el nmero de desempleo creci a 2.75 millones de personas (OCDE) esto en el 2010, y el aumento del fenmeno se debio a la gran cantidad de jvenes que han abandonado el mercado laboral tras haber perdido toda esperanza de trabajar y lograr una vida decente [OIT 2010]. Datos del INEGI arrojaron que en el primer mes del 2010 la tasa promedio del desempleo en las 32 entidades del pas fue de 7.1%. Cada uno de estos datos han llevado a una gran preocupacin y generacin de nuevos proyectos para comprender este desafortunado incremento de habitantes inactivos econmicamente. A partir de este problema se cre un modelo lineal en el cual intervienen diversas variables para el clculo del desempleo entre las que se encuentran: tasa del desempleo, producto interno bruto, tasa de inflacin, salario mnimo, tasa de inters, tipo de cambio de pesos a dlar, importaciones y exportaciones [Figueroa,2010]. El modelo lineal se captur con el software estadstico SAS que sirvi para calcular valores del modelo matemtico, sin embargo, su uso se lleva a cabo a travs de comandos de consola por lo que se requiere del conocimiento y experiencia necesaria para su correcto funcionamiento. En este trabajo de investigacin se pretende realizar un programa de software con una interfaz agradable y fcil de usar para el usuario creada con la plataforma de desarrollo de Java, que se interconecte con el software estadstico R; con Java se crearn las pantallas y programas necesarios para reducir la complejidad del uso del programa y R, se encargar de la ejecucin de los clculos estadsticos. Tanto Java como R pertenecen al rubro de software libre. Con esto se pretende liberar al usuario de la carga que representa el aprendizaje del uso de software estadistico como SAS o R y obtener un anlisis con presionar un solo botn. Ahora el usuario podr enfocarse a recopilar sus datos y obtener el resultado de los clculos de manera automtica. Esto representa un ahorro de recursos de tiempo, dinero y esfuerzo.

3

1.2 Justificacin El desarrollo de una aplicacin de software que sea capaz de realizar el clculo del desempleo en Mxico en forma inmediata, evita la necesidad del usuario para aprender el uso de comandos en programas estadsticos. La sintaxis que manejan este tipo de programas es estricta y carecen de flexibilidad en su gramtica, es decir, se necesita tener el comando y parametros precisos para obtener el resultado correcto. El beneficio de esta aplicacin abarca a los estudiantes, profesores y personas afines a las ciencias econmicas para la obtencin del indicador del desempleo en Mxico para un ao o conjunto de aos determinados. El programa dearrollar, con una interfaz agradable para el usuario, y esto permitir a la persona ingresar sus datos con slo indicar dnde se encuentra su archivo con la informacin requerida para el calculo el modelo del desempleo y obtendr de manera automtica el resultado de manera grfica y numrica. Esto representa un ahorro directo en tiempo. El uso de software libre libera al usuario de tener que invertir dinero para el costo de licencias de los programas y de esta manera ahorrar recursos que en ocasiones son necesarios y vitales para la continuacin de la propia investigacin.

4

1.3 Planteamiento del problema Para calcular el modelo de desempleo en Mxico, se recurre a sistemas estadsticos cuyas licencias de uso tienen costos elevados adems de que el uso del programa requiere de experiencia avanzada para un correcto funcionamiento El software SAS es un programa de mdulos que trabajan conjuntamente o lo que es lo mismo un sistema de software estadstico, orientado fundamentalmente al anlisis estadstico. Con este software estadstico se pueden realizar tareas como grabacin y recuperacin de datos, clculo de estadsticas, realizacin de grficos, anlisis estadstico, planificacin y prediccin, control de calidad, investigacin operativa, econometra, anlisis financiero, anlisis de series temporales, anlisis epidemiolgico. El uso de SAS se realiza a travs de comandos de consola por lo que se requiere del conocimiento y experiencia necesaria para su correcto funcionamiento. La Figura 3 ilustra una pantalla clsica del programa donde se muestran una serie de comandos necesarios para obtener los resultados que se requieren.

Figura 3. Consola de SAS ejecutando un programa y salida de datos

5

El software R tiene la robustez de clculos comparables con SAS y en el rubro del costo de licencias, R es software libre y por lo tanto su uso es gratuito, R es un lenguaje y entorno de programacin para anlisis estadstico y grfico. Se trata de un proyecto de software libre resultado de la implementacin GNU del premiado lenguaje S. R y S-plus versin comercial. Son probablemente, los dos lenguajes ms utilizados en investigacin biomdica, la bioinformtica y las matemticas financieras. R proporciona un amplio abanico de herramientas estadsticas (modelos lineales y no lineales, test estadsticos, anlisis de series temporales, algoritmos y agrupamiento y grficas La Figura 4 muestra la interfaz grfica de R, similar a SAS en cuanto al uso de comandos para la obtencin de resultados. A pesar de la robustez de R para el clculo estadstico, aun se requiere del conocimiento y experiencia del programa para obtener los datos requeridos.

Figura 4. Consola de R Project

6

En este trabajo se propone la realizacin de una aplicacin realizada con java para generar una interfaz de usuario amigable y fcil de usar y se pretende llevar a cabo la conexin del software estadstico R para la introduccin y ejecucin del modelo lineal del problema, el clculo del desempleo. La Figura 5 muestra el flujo de datos y resumen de la propuesta:

Iniciar

datos para analizar

Entrada

Pantalla de usuario.Tecnologa JAVA

Proceso estadstico (R)

Resultado

FIN

Figura 5. Flujo de datos de la propuesta de investigacin

7

1.4 OBJETIVOS 1.4.1 Objetivo general Desarrollar una aplicacin de software para el clculo del desempleo en Mxico mediante la interaccin de Java y el software estadstico R utilizando un modelo de regresin lineal. 1.4.2 Objetivos especficos Desarrollar un entorno grafico para el clculo del desempleo en Mxico Implementar la interaccin de Java y R para procesar el modelo de regresin lineal Implementar el modelo matemtico de regresin lineal en R Comparar resultados con SAS para validar el modelo en R Generar grficas de resultados sobre el desempleo en Mxico en aos anteriores para proporcionar al usuario anlisis extras de los resultados, este tipo de grficas tambin se pueden generar en SAS pero de manera rudimentaria.

8

1.5 Hiptesis Es posible la integracin de tecnologas como Java y R para generar un sistema de software para el clculo del desempleo en Mxico con base en un modelo de regresin permitiendo el anlisis instantneo de la informacin y generar un ahorro de recursos de tiempo, dinero, esfuerzo y disminucin de errores al omitir el uso de software estadstico por parte del usuario.

9

II. ANTECEDENTES 2.1 Antecedentes Generales A lo largo de este siglo el mundo est experimentando una revolucin total, las ciencias, el arte y la tecnologa han tenido que establecer lazos de comunicacin para enfrentarse a los increbles cambios y trabajar como una sola unidad de estudio; los hombres y mujeres dedicados a estos tres rubros, estn requiriendo un conocimiento ms amplio que les permita adecuarse a dicho movimiento transformador. Tal es as que la informtica ha desarrollado software de apoyo para diversas reas como: la medicina, economa y robtica, las cuales son de suma importancia para el rea ingenieril, en cuanto al desarrollo de aplicaciones, por ejemplo; si tomamos en cuenta un entorno econmico, se describen diversos estudios en los cuales se pueden aplicar anlisis estadsticos, y modelos economtricos que nos den un resultado favorable el cual nos ayude a interpretar una situacin real de un aspecto imaginario. Si hablamos de un entorno de programacin para anlisis estadsticos, pudiramos describir diversos lenguajes como Matlab, SAS, R, Eviews, SPSS, que cumplen con caractersticas del investigador para el diseo de un modelado que contenga opciones estadsticas y econmicas, lo cual es llamado modelo economtrico. Un modelo economtrico es aquel que desea explicar un fenmeno, empleando aspectos matemticos y estadsticos para su solucin [Zorrilla, 2010]. Existen aplicaciones muy limitadas que nos ayudan a procesar datos utilizando un lenguaje de programacin por completo pero, sin la ayuda de un programa estadstico, los lenguajes estadsticos son los que permiten ver los resultados con detalle y el investigador tiene que interpretar los resultados, con la limtate de que el investigador tendra que aprender el lenguaje, lo cual le llevara tiempo en aprenderlo y un coste para poder usar el programa. Si deseamos realizar una aplicacin de software con una interfaz fcil de usar, tenemos que aprender ciertos comandos o instrucciones que nos ayuden a construir dichas pantallas de usuario, pero siempre se debe tener en mente que el diseo de una interfaz debe ser eficaz y ayudar al usuario a comprender el uso y la manipulacin del sistema por medio de sus componentes [Somerville, 2010].

10

Algunos ejemplos de lenguajes utilizados para procesar datos estadsticos son: SAS, un lenguaje aplicado para procesamiento de datos, con funciones tiles de las cuales la mayora se obtienen por cdigo, pero teniendo en cuenta que es un software con un coste elevado y no se puede tener un acceso fcil a este lenguaje. Por otro lado tenemos un lenguaje llamado R que por la caracterstica de software libre, se puede transportar e instalar en diversas computadoras y no se paga licencia por el uso. R es un lenguaje programacin, pero tambin se entiende como un potente software de anlisis estadsticos o incluso como un generador de grficos. Cualquiera de las tres aceptaciones es compatible con una definicin de R, pero si se quieren realizar interfaces se tiene que aprender diversas libreras para el desarrollo de las mismas. De igual modo el SPSS es un conjunto de potentes herramientas de tratamiento de datos y anlisis estadsticos. Al igual del resto de las aplicaciones que utilizan un soporte para Windows, el SPSS funciona con mens desplegables y cuadros de dilogos que permiten hacer la mayor parte del trabajo simplemente utilizando el puntero del ratn, un aspecto importante es que el SPSS es mas accesible que el entorno SAS a nivel costo y manejabilidad del programa. Siguiendo con esta descripcin, otro programa para anlisis de datos es Eviews el cual esta ms orientado al anlisis economtrico, las reas donde Eviews puede ser til son: anlisis y evaluacin de datos, prediccin macroeconmica, simulacin y prediccin al igual que SPSS su manejabilidad se puede hacer con solo el puntero del mouse. Matlab es un software de alto nivel y un entorno interactivo para el desarrollo de algoritmos, visualizacin de datos y clculo numrico, una ventaja de este programa es la eficacia de sus instrucciones para el anlisis estadstico y su creacin de interfaces graficas la cual ayuda a una presentacin y manipulacin de los datos. La gama de software de anlisis de datos es variada, pero el manejo de cada uno de estos programas requieren de tiempo para aprender a usarlo. Es por ello que, el desarrollo de aplicaciones para el mbito de anlisis de datos en un entorno estadstico requiere un conocimiento sobre un sistema estadstico, pero si a eso le agregamos el conocimiento de un lenguaje de programacin, podramos crear una interfaz personalizada, que nos ayude y nos simplifique el problema a solo unos clics de distancia.

11

El desarrollo de aplicaciones de un mbito o ciencia en especfico, podran recortar tiempo, costo y as obtener datos para su anlisis e interpretacin segn el investigador.

12

III. MARCO TERICO

A continuacin se describen los conceptos necesarios para comprender el desarrollo de esta investigacin, la Figura 6 muestra un resumen del contenido del marco terico, as tambin como su justificacin:

Figura 6. Componentes del marco terico 3.1 Interfaces de usuario El diseo de las interfaces de usuario es un campo amplio en la ingeniera del software, el diseo de la interfaces de usuario se puede definir como la arquitectura de la pantalla del sistema, no confundir con la interfaz (conexin) de un programa con otro programa. El diseo de la interfaz de usuario requiere ciertos puntos para su desarrollo segn diversos autores. Es posible afirmar que la interfaz de usuario es el elemento mas importante de un sistema de computo, si se disea mal la interfaz corremos el riesgo de que la capacidad del usurario se vea muy reducida para aprovechar las ventajas de una aplicacin, lo cual puede convertirse en una aplicacin dbil. Los tres principios fundamentales guan el diseo de una interfaz de usuario efectiva [Pressman, 2010]. 1. Dar el control al usuario 2. Reducir la carga de memoria al usuario 3. Lograr que la interfaz sea consistente13

Para crear una interfaz se requiere de un diseo organizado, por lo cual se comienza con una serie de tareas de anlisis, la cual habla de la identificacin del usuario, la cual define los perfiles de los usuarios finales y aplica informacin recopilada. El anlisis de tareas, define tareas y acciones del usuario empleando un enfoque elaborativo u orientado a objetos, aplicando casos de uso, elaboracin de tareas, objetos, anlisis de flujo de trabajo y representaciones jerrquicas para Ya una vez identificadas las tareas, se crean y analizan los escenarios para definir un conjunto de objetos y acciones de la interfaz, lo cual proporciona una base para la creacin de un formato de pantalla, ubicacin de iconos, descripcin de textos y asignacin de textos. Mientras se refina el modelo del diseo, debe tomarse en cuenta los tiempos de respuesta, estructura de comandos y acciones, manejo de errores y funciones de ayuda. La diversas caractersticas de la interfaces de usuario hablan de su diseo, pero tambin de como se debe realizar en un entorno de anlisis y requerimientos del usuario en un entorno detallado, segn Ian Somerville [Somerville, 2010]. Dice que el diseo de la interfaz de usuario debe de ser cuidadoso ya que es la parte fundamental del diseo del sistema, por lo cual es necesario ajustarla a las habilidades, experiencia y expectativa de los usuarios previstos. Cuando se disean interfaces de usuario, deben tenerse en cuenta capacidades fsicas y mentales del diseo de interfaces de usuario ya que tenemos que tener en cuenta que personas utilizaran el software. Por lo cual se siguen aspectos generales para el diseo de interfaces lo cual son el principio fundamental del diseo de interfaces de usuario, En el cuadro 1 se representan aspectos fundamentales de interfaces de usuario segn Sommerville

14

Principio Familiaridad con el usuario Uniformidad

Descripcin

la interfaz debe utilizar trminos y conceptos obtenidos de la experiencia de las personas que mas utilizan el sistema Siempre que sea posible , la interfaz debe de ser uniforme en el sentido de las operaciones comparables se activen de la misma forma Mnima sorpresa El comportamiento del sistema no debe provocar sorpresas a los usuarios Recuperabilidad La interfaz debe de incluir mecanismo para permitir a los usuarios recuperarse de los errores Gua de usuario Cuando ocurran errores , la interfaz debe de proporcionar retroalimentacin significativa y caractersticas de ayuda sensible al contexto Diversidad de La interfaz debe usuarios Proporcionar caractersticas de interaccin apropiadas para los diferentes tipos de usuarios Cuadro 1. Principios de diseo de las interfaces de usuario Se pueden observar diferencias por parte de los autores para generar un diseo de una interfaces de usuario, sin embargo, la parte fundamental para cada autor, es el usuario con el cual se va a interactuar y con ese fin se disea la interfaz del sistema.

15

3.2 Modelos de proceso de software Un modelo de proceso de software es una representacin abstracta de un proceso de software. Cada modelo de proceso representa un proceso desde una perspectiva particular, y as proporciona informacin parcial sobre ese proceso. Estos modelos generales no son descripciones definitivas del proceso del software. Mas bien son abstracciones del los procesos que se pueden utilizar para explicar diferentes enfoques para el desarrollo del software. A su vez estos modelos generales nos son descripciones definitivas de proceso de software. Mas bien son abstracciones de los procesos que se pueden utilizar para explicar diferentes enfoques para el desarrollo de software. Puede pensarse en ellos como marcos de trabajo del proceso que pueden ser extendidos y adaptados para crear procesos ms especficos de ingeniera del software [Somerville,2010]. Ejemplo de estos procesos son: Modelo en cascada Desarrollo evolutivo Desarrollo en espiral

3.3 Metodologa RAD El desarrollo rpido de aplicaciones (RAD) es un enfoque orientado a objetos para el desarrollo de sistemas que incluye un mtodo de desarrollo as como tambin herramientas de software Algunos desarrolladores estn considerando a RAD como un enfoque til para los nuevo entornos de comercio electrnico basados en la web, en la cual podra ser importante el estatus de primero en tomar una iniciativa de negocios .En otras palabras, para poner una aplicacin en la web antes de que sus competidores, las empresas podran requerir que su equipo de desarrollo experimente con RAD 3.3.1 Fases de RAD Hay tres fases amplias del RAD que vinculan a usuarios y analistas en la evaluacin y diseo e implementacin. Observe que RAD involucra a los usuarios en cada parte del esfuerzo de desarrollo, con una intensa participacin en la parte de negocios del diseo.

16

Fase planeacin de requerimientos: en esta fase, usuarios y analistas se renen para identificar los objetivos de la aplicacin o sistema y para identificar los requerimientos de informacin que surge de dichos objetivos. La orientacin en esta fase tiene el objetivo de resolver los problemas de negocios .Aunque algunas de las soluciones propuestas podran surgir de la tecnologa de la informacin disponible, el enfoque siempre ser alcanzar los objetivos del negocio. Taller de diseo RAD: el proceso de disear y refinar los prototipos se pueden representar mejor con un taller .Cuando imagina un taller sabe que la participacin es intensa, no pasiva y que generalmente se hace con las manos. Durante el taller de diseo RAD, responden a los prototipos operativos reales y los analistas refinan los mdulos diseados, basados en las respuestas del usuario. El formato de taller es muy emocionante y estimulante, y estn presentes los usuarios y los analistas experimentados, no hay ninguna duda que que este esfuerzo creativos puede impulsar el desarrollo a gran velocidad. Fase implementacin: se puede ver que los analistas estn trabajando intensamente con los usuarios durante el taller para disear los aspectos del negocio o no tcnicos del sistema. Tan pronto sean convencidos estos aspectos y los sistemas sean construidos y se refinen, los nuevos sistemas, o parte de ellos , son probados e introducidos en la organizacin. Debido a que el rad se puede usar para crear las nuevas aplicaciones de comercio electrnico para las cuales no hay un sistema viejo, por lo general no necesita ejecutar los sistemas viejos y nuevos en paralelo antes de la implementacin. En este punto, el taller de diseo RAD habr generado inters, sentido de perteneca del usuario y la aceptacin de la nueva aplicacin. 3.3.2 Caractersticas de RAD Equipos Hbridos Herramientas Especializadas "Timeboxing" Prototipos Iterativos y Evolucionarios.

Equipos hbridos

Equipos compuestos por alrededor de seis personas, incluyendo desarrolladores y usuarios de tiempo completo del sistema as como aquellas personas involucradas con los requisitos. Los desarrolladores de RAD deben diseadores y programadores en uno17

ser

"renacentistas":

analistas,

Herramientas especializadas

Desarrollo "visual" Creacin de prototipos falsos (simulacin pura) Creacin de prototipos funcionales Mltiples lenguajes Calendario grupal Herramientas colaborativas y de trabajo en equipo Componentes reusables Interfaces estndares (API)

Timeboxing Las funciones secundarias son eliminadas como sea necesario para cumplir con el calendario.

Prototipos iterativos y evolucionarios

Reunion JAD (Joint Application Development): Se renen los usuarios finales y los desarrolladores. Lluvia de ideas para obtener un borrador inicial de los requisitos. Iterar hasta acabar: Los desarrolladores construyen y depuran el prototipo basado en los requisitos actuales. Los diseadores revisan el prototipo. Los clientes prueban el prototipo, depuran los requisitos. Los clientes y desarrolladores se renen para revisar juntos el producto, refinar los requisitos y generar solicitudes de cambios. Los cambios para los que no hay tiempo no se realizan. Los requisitos secundarios se eliminan si es necesario para cumplir el calendario.

18

3.4 Paquetes estadsticos Si hablamos de programas en un mbito muy particular podremos decir que existen diversos lenguajes los cuales se encargan de hacer diversas tareas como programacin, diseo, clculos matemticos, diseo web, anlisis estadsticos. En este ultimo punto tomaremos encueta programas de anlisis estadsticos, la cual le daremos nfasis ya que existen diversos softwares que nos ayuda a este tipo de clculos ejemplo de ellos es R y SAS lo cual son lenguajes de anlisis estadsticos de gran uso en la comunidad de investigacin y docencia, en esta parte haremos un resumen con los detalles mas importantes de cada uno de los programas estadsticos. 3.4.1 SAS El sistema SAS es un conjunto de programas de ordenador agrupados en mdulos que trabajan conjuntamente o lo que es lo mismo, un sistema de software [Coma,2011]. SAS est orientado fundamentalmente al anlisis estadstico. Con el sistema SAS es posible tambin: Grabacin y recuperacin de datos. Modificacin de datos. Clculo de estadsticos. Realizacin de grficos. Anlisis estadstico. Planificacin y prediccin. Control de calidad. Investigacin operativa. Econometra. Anlisis financiero. Anlisis de series temporales. Anlisis epidemiolgico.

19

Tambin se puede realizar tareas de desarrollo de aplicaciones en diferentes campos como: Ciencias fsicas Ciencias sociales Ciencias econmicas Ciencias biolgicas Ciencias mdicas Con el Sistema SAS se pueden realizar todas las tareas descritas, es una herramienta que permite a los profesionales de distintos campos, conocedores de los temas de estudio o investigacin, llevar a cabo las operaciones necesarias en su computadora. Los procedimientos del sistema SAS no generan interpretaciones de los resultados. La interpretacin de los resultados corresponde al investigador. SAS es un instrumento para contrastar las hiptesis de partida. El Sistema SAS es un producto que permite informatizar distintas tareas a profesionales sean o no informticos. El conocimiento de las disciplinas a las que se aplica SAS, debe existir previamente y ser lo que permita disear la aplicacin e interpretar los resultados obtenidos. SAS es por tanto una herramienta informtica de usuario final siendo ste el que deba realizar los posibles desarrollos, contando con el soporte tcnico adecuado.

20

3.4.2 Modo de uso de SAS El paquete SAS comprende un conjunto de programas de computadora tiles en el anlisis estadstico de datos. Con el paquete SAS se pueden realizar diferentes tipos de trabajos como: Almacenar y recuperar informacin, modificar la informacin existente, manejo de archivos obtener diferentes tipos de estadsticas de los datos y anlisis complejos de los mismos. El paquete SAS trabaja con grupos de datos, los cuales para poder ser manipulados deben de estar en un archivo tipo SAS. Un archivo SAS se compone de: Datos, Variables y Observaciones: Datos Un dato es la unidad bsica de informacin de un trabajo SAS. Est formada por un valor especfico el cual mide una cierta caracterstica en estudio: por ejemplo, la edad de un cerdo en particular (14 semanas), el peso de un animal (18 kg), el rendimiento de forraje en una parcela (2 ton/ha), la raza de un cerdo (Duroc). Variables Una variable es el conjunto de valores (datos) que puede tomar una cierta caracterstica (variable) en estudio en una poblacin o muestra de esta. Por ejemplo, la variable edad puede tomar diferentes valores, los de todos aquellos individuos que intervienen en el estudio, la variable raza puede tomar tambin diferentes valores Observacin Una observacin es un conjunto de valores asociados a cada una de las medidas tomadas de un objeto (individuo) de estudio. Este puede ser un cerdo al cual se le ha registrado su edad, peso, sexo, raza.

21

3.4.3 Inicio de SAS Al ejecutar el programa SAS se abrir el entorno para poder trabajar con el paquete (Vase Figura 7). SAS est compuesto por tres ventanas las cuales son las principales para el proceso de ejecucin de un programa en SAS [Segura, 2011].

Figura 7. Ventanas principales del Software estadstico SAS Despus de unos segundos, el paquete SAS se instala en la memoria de la computadora y est listo para ser utilizado. En el monitor aparecen tres ventanas con las leyendas OUTPUT, LOG y PROGRAM EDITOR. La ventana PROGRAM EDITOR permite capturar los datos de los trabajos de investigacin o escribir los comandos para ejecutar los programas de SAS. La ventana LOG es la ventana de comunicacin del SAS. En esta ventana aparecen los mensajes de advertencia o notas al usuario sobre posibles errores en los datos o al escribir los procedimientos de SAS. Para tener acceso a esta ventana presione la tecla F3 del teclado. La ventana OUTPUT muestra los resultados de los procedimientos requeridos por los usuarios al sistema. Para moverse a esta ventana apriete la tecla F4 o escriba OUT en la lnea de comandos.22

Para moverse de una ventana a otra, se escriben los comandos en la lnea de comandos de cualquier ventana y se presiona la tecla ENTER, o presionando las teclas funcin previamente definidas, para ejecutar el comando. Para conocer las definiciones de las otras teclas funcin presione la tecla F2. Para salir de la ventana de las definiciones de las teclas funcin o de cualquier otra ventana de auxilio escriba END en la lnea de comandos y presione la tecla ENTER o RETURN.

3.4.4 Utilizacin de comandos en SAS El uso de SAS hace referencia al uso de instrucciones bsicas para la realizacin de un programa. Un programa en SAS, hace referencia al uso de una programacin estructurada como un lenguaje de programacin, el cual debe de tener una sintaxis y un orden en especfico para la ejecucin de una operacin o un programa en especifico. A continuacin conforme al artculo de [Figueroa ,2010] se tomara en cuenta el modelo de regresin lineal mltiple el cual nos servir para la elaboracin de esta investigacin y con el cual se explicara el uso de cada instruccin con esta ecuacin (Vase Figura 8).

Figura 8. Ecuacin de Modelo de regresin lineal mltiple para el clculo del Donde: desempleo en Mxico Ut=tasa de desempleo en el tiempo t Donde: PIBt=producto interno bruto en el tiempo t y t-1 t=tasa de inflacin en el tiempo t y t-1 Wt=salario mnimo general en el tiempo t rt=tasa de inters en el tiempo t Et=tipo de cambio de pesos a dlar en el tiempo t Mt=importaciones en el tiempo t Xt=exportaciones en el tiempo t

23

DATA des; input A UT WT PIBt TCt Inft rt Xt Mt; PIBt1=LAG(PIBt); Wt1=Lag(Wt); Ut1=Lag(Ut); cards; 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010

6.5 6.4 6.3 6.2 6 3.3 5.8 6 5.3 4.4 2.7 2.7 2.8 3.4 3.7 6.2 5.5 3.7 3.2 2.5 2.2 2.5 2.7 3.3 3.8 3.6 3.6 3.7 4 5.5 5.9

127.7 129.9 117.5 96.8 89.5 88.2 81.2 76.2 66.2 61.9 56.6 53.9 51.2 50.4 50.4 59.3 40.6 40.1 40.3 39 39.2 39.4 39.7 39.6 39.5 39.7 39.8 39.8 39.4 39.1 39.4

4378.2 4751.47 4726.72 4561.93 4717.53 4820.73 4672.31 4752.78 4813.77 5011.4 5270.78 5492.93 5687.44 5797.85 6056.55 5679.68 5971.54 6376.55 6688.32 6947.81 7406.51 7394.06 7455.36 7555.8 7857.72 8103.68 8501.26 8810.14 8942.35 8398.75 8860.7

5.5 5 7.3 8.5 7.5 7.4 9.6 9.9 7.9 7.4 7.1 6.5 5.9 5.6 5.8 8.4 7.6 6.7 6.8 6.2 5.8 5.6 5.6 6.1 6.2 6 6 5.9 5.9 6.2 6.2

26.2 27.9 57.5 104.1 6.2 57.7 84.5 28.9 125.4 20.3 26.5 22.8 15.6 9.8 7 34.8 35.3 20.8 15.9 16.7 9.5 6.4 5 4.6 4.7 4 3.6 4 5.1 4.6 4.6

. . -25.7 -6.6 . 15.8 14.3 -1.7 30.5 30.6 9.3 2.2 4.5 7.4 7.5 6.5 7 5.3 8 10.1 6.8 7.3 1.6 2.4 1.8 6.1 3.3 3.6 1.4 0.2 0.2

18031 21089.4 23307.3 27184.2 24055.2 17010.6 25953.1 11848.3 29100.4 15916.2 26757.3 18359.1 21803.6 16783.9 27599.5 18812.4 30691.5 28082 35171 34766 40710.9 41593.3 42687.5 49966.6 46195.6 62129.4 51886 65366.5 60882.2 79345.9 79541.6 72453.1 95999.7 89468.8 110431.5 109808.2 117539.3 125373.1 136361.8 141974.8 166120.7 174457.8 158779.7 168396.4 161046 168678.9 164766.4 170545.8 187998.6 196809.7 214233 221819.5 249925. 1256058.4 271875.3 281949 291342.6 308603.2 298361.2 301481.8 298361.2 301481.8

Proc print; Proc means; Proc reg; model Ut= Ut1 Wt PIBt PIBt1 TCt Inft rt Xt Mt/DW; Run; Cuadro 2. Ejemplo de Regresin Lineal en SAS24

DATA: usualmente es la primera instruccin de un programa SAS y tiene por funcin iniciar la creacin del set de datos y se debe asignarle un nombre (Vase cuadro 2). Su expresin simblica es: DATA nombre de los datos; INPUT: indica a SAS como se capturo la informacin en las lneas de datos y que nombres han dado a las variables [Segura, 2011] . La instruccin INPUT para datos numricos puede adquirir diferentes formas 1. lista de variables numricas: cuando los datos estn asignados en hileras ignorando las columnas ,los valores de variables requieren estar separados por lo menos por un espacio en blanco. Por ejemplo: INPUT AO QM QA QF QS I Y; 2. lista de variables numricas con subndice: cuando se especifican nicamente la primera y la ultima variable, quedan sobrentendidas las que estn en el intervalo. Por ejemplo. INPUT X1-X6 INPUT QM- Y 3. variables numricas en columnas: se usa para describir datos que se encuentran arreglados en columnas fijas. En este caso se especifica el campo que ocupa el primer digito y el campo del ultimo , separados por un guion. Por ejemplo. INPUT AO 1-2 QM 4-9 QA 12-15 CARDS: indica al sistema que los datos estn escritos por el usuario, o de otro modo, si los datos estuvieran en un disco o en un lugar especifico de un directorio,

25

O en un cd o unidad de almacenamiento se sustituyen por la instruccin INFILE e inmediatamente despus se ponen las tarjetas de datos segn el formato seleccionado en la seccin INPUT. PROC MEANS: es una instruccin que produce cuadros de las estadsticas simples ya sea para un set completo de datos o para un subset especfico. Tiene tambin varias opciones, si solo se especifica PROC MEANS, entonces imprime la media, desviacin estndar , valor mnimo, valor mximo , desviacin estndar de la media , suma , varianza y coeficiente de variacin. PROC PRINT: es aquella instruccin que imprime un listado de algunas o de todas las variables en el set de datos. PROC REG: La instruccin va siempre acompaada de uno o ms modelos de estados para especificar modelos de regresin. Una instruccin de salida puede seguir cada declaracin. El procedimiento REG ajusta por mnimos cuadrados las estimaciones de los modelos de regresin lineal. PROC REG opciones; La sentencia MODEL especifica las variables dependientes e independientes en el modelo de regresin. model Ut= Ut1 Wt PIBt PIBt1 TCt Inft rt Xt Mt/DW; DW calcula un estadstico de Durbin-Watson para probar si o no los errores que tiene la autocorrelacin de primer orden. (Esta prueba slo es apropiada para los datos de series de tiempo.) model Ut= Ut1 Wt PIBt PIBt1 TCt Inft rt Xt Mt/DW;

26

3.4.5 Libreras de SAS Una de librera de datos SAS, es un conjunto de datos en un directorio. Un mismo directorio puede incluir diferentes libreras SAS. Por defecto, los archivos SAS se crean en una sesin, se almacenan en una librera de datos temporal ,que al iniciando la sesin desaparece. La referencia de una librera SAS se especifica con una sentencia LIBNAME (o mediante una variable de entorno). La sentencia LIBNAME es externa a un paso DATA o PROC y debe de especificarse en el programa con anterioridad. Cada librera de SAS tiene asociados el directorio en el que se encuentra una referencia. Si el programa SAS esta en una PC es necesario crear una librera con una direccin o ruta en la cual buscar los archivos de los datos que se van a utilizar. SAS utiliza la librera para guardar los datos en formato SAS. La librera es una herramienta muy til cuando se manejan archivos grandes de datos. Si el programa SAS esta leyendo un archivo de datos muy grande puede que su ejecucin tarde varios minutos. Una alternativa es depurar el archivo de datos y guardar una versin simplificada del mismo en la librera [Bez, 2007].

27

3.4.6 Plataformas de SAS El programa SAS tiene una gran variedad de recursos a su vez se pueden instalar en diversas plataformas (Sistemas Operativos) segn el manual de SAS [Manual de SAS, 2012] para el uso ya que diversos usuarios difieren de la plataforma no es necesario usar Windows para su ejecucin aqu una lista de los sistemas operativos en lo que se puede instalar (vase cuadro 3): Plataformas de acogida HP / UX en Itanium: 11iv3 (11.31),HP / UX en PA-RISC: 11iv3 (11.31) IBM AIX en las arquitecturas de potencia: 6.1 y 7.1 IBM z / OS: V1R10 y superior Linux (32 bits): Novell SuSE 10 y 11, RHEL 5 y 6 Linux x64 (64 bits): Novell SuSE 10 y 11, RHEL 5 y 6 Microsoft Windows (32 bits): Windows XP Professional, Windows Vista *, Windows 7 , la familia de Windows Server 2003, Windows Server 2008 de la familia Microsoft Windows en x64 (64 bits): Windows XP Professional para x64, Windows Vista * de 64 bits, Windows 7 ** para x64, Windows Server 2003 x64 para la familia, la familia Windows Server 2008 para x64 Solaris en plataformas SPARC: La versin 10 Actualizacin 8 Solaris en x64 (x64-86): La versin 10 Actualizacin 8 Nivel de cliente Microsoft Windows (32 bits): Windows XP Professional, Windows Vista , Windows 7 Microsoft Windows x64 (64 bits): Windows XP Professional Para x64, Windows Vista * de 64 bits, Windows 7 Para x64 Web de nivel IBM WebSphere 7.0.0.13 en: AIX, Linux x64, Solaris (SPARC y x64), Windows 64, z / OS JBoss EAP 4.3 en: AIX en el poder, HP / UX en Itanium, Linux x64, Solaris (SPARC y x64), Windows x64 Oracle WebLogic 10gr3 y 11gR1 en: AIX en el poder, HP / UX en Itanium, Linux x64, Solaris (SPARC un x64), Windows x64 Cuadro 3. Plataformas en las que se puede ejecutar SAS

28

3.5 Software estadstico R R es un entorno de programacin, anlisis estadstico y software grafico derivado del lenguaje de programacin S, la primera versin de R se desarrollo en el departamento de estadstica de la Universidad de Auckland por Ross Ihaka y Robert Gentleman. R se difundi rpidamente y la expansin es hoy irrefrenable .desde su creacin, R se alimenta y crece con los trabajos de investigadores. R integra multitud de paquetes cuya continua incorporacin al entorno R incrementan su capacidad y su versatilidad ya que es un software que se asienta del proyecto GNU (General Public License). R dispone de funciones bsicas relacionadas con los anlisis descriptivos de datos, y de modelos mas complejos y actuales concernientes con los ltimos avances en el campo de las estadstica, la psicometra, la econometra o el anlisis de datos en diversas reas como la psicologa, economa, sociologa, estadstica, biologa, enfermera, medicina o informtica aparte de las capacidades de anlisis estadstico. R es un generador de grficos potente que permite componer un grafico simple definir figuras complejas e incluso crear animaciones.

Figura 9. Logotipo de R

29

3.5.1 Que es GNU? Segn la pagina oficial de GNU es una licencia creada por la Free Software Fundation en 1989 y esta orientada principalmente a proteger la distribucin y modificacin de software. Su propsito es declarar que el software cubierto por esta licencia es software libre y protegerlo de intentos de desaprobacin que restrinjan esas libertades a los a usuarios.

3.5.2 Que es software libre? Es la denominacin de software que respeta la libertad de los usuarios sobre un producto adquirido y por tanto, una vez obtenido puede ser usado, copiado, estudiado, modificado, y redistribuido ,normalmente a veces el software libre suele estar disponible gratuitamente, o al precio de costo de la distribucin a travs de otros medios; sin embargo no es obligatorio que sea as, por lo tanto no hay que asociar software libre a software gratis ,puede ser distribuido comercialmente. En ocasiones se incluye el cdigo fuente, no obstante, este tipo de software no es libre en el mismo sentido , a menos que se garanticen los derechos de modificacin y redistribucin de dichas versiones modificadas del programa.

3.5.3 Estructura bsica en R Cuando se ejecuta R, la pantalla emerge y recibe el nombre de consola de R, ah nos muestra la versin instalada del programa, la consola se muestra en color rojo o en otras palabras el prompt del sistema, la cual indica que R esta listo para recibir comandos. A simple vista las barras de men son rudimentarias y simples y no dispone de mens desplegables para el anlisis de datos, o para la generacin de grficos. La interface de R esta diseada para que el usuario pueda escribir las instrucciones o comandos que desea ejecutar. Esta forma de trabajo se contrapone con el modo de operar sobre interfaces graficas y mens desplegables. No cabe duda que las interfaces graficas son tiles y convenientes, sin embargo las posibilidades que ofrecen las interfaces de comandos (Vase Figura 10) son mayores y no estn limitadas ms que por la habilidad del programador

30

Figura 10. Interface de R La estructura mas simple de R es un vector de datos. Un vector es un objeto unidimensional constituido por los elementos de un mismo tipo. Los elementos de un vector pueden ser de un tipo numrico, lgico o carcter, por lo que habr vectores numricos, lgicos y carcter. En la pantalla de R, tras introducir los datos correspondientes en el vector x (despus del smbolo de lnea >) tecleamos la variable de nuestro vector en este caso x y nos mostrar los resultados de nuestro vector (Vase Cuadro 4). Xmean(x) 4.98125 >sd(x) 0.8320407 >summary(x) Min. 1st Qu. Median Mean 3rd Qu. Max. 3.000 4.625 5.200 4.981 5.625 5.900

Cuadro 4. Ejemplo de un vector en R con clculos estadsticos bsicos

31

3.5.4 Utilizacin de comandos en R El uso del programa hace referencia a comandos los cuales se utilizan para la realizacin de operaciones estadsticas bsicas. Un programa en R hace referencia al uso de comando el cual tienen una sintaxis especfica en donde se coloca el nombre del comando y despus el nombre de la variable para ejecutar el comando deseado. A continuacin conforme al modelo propuesto (Vase Figura 8) se realiza la regresin lineal mltiple utilizando comandos de R y explicaremos cada comando para este ejemplo. Read.csv: es el comando que se encarga de cargar un documento en formato csv en R el cual agrega ciertas caractersticas para su funcionamiento, el cual nos indica la direccin donde se encuentra el archivo y header que indica que leer las cabeceras del documento en este caso las que tomara como variables para el modelo de regresin lineal, datos es el nombre que se utilizara para cargar el documento (vase cuadro 5) datos