LIDA/REC para el análisis estadístico y visualización de datos



LIDA/REC para el análisis estadístico y visualización de datos

Armando Palafox Martínez
 

Texto completo de la Tesis     

 



Resumen

 

La programación visual es la parte de la computación la cual consiste la utilización de representaciones gráficas en el proceso de programación, estas representaciones deben de ser significativas y no meramente decorativas. La programación visual es estimulada por las habilidades no verbales que poseemos.En el proceso de la programación hay muchos aspectos, como son los lenguajes y los entornos para trabajar con estos, la visualización de los datos y de los resultados de la ejecución de algún programa, el diseño de la aplicación; la programación visual se puede aplicar a todos estos aspectos. Los lenguajes visuales son un paradigma para expresar sistemas de cómputo. Ofrecen la posibilidad de una manipulación directa de objetos computacionales, en un caso particular para resolver el problema de visualización de datos. Un programa visual escrito en un lenguaje visual dado, consiste en un arreglo espacial de íconos. Un ícono generalizado es un objeto con una representación dual de una parte lógica (el significado) y una parte física (la imagen). Cuando los íconos son metáforas adecuadas para objetos computacionales, el significado de la sentencia visual es como la que el humano supone y depende de cuánto las construcciones mentales corresponden a las construcciones del lenguaje visual. El objetivo de esta tesis es crear una versión de LIDA/REC para el análisis estadístico y visualización de datos a través funciones estadísticas, estas funciones son representadas por íconos que podrán tener entradas y salidas con lo que se conectarán con otros íconos de diferentes procesos. El flujograma completo es modelado con LIDA (Lenguaje Iconográfico para el Desarrollo de Aplicaciones), cuyo ambiente es visual, y este generará un lenguaje intermedio llamado REC (Regular Expression Compiler) en una versión estadístico, y los resultados que se arrojen van a poder ser descritos mediante gráficas, como son los histogramas, de pastel, de barras, entre otras. Se desarrolló el compilador de REC para realizar operaciones del lenguaje estadístico R con lo que se generan las gráficas mencionadas anteriormente y los valores estadísticos según la selección del usuario, así como también la interfaz entre el sistema R y la herramienta visual. Todo este proceso será transparente para el usuario lo cual le facilitará la realización de sus tareas de análisis.

 

Abstract

Visual programming is part of the computer which is the use of graphic representations in the programming process, these representations are to be meaningful and not merely decorative. Visual programming is stimulated by non-verbal skills we possess. In the process of programming many aspects, such as languages and environments for working with these, display data and the results of the execution of a program, the application design; visual programming can be applied all these aspects. The visual languages are a paradigm for expressing computational systems. They offer the possibility of direct manipulation of computational objects in a particular case to solve the problem of data visualization. A visual program written in a given visual language, is a spatial arrangement of icons. A generalized icon is an object with a dual representation of a logical part (the meaning) and a physical part (the image). When the icons are metaphors suitable for computational objects, the meaning of the visual sentence is like the human involved and depends on how the mental constructs correspond to visual language constructs. The aim of this thesis is to implement a version of LIDA/REC for statistical analysis and data visualization through statistical functions, these functions are represented by icons that may have inputs and outputs that will connect with other icons of different processes. The complete flowchart is modeled with LIDA (Iconographic Language Application Development ), whose environment is visual, and it will generate an intermediate language called REC (Regular Expression Compiler) in a statistical version, and the results will be thrown to be described using graphs such as histograms, pie, bar, among others. REC compiler was developed to perform statistical language R thus generated above graphs and statistical values according to user's selection, as well as the interface between the R and the visual tool. This whole process is transparent to the user which will facilitate the realization of their analysis tasks.