miércoles, 20 de junio de 2012

Inteligencia de Negocios

¡Hola amigos!

Los puntos que voy a tratar en este post son:
- Sistemas de información para el apoyo a la toma de decisiones
- Sistemas de información para ejecutivos
- Sistemas OLAP
- Inteligencia de negocios
- Modelo conceptual de la inteligencia de negocios
- Modelo Estrella vs. Modelo 3FN

   En los primeros post que publiqué en mi blog, expliqué que los Sistemas de Información se podían tener varias clasificaciones, y una de ellas era la clasificación en relación con la toma de decisiones, que se representa con la siguiente pirámide:


   De ésta pirámide, me enfoqué las últimas semanas en los Sistemas de Procesamiento de Transacciones (TPS) y en los Sistemas de Información Gerencial (MIS), donde trabajé con los sistemas ERP, CRM, SCM y BPM.

   A pesar de que los TPS son muy importantes para una empresa, porque manejan todos los datos de la misma, con ellos no se puede realizar análisis de datos, ni se puede generar conocimiento, y aunque los MIS generan reportes periódicamente, éstos no son suficientes para ayudar a la toma de decisiones de una empresa, ya que dichos reportes son estandarizados y estructurados con información estática, y no permiten profundizar en los datos, navegar entre ellos, manejarlos desde distintas perspectivas, etc.

   Para ayudar a la toma de decisiones de una empresa, surgen los Sistemas de Información más altos de esta pirámide: Los Sistemas de Apoyo a la Toma de Decisiones (DSS) y los Sistemas de Información para Ejecutivos (EIS), que permiten obtener información, realizar análisis y extrapolar conocimiento de los datos almacenados diariamente, en las bases de datos de la empresa.

Sistemas de Información para el Apoyo a la Toma de Decisiones (DSS)

   Un DSS es un sistema que se enfoca en el análisis de los datos de una empresa. Estos sistemas explotan al máximo la información guardada en una base de datos corporativa (DataWarehouse), mostrando reportes muy dinámicos y con gran potencial de navegación.

   Los DSS suelen requerir un motor OLAP, que facilite el análisis casi ilimitado de los datos para hallar las causas de los problemas de la empresa.

Sistemas de Información para Ejecutivos (EIS)

   Un EIS es un sistema basado en un DSS, que provee a los gerentes y ejecutivos un acceso sencillo a la información interna y externa de la empresa, y que es relevante para sus factores críticos de éxito.

   Los factores críticos de éxito son el conjunto de variables de una organización que es necesario monitorear y dar seguimiento para asegurar el éxito de la empresa. 

   Los EIS se caracterizan por ofrecer al ejecutivo un acceso rápido y efectivo a la información compartida de la empresa, utilizando interfaces gráficas visuales e intuitivas, que suelen incluir informes fáciles de leer, gráficos de barras, tortas, semáforos, etc., que le permiten analizar que Indicadores Claves de Desempeño (KPIs) están cumpliendo o no las expectativas de la empresa, y así determinar un plan estratégico.


  Para que un EIS sea exitoso debe cumplir con los siguientes factores:
   - Que se vea bien: que sea muy gráfico.
   - Que sea relevante: que acceda a los datos más importantes de la empresa.
   - Que sea rápido: que los tiempos de respuesta sean cortos.
   - Que la información este siempre disponible y actualizada.


Sistemas OLAP 

   Los sistemas que se encargan de las transacciones diarias de una empresa, utilizan los sistemas de Procesamiento de Transacciones En Línea (OLTP), los cuales hacen énfasis en mantener la integridad de los datos y registrar eficazmente todas las transacciones que se realizan diariamente. Las bases de datos de un OLTP se caracterizan por tener un esquema entidad-relación modelado en 3FN.

   Por otro lado, los sistemas que se encargan del análisis de los datos, utilizan los sistemas de Procesamiento Analítico En Línea (OLAP), que se enfocan en las bases de datos corporativas, también conocidas como DataWarehouse.

  El DataWarehouse es un almacén de datos transformados y separados físicamente de una o varias fuentes distintas, por lo general, esas fuentes son las bases de datos OLTP. La ventaja principal de un DataWarehouse, radica en la estructura multidimensional en la que se almacenan los datos.


  El objetivo fundamental de un sistema OLAP, es permitir el análisis de datos, por lo que deben proveer funciones de consulta analítica y de apoyo a la toma de decisiones.

OLAP fue creado bajo las siguientes ideas:

- Estructura multidimensional: hacer sencilla la selección y navegación de los datos. 

- Lograr rapidez de respuesta: entregar la información a los usuarios finales en el menor tiempo posible.

- Posibilitar el análisis: ofrecer análisis numérico y estadístico de los datos.

- Compartir datos: incluye mecanismos de seguridad para compartir información entre diferentes usuarios.

- Recuperar información: acceder a los datos y recuperar información valiosa (solo lectura) para las diferentes aplicaciones clientes.

OLTP vs OLAP

 Los sistemas OLTP se encargan de procesar óptimamente multitud de pequeñas transacciones de captura de información (su entrada, modificación o eliminación), y los sistemas OLAP se dedican al análisis de enormes cantidades de información.

   A continuación un cuadro comparativo entre los sistemas OLTP y OLAP:


Inteligencia de Negocios - Business Intelligence (BI)

   La inteligencia de negocios integra distintas estrategias y herramientas enfocadas a la administración y creación de conocimiento, mediante el análisis de datos existentes en una empresa. Su objetivo es ayudar a las empresas a tomar mejores decisiones y a conseguir un mejor control de la misma.

Incluye:
- Procesos de Transformación de Datos e Interfaces con otros sistemas
- Consultas y reportes
- Procesos Analíticos En Línea (OLAP)
- Análisis estadístico
- Proyecciones
- Minería de datos

Beneficios: 
- Permite tomar decisiones rápidas y seguras
- Ahorra informes complejos y trabajosos de hacer
- Permite analizar información rápidamente

La plataforma de inteligencia de negocios que utilizaremos en esta parte del curso, será:



   Pentaho es un conjunto de programas libres para generar inteligencia empresarial (BI) e incluye herramientas integradas para generar informes, minería de datos, ETL, etc.

Modelo conceptual de inteligencia de negocios

OLTP - Procesamiento de Transacciones En Línea
   Son las distintas fuentes de origen de donde se extraerán, transformarán y cargaran los datos que contendrá la fuente destino DataWarehouse.

ETL - Extracción, Transformación y Carga

    Para la obtención, depuración, preparación y carga de datos, se utiliza un sistema ETL:

   Extracción: este es el primer paso para obtener la información que será cargada en el DataWarehouse.

  Transformación: una vez que la información es extraída, hay posibles paso de transformación como: limpiar la información, seleccionar únicamente los campos necesarios para el DataWarehouse, combinar fuentes de datos, etc.

  Carga: al final del proceso de transformación, los datos están en forma para ser cargados.

ODS - Almacén de Datos Operacional
   Es un sistema que recopila la información existente en los sistemas operacionales.

Staging - Área de trabajo para ETL
  Es un área temporal donde se recogen los datos que se necesitan de los sistemas operacionales. Se recogen los datos estrictamente necesarios para las cargas, y se aplica el mínimo de transformaciones a los mismos.

DataWarehouse - Base de datos corporativa
   Es donde se almacenan los datos ya transformados y separados físicamente de los distintas fuentes de origen.

OLAP Server - Procesamiento Analítico En Línea
   Cálculos analíticos agregados (datos precalculados), sumarizados.
   Masivamente desnormalizada.

OLAP Client - Visualizador de Data
   Tablas pivote, navegación, charts, drilling.
   Genera consultas, muestra los resultados.
   Intercambia metadata con el servidor OLAP.

Modelo Estrella vs. Modelo 3FN

 Como expliqué anteriormente, el DateWarehouse tiene una estructura multidimensional en la que se almacenan los datos. Existen tres tipos de modelamientos posibles para este tipo de estructura, que permiten realizar consultas de soporte de decisión: Modelo Estrella, Modelo Copo de Nieve y Modelo Constelación. En este post explicaré únicamente el Modelo Estrella y sus diferencias con el Modelo 3FN.

   El Modelo Estrella está formado por una tabla central de hechos, la cual está rodeada por varias tablas dimensiones y juntas forman una estructura que permite implementar mecanismos básicos para poder utilizarla con una herramienta de consultas OLAP.


    La tabla de hechos contiene datos de tipo numéricos medibles. Son datos cuantitativos. Ejemplo: Ventas promedio en bolívares.
   
   Las tablas dimensiones contienen el detalle de los valores que se encuentran asociados a la tabla de hechos. Son datos cualitativos. Ejemplo: Dimensión Tiempo, Dimensión Clientes, Dimensión Productos, etc.

Características del Modelo Estrella:
- Enfocado a la consulta, brindando respuestas rápidas.
- Fácil de entender por los usuarios.
- Está formado por una tabla de hechos y varias tablas dimensión.
- Altamente desnormalizado.
- Varios niveles de datos precalculados.


  Por otro lado, los sistemas operacionales se sustentan en el Modelo 3FN, en donde se dividen los datos en entidades y representan como tablas en la BD, se asegura la integridad de los datos, se evita la redundancia y la duplicidad.

Características del Modelo 3FN:
- Enfocado a las actualizaciones y eliminar redundancia.
- Altamente normalizado.
- Pocos datos precalculados.
- Se tienen muchos caminos para ir de una tabla a otra.


   Antes de finalizar este post, quiero recomendarles el siguiente link, donde podrán encontrar más información sobre el tema de inteligencia de negocios.

¡Hasta pronto amigos!


Viviana Pérez.

Aviso: La información recopilada en este blog sólo debe utilizarse con fines orientativos.


Bibliografía:
- Laminas y anotaciones de la clase.

2 comentarios: