Fuentes de Datos - Administrasión de Sistemas de Información

Transcripción

Fuentes de Datos - Administrasión de Sistemas de Información
Business Intelligence.
¿Qué es inteligencia de negocios?

Es el proceso de analizar los bienes o datos acumulados
en la empresa y extraer una cierta inteligencia o
conocimiento de ellos. Dentro de la categoría de bienes
se incluyen las bases de datos de clientes, información
de la cadena de suministro, ventas personales y
cualquier actividad de marketing o fuente de información
relevante para la empresa.

Uso de un almacén de información como herramienta
estratégica y táctica para ganar ventaja competitiva, así
como apoyar el proceso de toma de decisiones.

Habilidad de explorar y analizar datos para revelar la
existencia de tendencias dentro de un negocio.
Inteligencia de Negocios ¿Por qué?







Bases de datos más y grandes y complejas.
Diferentes lenguajes y tipos de bases de datos.
Exceso de trabajo al cubrir requerimientos del lado del
negocio.
Diferentes servidores.
Muchos reportes.
Respuesta lenta.
Sin comparaciones ni tendencias.
¿Qué puede hacer con Business
Intelligence?

Con BI se puede:









Generar reportes globales o por secciones.
Crear una base de datos de clientes.
Crear escenarios con respecto a una decisión.
Hacer pronósticos de ventas y devoluciones.
Compartir información entre departamentos.
Análisis multidimensionales.
Generar y procesar datos.
Cambiar la estructura de toma de decisiones.
Mejorar el servicio al cliente.
Áreas más comunes en las que las
soluciones de inteligencia de
negocios son utilizadas:




Ventas: Análisis de ventas; Detección de clientes
importantes; Análisis de productos, líneas, mercados;
Pronósticos y proyecciones.
Marketing: Segmentación y análisis de clientes;
Seguimiento a nuevos productos.
Finanzas: Análisis de gastos; Rotación de cartera;
Razones Financieras.
Manufactura: Productividad en líneas; Análisis de
desperdicios; Análisis de calidad; Rotación de
inventarios y partes críticas.
¿Quién necesita soluciones de
Business Intelligence?

Si usted puede contestar afirmativamente por lo menos a una de las siguientes
preguntas, entonces usted es candidato a beneficiarse de las soluciones de BI.

¿Pasa más tiempo recolectando y preparando información que analizándola?

¿En ocasiones le frustra el no poder encontrar información que usted está
seguro que existe dentro de la empresa?

¿Pasa mucho tiempo tratando de hacer que los reportes en Excel luzcan
bien?

¿Quisiera tener una guía sobre las cosas que han sucedido cuando los
administradores anteriores implementaban determinada estrategia?

¿No sabe qué hacer con tanta información que tiene disponible en la
empresa?

¿Quiere saber qué productos fueron los más rentables durante un periodo
determinado?

¿No sabe cuáles son los patrones de compra de sus clientes dependiendo de
las zonas?

¿Ha perdido oportunidades de negocio por recibir información retrasada?

¿Trabaja horas extras el fin de mes para procesar documentos o reportes?

¿No sabe con certeza si su gente está alcanzando los objetivos planeados?

¿No sabe si mantiene una comunicación estrecha entre las diversas áreas de
su empresa hacia una estrategia común?

¿No tiene idea de por qué sus clientes le regresan mercancía?
Componentes de Business
Intelligence.
Conceptos Básicos
Data Warehouse.

Un Data Warehouse es un
almacenamiento separado y
homogéneo donde son
cargados datos
transformados provenientes
de diferentes bases de
datos.
Conceptos Básicos
Data Warehouse.

Colección integrada de información corporativa
diseñada para la recuperación y el análisis en
apoyo a los procesos de toma de decisiones.

Repositorio completo de datos de la empresa,
donde se almacenan datos estratégicos, tácticos
y operativos, al objeto de obtener información
estratégica y táctica
Conceptos Básicos
Ventajas - Data Warehouse.




Datos de toda la compañía, organizados para facilitar las
consultas más analíticas que transaccionales.
Los procesos de transformación han sido aplicados a los
datos para permitir un tiempo de respuesta mínimo a las
consultas.
Modelo de datos multidimensional para hacer más fácil
la navegación y explotación de datos.
La administración de la seguridad está centralizada para
garantizar la necesidad de información dependiendo del
perfil de los usuarios.
Conceptos Básicos
Datamart.

Un subconjunto del
Data Warehouse
para cierto grupo de
usuarios o funciones
del negocio.
Conceptos Básicos
Datamart.
 Qué es
 Es una parte de un DWH
 De un fin específico o actividad de negocio
 Una solución táctica
 Por qué construir un Datamart
 Consultas más rápidas y menos usuarios
 Tiempo de desarrollo más rápido
 Datamarts integrados
 Asegurar la consistencia de datos
 Requiere de una planeación avanzada
Conceptos Básicos
Metadatos.





Los metadatos son datos sobre los datos almacenados.
Por ejemplo, definir los tipos de datos, tamaños,
diccionario de datos, etc.
Es fundamental para una bodega de datos conocer la
naturaleza de los datos y su localización.
Los metadatos pueden proporcionar una visión
estandarizada, facilitan hacer transformaciones y
cambios de los datos.
Para desarrollar aplicaciones exitosas es importante
compartir la información de los metadatos.
Conceptos Básicos
OLTP (Online Transaction Processing).



Son sistemas de información operacionales que
facilitan y manejan aplicaciones orientadas a
transacciones.
Manejan gran detalle de cada operación
Ejemplos:
 Banca
 Aerolíneas
 Manufactura
 Supermercados
Conceptos Básicos
OLAP (Online Analytical Processing).

Tecnología que permite la
explotación de datos en
diferentes puntos de vista o
dimensiones
Tipos de OLAP.



OLAP Relacional (ROLAP)
OLAP Multidimensional (MOLAP)
OLAP Híbrida (HOLAP)
MOLAP



En un sistema MOLAP (OLAP multidimensional) los
datos se encuentran almacenados en una estructura
multidimensional.
Para optimizar los tiempos de respuesta, el resumen de
la información es usualmente calculado por adelantado.
Estos valores precalculados o agregaciones son la base
de las ganancias de desempeño de este sistema.
Algunos sistemas utilizan técnicas de compresión de
datos para disminuir el espacio de almacenamiento en
disco debido a los valores precalculados.
ROLAP

ROLAP (OLAP Relacional) es un sistema en el cual los
datos se encuentran almacenados en una base de datos
relacional. Típicamente, los datos son detallados,
evitando las agregaciones y las tablas se encuentran
normalizadas.
HOLAP
 Un
sistema HOLAP (OLAP Híbrido) mantiene
los registros detallados en la base de datos
relacional, mientras que los datos resumidos
o agregados se almacenan en una base de
datos multidimensional separada. Este
método de almacenamiento es una
combinación de los dos anteriores e intenta
rescatar lo mejor de cada uno.
Conceptos Básicos
OLTP - OLAP
Característica
OLTP
OLAP
Tamaño BBDD
GigaBytes
Giga a TeraBytes
Origen Datos
Interno
Interno y Externo
Actualización
On-Line
Batch
Periodos
Actual
Histórico
Consultas
Predecibles
Ad Hoc
Actividad
Operacional
Analítica
Conceptos Básicos
Indicador, Medida,Variable,
Fórmula.

Objeto de estudio. Cada indicador tiene asociada
una serie de dimensiones sobre las que se
pueden clasificar sus valores. Por ejemplo,
algunos indicadores son:
Ingresos(<Tiempo>, <Geografía>, <Producto>)
Número de Empleados(<Tiempo>, <Geografía>)
Si el indicador contiene datos almacenados se
habla de Variable Multidimensional. Si por el
contrario, lo que se almacena es la expresión
para calcular esos datos a partir de otros (que
puede ser una fórmula o un programa), se habla
de Fórmula Multidimensional
Conceptos Básicos
Dimensiones.
Ø
Enfoque bajo el cual se está
evaluando el indicador.
Ø
Ventas Netas, que en el mes de
Enero fueron $2 Millones, pero
usted quiere ver desglosado ese
valor por tipo de cliente y luego
por zona.
Conceptos Básicos
Drill Down.
Ø
Descomponer
(visualmente) en
detalle un dato según
una jerarquía de una
dimensión.
Conceptos Básicos
Data-Mining.

Proceso no trivial de análisis de grandes
cantidades de datos con el objetivo de extraer
información útil. Por ejemplo, se trata de aplicar
algoritmos de clasificación de datos para
realizar predicciones futuras, o estudios de
correlación entre variables aparentemente
independientes. Para ello, es común la
utilización de Redes Neuronales o Algoritmos
Evolutivos.
Conceptos Básicos
Tipos de Sistemas de información:
Sistema de información Ejecutivo.


Métricas que le permitirán
ver como va el negocio en
una forma rápida, resumida
y actualizada.
Sistemas integradores de
datos de diferentes
sistemas operacionales.
Conceptos Básicos
Tipos de Sistemas de información:
Sistema para el Soporte de Decisiones



Muestra a profundidad cómo
va el negocio.
Ahondar en las causas de por
qué ha obtenido ese
resultado.
Tomar decisiones más
acertadas para planear los
próximos objetivos o corregir
alguna desviación a los
mismos.
EIS
DWH
Reporteador
E
T
L
DSS
BD
Relacional
Motor OLAP
Balanced Scorecard
Dispositivos Móviles
Tecnología Push
Fuentes de Datos
Visualización de Información
Análisis y
definición del
alcance
Mapeo de
datos
Extracción de
información
Creación de vistas
ejecutivas
Creación de cubos
multidimensionales
Documentación
Capacitación a
usuarios y
sistemas
Transformación
de información
Proceso de
desarrollo
Análisis y
definición del
alcance
Creación de vistas
ejecutivas
Documentación
Extracción de
información
Mapeo de
datos
Creación de cubos
multidimensionales
Capacitación a
usuarios y
sistemas
Transformación
de información
Proceso de
desarrollo
Análisis y definición del alcance.

Esfuerzo conjunto




Clientes principales
Sistemas
Equipo de Desarrollo
Posibles elementos del
alcance del proyecto:




Fecha de entrega del proyecto
Productos a entregar
Beneficios cuantitativos
potenciales del proyecto
Administración general del
proyecto
Mapeo de Datos de la fuente al
destino.
Análisis y
definición del
alcance
Creación de vistas
ejecutivas
Documentación
Extracción de
información
Mapeo de
datos
Creación de cubos
multidimensionales
Capacitación a
usuarios y
sistemas
Transformación
de información
Proceso de
desarrollo
ETL.
Extraction Transformation and Load.
Permite conectarse a diferentes bases de
datos, extraer información de las mismas,
transformarla y cargarla a una base de datos
diferente.
Permiten almacenar la información tal y
como se requiere en un diagrama estrella o
relacional.
Procedimientos de extracción.

Los procesos de extracción de información
dependen de la base de datos en la que se
depositará el data warehouse.

Son programados para conectarse a las bases de
datos transaccionales del cliente, transformar los
datos, sumarizarlos y almacenarlos en el data
warehouse.
Análisis y
definición del
alcance
Creación de vistas
ejecutivas
Documentación
Extracción de
información
Mapeo de
datos
Creación de cubos
multidimensionales
Capacitación a
usuarios y
sistemas
Transformación
de información
Proceso de
desarrollo
CUBO.

El cubo nos permite modelar los datos y visualizarlos
en multiples dimensiones.
Esquema Estrella.
o
o
o
Tabla central rodeada por muchas tablas de
dimensiones que contienen descripciones
desnormalizadas de los hechos.
El centro de la estrella es la tabla de hechos
Los puntos de la estrella son las tablas de
dimensiones
Componentes de una estrella.
 Tablas de Dimensiones




Tienen relaciones de uno a muchos a la tabla de hechos
Incluye menos renglones que la tabla de hechos
Consiste en la información descriptiva
Contiene múltiples columnas para ayudarnos en la
jerarquía de datos
 Tiene una llave primaria de la dimensión
 Está estructurada para permitir cambios.
 Tabla de hechos





Contiene las medidas
Que deben ser aditivas y numéricas
Llaves compuestas forman la llave primaria
Llaves foráneas
Datos Estáticos
Esquema Copo de Nieve.



Similar a un diagrama estrella, pero con dimensiones
normalizadas
Evita duplicidad de información en las dimensiones
Requiere mayor tiempo de procesamiento, pues
involucra más joins.
Análisis y
definición del
alcance
Creación de vistas
ejecutivas
Documentación
Extracción de
información
Mapeo de
datos
Creación de cubos
multidimensionales
Capacitación a
usuarios y
sistemas
Transformación
de información
Proceso de
desarrollo
Documentación y Capacitación.



Toda la documentación que se genere del proyecto,
como los manuales de usuario, manual técnico
operativo, minutas, etc.
Capacitación Usuario Final
Capacitación Sistemas
Herramientas para la creación
de modelos.
EIS
DWH
Reporteador
E
T
L
DSS
BD
Relacional
Motor OLAP
Balanced Scorecard
Dispositivos Móviles
Tecnología Push
Fuentes de Datos
Visualización de Información
EIS
DWH
Reporteador
E
T
L
DSS
BD
Relacional
Motor OLAP
Balanced Scorecard
Dispositivos Móviles
Tecnología Push
Fuentes de Datos
Visualización
Fuentes de Datos.

Bases de datos relacionales (transaccionales)
 Oracle
 MS SQL Server
 Informix
 DB2
 Sybase
 MySQL
Fuentes de Datos (cont.)


ERPs
 SAP R/3
 JD Edwards
 Peoplesoft
 Otros
Otras fuentes
 Hoja de cálculo (Excel, Lotus 123, etc.)
 Bases de datos pequeñas (dBase, FoxPro)
 Archivos planos
EIS
DWH
Reporteador
E
T
L
DSS
BD
Relacional
Motor OLAP
Balanced Scorecard
Dispositivos Móviles
Tecnología Push
Fuentes de Datos
Visualización
ETL.








DataStage (Ascential)
Oracle Warehouse Builder (Oracle)
DTS (Microsoft)
DecisionStream(Cognos)
Warehouse Administrator (SAS)
Extractores de SAP
Informatica
Ab Initio
EIS
DWH
Reporteador
E
T
L
DSS
BD
Relacional
Motor OLAP
Balanced Scorecard
Dispositivos Móviles
Tecnología Push
Fuentes de Datos
Visualización
DWH: BD Relacional







Oracle
DB2
Teradata
MS SQL Server
Sybase
RedBrick
Informix
EIS
DWH
Reporteador
E
T
L
DSS
BD
Relacional
Motor OLAP
Balanced Scorecard
Dispositivos Móviles
Tecnología Push
Fuentes de Datos
Visualización
Motor OLAP.

ROLAP
 Cualquier

base de datos relacional
MOLAP
 Estructuras
propietarias
Cognos (Power Cubes)
 Hyperion (Essbase)
 Analysis Services (Microsoft)
 SAS (OLAP Server)
 MicroStrategy (construcción de cubos al vuelo)
 SAP Business Information Warehouse (SAP)

EIS
DWH
Reporteador
E
T
L
DSS
BD
Relacional
Motor OLAP
Balanced Scorecard
Dispositivos Móviles
Tecnología Push
Fuentes de Datos
Visualización
Visualización.


EIS
 Artus (Bitam)
 Business Objects
 Cognos (Visualizer)
 MicroStrategy
 Oracle BI Beans
 SAP Business Explorer
DSS
 Artus (Bitam)
 Business Objects
 Hyperion (Analyzer, Brio)
 Cognos (PowerPlay)
 Oracle Discoverer
 Web AF (SAS)
 SAP Business Explorer
 Temtec Executive viewer
Visualización (cont.)


Reporteo
 Papiro (Bitam)
 Cognos Impromptu o ReportNet
 Hyperion Brio
 EIS (SAS)
Balanced Scorecard
 Stratego (Bitam)
 SAS SPM
 Oracle Balanced Scorecard
Visualización (cont.)


Dispositivos móviles
 Artus (Bitam)
 Oracle iAS
Tecnología Push
 Advisor (Bitam)
 MicroStrategy NarrowCast Server
Conclusiones.
¿Qué es BI?
Es un set de tecnologías que van desde arquitecturas para
almacenar datos, metodologías, técnicas para analizar
información y software entre otros, con un fin común para el
apoyo a la toma de decisiones.
¿Qué es un Datawarehouse?
Es una base de datos que contiene datos de la empresa,
además de integrar una serie de datos históricos. Tiene una
orientación a uno o varios temas, con datos consolidados y
consistentes, estructurados para su distribución y consulta.
Conclusiones.
¿Qué limitantes tengo para un sistema de información ejecutivo?
La principal limitante es la falta de datos, es decir que los mismos no se
estén capturando.
¿Cuál es la fortaleza de un SIE?
Fundamentalmente darle a los tomadores de decisiones la información
correcta, en el momento correcto y en el lugar correcto, permitiéndoles
tomar mejores decisiones.
¿Es un sistema exclusivo para el área financiera?
No, las soluciones de BI proveen respuestas a preguntas reales,
involucrando todas las unidades funcionales del negocio.
Conclusiones.
¿Qué puedo esperar de una solución de BI?
•Una rápida recuperación de mi inversión.
•Incentivar a los usuarios a tomar decisiones y acciones.
•Que crezca y se adapte a las necesidades cambiantes de la
organización.
•Ser adoptado por los usuarios como un camino a la toma de
decisiones.
Tengo varias Bases de Datos, ¿puedo almacenar la
información en un mismo Data Warehouse?
Desde luego que sí, al concentrar la información en una Data
Warehouse, el acceso a la información es más rápido, además de
que es posible hacer cruces entre la información de diferentes
Bases de Datos.