Inteligencia artificial para - Informatica US · PDF filea escala de cloud y basado en...

14
White paper Inteligencia artificial para la revolución basada en datos Las innovaciones basadas en el aprendizaje automatizado de CLAIRE suponen un gran impulso en la productividad de los datos

Transcript of Inteligencia artificial para - Informatica US · PDF filea escala de cloud y basado en...

Page 1: Inteligencia artificial para - Informatica US · PDF filea escala de cloud y basado en inteligencia artificial), ... • Variedad y complejidad de datos: existen infinidad de fuentes

White paper

Inteligencia artificial para la revolución basada en datosLas innovaciones basadas en el aprendizaje automatizado de CLAIRE suponen un gran impulso en la productividad de los datos

Page 2: Inteligencia artificial para - Informatica US · PDF filea escala de cloud y basado en inteligencia artificial), ... • Variedad y complejidad de datos: existen infinidad de fuentes

Este documento contiene información comercial secreta, confidencial y propiedad de Informatica (“Información confidencial”) y no se puede copiar, distribuir, duplicar o reproducir en modo alguno sin el consentimiento previo por escrito de Informatica.

Aunque se ha intentado por todos los medios garantizar la precisión y la integridad de la información aquí presentada, este documento puede contener errores tipográficos o imprecisiones técnicas. Informatica no asume la responsabilidad por ningún tipo de pérdida derivada del uso de la información incluida en este documento. La información incluida en este documento está sujeta a cambios sin previo aviso.

La incorporación de los atributos de los productos mencionados en este documento en cualquier versión o actualización de cualquier producto de software de Informatica, así como la fecha de dichas versiones o actualizaciones, quedan sujetas al criterio exclusivo de Informatica.

Protegido por una o más de las siguientes patentes de EE. UU.: 6,032,158; 5,794,246; 6,014,670; 6,339,775; 6,044,374; 6,208,990; 6,208,990; 6,850,947; 6,895,471; o por las siguientes patentes en trámite de EE. UU.: 09/644,280; 10/966,046; 10/727,700.

Edición publicada en mayo de 2017

Page 3: Inteligencia artificial para - Informatica US · PDF filea escala de cloud y basado en inteligencia artificial), ... • Variedad y complejidad de datos: existen infinidad de fuentes

1

White paper

Contenidos

Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

Tendencias en la gestión de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

Implicaciones para los líderes de TI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

Implicaciones para los líderes de negocio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

Definición del aprendizaje automatizado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

Motivos para emplear el aprendizaje automatizado en la gestión de datos . . . . . . 5

Base del aprendizaje automatizado en la gestión de datos . . . . . . . . . . . . . . . . . . . 5

Informatica CLAIRE: “inteligencia” de Intelligent Data Platform . . . . . . . . . . . . . . . . . 6

CLAIRE en acción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

Semejanza de datos inteligente. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

Detección inteligente de dominios con etiquetas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

Detección inteligente de entidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

Recomendaciones de datos inteligentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

Detección inteligente de estructuras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

Detección inteligente de anomalías . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

Conclusión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

Page 4: Inteligencia artificial para - Informatica US · PDF filea escala de cloud y basado en inteligencia artificial), ... • Variedad y complejidad de datos: existen infinidad de fuentes

2

IntroducciónLa transformación digital no solo es real, sino que es inevitable. La cuestión es emprender la revolución o verse arrollado por ella. Las organizaciones están impulsando iniciativas transformadoras que aumenten la rentabilidad y mejoren su posición frente a la competencia del sector. Algunos ejemplos de dichas iniciativas son el reforzamiento de las relaciones con los clientes, la optimización de las operaciones, la personalización de la atención sanitaria o la prevención de actividades fraudulentas.

Para que esas iniciativas lleguen a buen puerto, el factor clave es la capacidad para basarlas en datos fiables y oportunos. Es así de sencillo: las estrategias digitales correctas se basan en datos. La competencia a la hora de gestionarlos condiciona el alcance del éxito de la estrategia digital. Dicho de otro modo, la eficacia de la estrategia digital depende de la calidad de los datos en que se basa.

Sin embargo, es probable que no baste con gestionar los datos “como toda la vida”. Los líderes de TI buscan maneras de incrementar la productividad en la gestión de los datos a fin de poner a disposición de todos los usuarios datos óptimos con mayor rapidez.

El motor CLAIRETM de Informatica (llamado así por el acrónimo en inglés para motor en tiempo real a escala de cloud y basado en inteligencia artificial), el cual emplea la inteligencia artificial y técnicas de aprendizaje automatizado basadas en datos y metadatos de toda la empresa, aumenta de manera considerable la productividad de todos los gestores y usuarios de datos de toda la organización.

Page 5: Inteligencia artificial para - Informatica US · PDF filea escala de cloud y basado en inteligencia artificial), ... • Variedad y complejidad de datos: existen infinidad de fuentes

3

Tendencias en la gestión de datos Ha llegado el momento de cambiar el concepto de datos y de arquitectura de datos. Durante décadas, el interés se ha centrado en los sistemas y los procesos de negocio. Si bien conservan su relevancia, en realidad, el auténtico factor diferenciador en el mercado es la capacidad para suministrar a las iniciativas de negocio datos más completos y certeros, en el momento idóneo. El problema radica en que, en la mayoría de los casos, el presupuesto de TI apenas aumenta, así que no cabe más remedio que hacer más con los recursos existentes.

Jamás ha resultado tan complicado gestionar los datos empresariales. Para aprovechar todo el potencial de los datos, la organización de TI ha de saber gestionar lo siguiente:

1. Más datos:

• Volumen de datos: el tráfico global en los data centers alcanza los 15,3 zetabytes al año.

• Variedad y complejidad de datos: existen infinidad de fuentes y tipos nuevos de datos, tanto de la empresa como ajenos a ella.

• Velocidad de datos: el auge del Internet de las cosas, con 20 000 millones de dispositivos conectados, implica la transmisión continua de datos.

2. Más usuarios: la cifra asciende ya a 325 millones de usuarios de datos de negocio y sigue en aumento, y todos, desde los analistas de negocio hasta los administradores de datos y los especialistas en datos legos, solicitan el acceso directo y oportuno a los datos.

3. Más patrones de integración:

• Transición al cloud: los conjuntos de ERP se están desmantelando para trasladarlos al cloud.

• Tecnología de análisis: el sector está recurriendo a tecnologías nuevas como el Big Data, NoSQL y los análisis predictivos para complementar el data warehousing.

• Experimentación: ahora, los usuarios desean emplear los datos para formular hipótesis, confirmar o negar su validez y aplicar iteraciones sin dilación. Prima la rapidez sobre la precisión hasta que se demuestre la utilidad de la hipótesis.

Page 6: Inteligencia artificial para - Informatica US · PDF filea escala de cloud y basado en inteligencia artificial), ... • Variedad y complejidad de datos: existen infinidad de fuentes

4

Implicaciones para los líderes de TICuando se combinan todas esas tendencias, se complica mucho más el proceso de gestión de los datos, precisamente cuando las organizaciones han tomado conciencia de que los datos constituyen la fuerza motriz de la transformación digital.

Se trata de la ocasión idónea para fomentar el liderazgo basado en datos que asegure el éxito de la organización. Por ejemplo, ¿cómo pueden satisfacer los líderes de TI la demanda de datos óptimos al instante del equipo de negocio sin recurrir a un costoso ejército de desarrolladores?

Dado que, en el mejor de los casos, el presupuesto de TI aumenta solo un poco, existen tres métodos clave para lograrlo:

• Aumentar la automatización y la eficiencia de las tareas y los proyectos de gestión de datos

• Aumentar la disponibilidad del autoservicio para el negocio

• Aumentar la colaboración para fomentar la coordinación entre los equipos técnico y de negocio

Implicaciones para los líderes de negocioLos líderes de negocio se sienten capacitados para impulsar iniciativas revolucionarias y plantear cuestiones que, antes, resultaban inviables por motivos económicos. No obstante, los resultados de sus iniciativas digitales dependen de la calidad de los datos en que se basan.

La prioridad principal debe consistir en trazar un plan para aprovechar al máximo el potencial de todos los datos.

Reviste importancia fomentar la competencia en gestión de datos como base de todas las iniciativas digitales. Es preciso gestionar los datos como activos susceptibles de detección y uso por parte de cualquier usuario de la organización. Además, los datos han de poseer la calidad apropiada para su finalidad: la máxima calidad para las decisiones y las interacciones relevantes o una calidad aceptable para una innovación y una iteración rápidas. En lo que respecta a la tecnología, no es posible satisfacer las necesidades del equipo de negocio si se emplean la codificación manual o un conjunto carente de integración de herramientas de gestión de datos.

Page 7: Inteligencia artificial para - Informatica US · PDF filea escala de cloud y basado en inteligencia artificial), ... • Variedad y complejidad de datos: existen infinidad de fuentes

5

Definición del aprendizaje automatizadoEl aprendizaje automatizado es una técnica mediante la cual los programas, en lugar de actuar como entidades estáticas, adquieren conocimientos a partir de los datos de forma iterativa. Los sistemas de aprendizaje automatizado se emplean para crear modelos basados en entradas que facilitan la realización de predicciones o la toma de decisiones. Dichos sistemas no solo aprenden de los datos, sino que se ajustan a las circunstancias con el fin de arrojar resultados más certeros. Cuantos más datos reciban, más rápido aprenden y más precisos son sus resultados.

Motivos para emplear el aprendizaje automatizado en la gestión de datosPara incrementar la rapidez con que se entregan los datos a las iniciativas de negocio críticas, es indispensable ampliar la automatización. Ahí es donde entra en escena el aprendizaje automatizado. Gracias al aprendizaje automatizado y a la visibilidad de los metadatos de toda la empresa, es posible “enseñar” a las herramientas de gestión de datos a sugerir recomendaciones inteligentes y a automatizar las tareas de gestión de datos. El aprendizaje automatizado no sustituye a los analistas de datos ni a ningún otro usuario, sino que favorece el aumento de la productividad y la eficacia del personal de la organización encargado de la gestión de datos.

El aprendizaje automatizado permite mejorar tareas que resultan tediosas o imposibles de acometer de forma manual. Estos son algunos ejemplos:

1. Detección e identificación

• Reglas de calidad de datos y detección de entidades de negocio

• Búsqueda semántica, identificación de patrones y clasificación de datos

• Detección y notificación de anomalías

2. Operaciones predictivas

• Ráfagas para gestionar los picos de datos

• Priorización de investigaciones de problemas operacionales

• Reparación automática para gestionar los cambios en los entornos

3. Recomendaciones y sugerencias de acciones siguientes

• Sugerencia de conjuntos, transformaciones y reglas de datos

• Mapping automático, limpieza y estandarización de fuentes con destinos

• Integración automática de nuevas fuentes de datos

Base del aprendizaje automatizado en la gestión de datos Para que el aprendizaje automatizado resulte eficaz, hacen falta grandes conjuntos de datos de formación. En el contexto de la gestión de datos, la fuente de datos idónea es un catálogo de datos que abarque toda la empresa. La mayoría de las empresas cuenta con miles de bases de datos, archivos de datos, aplicaciones y sistemas analíticos. Si recopilan los metadatos de todos esos repositorios de datos, las empresas pueden elaborar un catálogo extenso. La combinación del aprendizaje automatizado y un catálogo de datos que ofrezca visibilidad sobre los metadatos de toda la empresa constituye la base para disponer de una inteligencia que afecte de forma positiva y significativa a la productividad en la gestión de datos.

En esta era del cloud, conviene apuntar que este enfoque también tiene validez para las aplicaciones SaaS. Es posible recopilar los metadatos de las aplicaciones SaaS, como Salesforce o Workday, y añadirlos al catálogo empresarial.

Page 8: Inteligencia artificial para - Informatica US · PDF filea escala de cloud y basado en inteligencia artificial), ... • Variedad y complejidad de datos: existen infinidad de fuentes

6

Informatica CLAIRE: “inteligencia” de Intelligent Data Platform Este es el enfoque que plantea Informatica para aumentar la productividad en la gestión de datos con el aprendizaje automatizado:

1. Intelligent Data Platform: ofrecemos una plataforma de gestión de datos integrada de principio a fin para favorecer la máxima productividad. Esta plataforma unificada facilita la gestión unificada de la conectividad, los metadatos y las operaciones, de manera que acelera tanto el desarrollo como la implantación de proyectos de gestión de datos nuevos. La plataforma dispone de un conjunto potente y lógico de funcionalidades que permiten gestionar datos procedentes de fuentes del entorno local, del cloud y del Big Data. El nombre de esta plataforma de datos unificada es Intelligent Data Platform.

Se trata de una plataforma modular: se empieza con una sola herramienta y se añaden otras según las necesidades:

2. Metadatos: hace mucho que Informatica goza de reconocimiento como líder en la gestión de metadatos técnicos y de negocio, pero, ahora, ha ampliado sus funcionalidades en este aspecto mediante la recopilación de un abanico mayor de metadatos de toda la empresa, por ejemplo, los siguientes:

• Metadatos técnicos, como tablas de bases de datos, información sobre columnas y estadísticas de perfiles de datos

• Metadatos de negocio, que capturan contexto sobre los datos, su significado, su pertinencia y su relevancia para diferentes funciones y procesos de negocio

• Metadatos operacionales sobre la ejecución de los sistemas y los procesos, como la última actualización de los datos, la última ejecución del proceso de carga o los datos a los que más se accede

• Metadatos de uso sobre la actividad de los usuarios, entre otros, los conjuntos de datos consultados, los resultados de búsquedas en los que se hace clic o las calificaciones u observaciones aportadas

Soluciones

Productos

IntelligentData Platform

CLOUD BIG DATA TIEMPO REAL/TRANSMISIONES

ENTORNO TRADICIONAL

INTELIGENCIA DE METADATOS UNIFICADOS EMPRESARIALES

SUPERVISIÓN Y GESTIÓN

PROCESAMIENTO

CONECTIVIDAD

INTEGRACIÓN DE DATOS

GESTIÓN DEL BIG DATA

GESTIÓNDE DATOSDE CLOUD

CALIDADDE DATOS

GESTIÓNDE DATOS

MAESTROS

SEGURIDAD DE DATOS

CUSTOMER 360

PRODUCT 360

SUPPLIER 360

REFERENCE 360

DATA LAKE INTELIGENTE

CATÁLOGO DE INFORMACIÓN EMPRESARIAL

GOBIERNODE DATOS

SECURE@SOURCE

Gestión de datosde cloud empresariales

Figura 1: Intelligent Data Platform integra las funcionalidades de gestión de datos con la conectividad compartida, la información operacional y la inteligencia tanto de datos como de metadatos.

Page 9: Inteligencia artificial para - Informatica US · PDF filea escala de cloud y basado en inteligencia artificial), ... • Variedad y complejidad de datos: existen infinidad de fuentes

7

Este conjunto más amplio de metadatos resulta fundamental para el aprendizaje automatizado. Proporciona conjuntos de datos que sirven para “formar” a los algoritmos del aprendizaje automatizado, de modo que se ajusten como sea preciso para arrojar resultados más certeros.

3. Inteligencia: Informatica ofrece con CLAIRE una combinación integrada de metadatos y aprendizaje automatizado (o inteligencia artificial).

Los metadatos recopilados por Intelligent Data Platform suponen una mina de información que permite a los algoritmos de CLAIRE obtener conocimientos sobre el panorama de datos de la empresa. Gracias a esos conocimientos, CLAIRE sugiere recomendaciones inteligentes, automatiza el desarrollo y la supervisión de los proyectos de gestión de datos y se adapta a los cambios experimentados tanto en la empresa como fuera de ella. CLAIRE es el motor de la inteligencia de todas las funcionalidades de gestión de datos de Intelligent Data Platform.

CLAIRE en acción CLAIRE resulta útil para una amplia variedad de usuarios:

• Los desarrolladores de datos cuentan con numerosas tareas de implementación parcial o incluso totalmente automatizadas

• Los analistas de datos localizan y preparan los datos que precisan con mayor facilidad

• Los usuarios de negocio identifican al instante los datos que se deben someter a los controles de cumplimiento y el gobierno de datos prescritos

• Los especialistas en datos interpretan los datos con más rapidez

• Los administradores de datos visualizan la calidad de datos con mayor facilidad

• Los profesionales de la seguridad de datos detectan el uso indebido de los datos, protegen los datos sensibles y demuestran la aplicación de los controles adecuados de manera más sencilla

• Los administradores y los operadores disfrutan de las facilidades del mantenimiento predictivo y la optimización del rendimiento de los procesos de gestión de datos

A continuación se ofrecen algunos ejemplos actuales de uso de la inteligencia que proporciona CLAIRE.

Semejanza de datos inteligenteCLAIRE utiliza técnicas de aprendizaje automatizado como la agrupación en clústeres para detectar datos similares entre miles de bases de datos y conjuntos de archivos. La semejanza de datos inteligente es una de las funcionalidades clave que sirven a varios fines, como identificar los datos, detectar los duplicados, combinar en entidades de negocio campos de datos individuales, propagar etiquetas por distintos conjuntos de datos o recomendar conjuntos de datos a los usuarios.

La semejanza de datos calcula hasta qué punto se parecen los datos de dos columnas. Un enfoque de comparación forzosa de todos los pares de columnas de una configuración empresarial (por ejemplo, unos cien millones de columnas) sería prohibitivo desde el punto de vista del procesamiento. La semejanza de datos, en cambio, aplica técnicas de aprendizaje automatizado para agrupar las columnas similares e identificar las probables coincidencias.

Este proceso funciona en varias etapas. Primero, las columnas se agrupan en clústeres en función de sus características. Luego, se calcula la superposición de datos con valores únicos en cada uno de los clústeres. Por último, se seleccionan los pares más probables para calcular la semejanza de datos mediante los índices de Bray-Curtis y Jaccard.

Page 10: Inteligencia artificial para - Informatica US · PDF filea escala de cloud y basado en inteligencia artificial), ... • Variedad y complejidad de datos: existen infinidad de fuentes

8

Detección inteligente de dominios con etiquetasCLAIRE puede clasificar los campos de datos aplicando etiquetas semánticas a cada una de las columnas. Dichas etiquetas semánticas se denominan dominios de datos.

Por lo general, las etiquetas semánticas se aplican evaluando reglas basadas en expresiones regulares, tablas de referencia u otra lógica compleja de codificación manual. No obstante, resulta tedioso realizar la definición y el mantenimiento de miles de reglas así.

CLAIRE se sirve del concepto de las etiquetas para simplificar en gran medida el proceso consistente en detectar y etiquetar los campos de datos. En el caso de las columnas que no estén clasificadas todavía, basta con que el usuario proporcione una etiqueta (por ejemplo, “fecha de pago de reclamaciones”) que señale de manera sencilla su contenido. El sistema aprende por asociación y, a continuación, propaga esa etiqueta a todas las columnas semejantes de forma automática. Se trata de una técnica parecida al “reconocimiento facial” que permite etiquetar a usuarios de Facebook en una fotografía, pero aplicada a los datos, es decir, equivaldría a etiquetar a las mismas personas en millones de fotos.

Figura 3: Clasificación automática de los datos.

Auto infer domains for columns based on data patterns

Los dominios de las columnas se infieren automáticamente en función

de ciertos patrones de datos

Relationships link all data assets associated with the domain

Las relaciones vinculan todos los activos de datos asociados al dominio

Nombre de la empresa

Correo electrónicoNombreCódigo

postalNúmero de

teléfono

Page 11: Inteligencia artificial para - Informatica US · PDF filea escala de cloud y basado en inteligencia artificial), ... • Variedad y complejidad de datos: existen infinidad de fuentes

9

Detección inteligente de entidadesUna vez identificados los dominios de las columnas, CLAIRE ensambla esos campos individuales en entidades de negocio de carácter más general. En el ejemplo siguiente se muestra la creación de una entidad denominada Pedido combinando los campos identificados como Cliente y Producto. Las detección de entidades aprende el método empleado por los usuarios para ensamblar campos de datos dispares en sus procesos de análisis o integración de datos y aplica esos conocimientos para derivar entidades a partir de todos los datos empresariales.

Figura 4: Combinación de dominios de datos para detectar entidades a partir de tablas y archivos.

Recomendaciones de datos inteligentes CLAIRE ofrece a los analistas de datos y a los especialistas en datos sugerencias sobre los conjuntos de datos que les conviene usar en sus proyectos. Analiza los conjuntos de datos seleccionados por los usuarios y propone conjuntos parecidos, pertinentes o complementarios. Gracias a las recomendaciones de datos inteligentes, los usuarios se ahorran repetir el mismo trabajo que quizá hayan realizado colegas con anterioridad. Las recomendaciones incluyen lo siguiente:

1. Una versión preparada de los datos idénticos (datos sustituibles)

2. Otra tabla que contiene los registros del mismo tipo (datos susceptibles de unión)

3. Una tabla susceptible de incorporación a fin de enriquecer los datos con atributos adicionales (datos susceptibles de incorporación)

En las recomendaciones de datos, se emplean técnicas de filtrado basadas en el contenido para ofrecer sugerencias sobre conjuntos de datos adicionales. Se tienen en consideración varias características (condiciones), por ejemplo, el linaje, la calificación de los usuarios y la semejanza de los datos. Para puntuar la equivalencia de los distintos conjuntos de datos, se tienen en cuenta varias medidas de semejanza. Según la puntuación obtenida, se recomiendan conjuntos de datos con propiedades similares. Para recomendar elementos complementarios, se consulta el gráfico de metadatos en busca de conjuntos de datos que suelan utilizar juntos usuarios diferentes.

Page 12: Inteligencia artificial para - Informatica US · PDF filea escala de cloud y basado en inteligencia artificial), ... • Variedad y complejidad de datos: existen infinidad de fuentes

10

Detección inteligente de estructuras CLAIRE deriva estructuras a partir de archivos desorganizados de registros y de dispositivos para que resulten más fáciles de interpretar y manejar. Al analizar los archivos con un enfoque basado en el contenido, se adapta a los cambios frecuentes en los archivos sin que el procesamiento de estos se vea afectado.

La detección inteligente de estructuras aplica un algoritmo genético para automatizar el reconocimiento de patrones en los archivos. En este enfoque, se emplea el concepto de “evolución” para mejorar los resultados. Cada candidato propuesto posee una serie de propiedades susceptibles de modificación y comprobación posterior para determinar si se trata de la solución más acertada. No hace falta que el usuario defina la estructura del archivo, ni se restringe a un conjunto concreto de formatos de archivo de un sector. Las estructuras iniciales del archivo se derivan en función de un análisis básico basado en delimitadores. A continuación, se puntúan conforme a distintos factores, como la cobertura de entrada y los dominios derivados. Las estructuras que reciben la mayor puntuación entran, entonces, en una fase de “mutación” durante la cual se les aplican varios cambios, por ejemplo, combinar subestructuras para averiguar si sube su puntuación. El proceso finaliza cuando se confirma la idoneidad de la estructura para los datos.

Figura 5: Búsqueda inteligente de estructuras en archivos de datos no estructurados.

Page 13: Inteligencia artificial para - Informatica US · PDF filea escala de cloud y basado en inteligencia artificial), ... • Variedad y complejidad de datos: existen infinidad de fuentes

11

Detección inteligente de anomalíasCLAIRE aplica dos enfoques, de estadística y de aprendizaje automatizado, para detectar los datos atípicos y las anomalías en los datos. La funcionalidad de análisis de comportamiento de los usuarios detecta los patrones de conducta de los usuarios que pueden poner en riesgo la organización por favorecer el uso indebido de los datos. El análisis de comportamiento de los usuarios detecta los ataques de suplantación, apropiación de credenciales y escalado de privilegios.

El análisis de comportamiento de los usuarios aplica el aprendizaje automatizado sin supervisión a un modelo multidimensional de actividades del usuario, el cual incluye el número de almacenes de datos a los que accede, el número de solicitudes que presenta y el número de registros afectados en los distintos sistemas. A este modelo se le aplica el análisis de componentes principales para reducir la dimensionalidad. La técnica de reducción y agrupación iterativas equilibradas mediante jerarquías se aplica a la agrupación jerárquica en clústeres sin supervisión con el fin de hallar usuarios cuya conducta haya variado durante un período determinado. Para validar las conductas anómalas, se emplean métodos de detección de datos atípicos basados en la distancia y la densidad y, para confirmar que los objetos señalados con los dos primeros métodos son de verdad datos atípicos en el sistema del clúster, se ejecuta la prueba estadística de Grubbs.

Estas son algunas de las funcionalidades de CLAIRE que se van a incluir próximamente:

Integración automática: integrar de forma automática los datos recién vertidos a los procesos de integración de datos; identificar datos, buscar patrones de integración que procesen datos semejantes y transformar y trasferir automáticamente los datos sobre la base de los conocimientos adquiridos a partir de millones de mappings y acciones de usuarios existentes.

Ayuda para el desarrollo: ofrecer a los usuarios recomendaciones y sugerencias de acciones siguientes durante el proceso de desarrollo, por ejemplo:

• Finalización automática de transformaciones

• Recomendaciones de plantillas

• Sugerencias de tipo de enmascaramiento de datos sensibles

• Sugerencias de calidad de datos para la limpieza y la estandarización

• Optimizaciones automáticas del rendimiento

Mapping automático: detectar entidades de datos maestros en toda la empresa y asignarlas de forma automática al modelo de datos maestros aplicando las transformaciones y las reglas de calidad necesarias

Reparación automática: gestionar sin dificultad problemas de sistema externos, como la falta de memoria o los relacionados con la potencia de procesamiento, por ejemplo, añadir potencia de procesamiento (ráfagas al cloud) para gestionar los picos de datos

Ajuste automático: predecir la programación o los recursos informáticos basándose en la información histórica, los volúmenes de datos actuales y los recursos de sistema disponibles y ajustarlos de modo que satisfagan los criterios de rendimiento

Protección automática: detectar automáticamente los datos sensibles y enmascararlos antes de que abandonen cualquier zona segura

Page 14: Inteligencia artificial para - Informatica US · PDF filea escala de cloud y basado en inteligencia artificial), ... • Variedad y complejidad de datos: existen infinidad de fuentes

Informatica en España: José Echegaray 8, edif. 3, PB 3, 28232 Las Rozas, Madrid. Teléfono: 902 882 062. Fax: 91 754 29 50. www.informatica.com/es linkedin.com/company/informatica twitter.com/Informatica© 2017 Informatica LLC. Todos los derechos reservados. Informatica, el logotipo de Informatica y CLAIRE™ son marcas comerciales o marcas comerciales registradas de Informatica LLC en Estados Unidos y en jurisdicciones de todo el mundo. La lista actualizada de marcas comerciales de Informatica se encuentra disponible en esta web: https://www.informatica.com/es/trademarks.html. Otros nombres de empresas y productos pueden ser nombres comerciales o marcas comerciales de sus respectivos propietarios. IN09_0517_3328

Conclusión Las actuales estrategias de negocio centradas en los datos se basan en los datos. Para que tengan éxito, es indispensable fomentar la competencia en la gestión de datos, de modo que se aproveche todo su potencial.

En vista de todos los retos que la gestión de datos plantea en circunstancias normales, es imposible que los enfoques tradicionales satisfagan los requisitos actuales, mucho menos los futuros. Es posible utilizar los datos de forma revolucionaria estandarizándolos en una plataforma de gestión de datos de principio a fin que aproveche el potencial de los datos, los metadatos, el aprendizaje automatizado y la inteligencia artificial para aumentar la productividad de todos sus usuarios, técnicos, operacionales y de negocio y, en particular, de los usuarios de negocio de autoservicio.

Póngase en contacto con nosotros para aprender a sacar más partido a los datos con CLAIRE e Intelligent Data Platform.

Acerca de InformaticaLa transformación digital está cambiando nuestro mundo. Como líderes en gestión de datos de cloud empresariales, le brindamos ayuda para que encabece la marcha de forma inteligente y aportamos perspectiva para que aumente su agilidad, concrete nuevas oportunidades de crecimiento o incluso invente cosas nuevas. Le invitamos a explorar todo lo que puede ofrecerle Informatica y a desatar el poder de los datos para impulsar su próxima revolución inteligente. Y no una vez, sino una tras otra.