iBlog
10 ene. 2022

Big Data e Inteligencia Artificial: un mar de términos por clarificar

by Pedro I. Moreno Cuéllar | Responsable Transformación Digital

Big Data e Inteligencia Artificial: un mar de términos por clarificar 

Casi todas las soluciones empresariales de renombre con las que trabajamos a diario emplean de forma intensiva en su discurso comercial términos como Big Data, Inteligencia Artificial o Business Intelligence.Y todos entendemos que para nuestro negocio dichos complementos pueden ser diferenciales, en el sentido de que me van a permitir tomar mejores decisiones. Pero, ¿conocemos de verdad las implicaciones y el potencial de cada tecnología? Descubre en este artículo todo lo que necesitas saber.

Rara es la solución de software que a día de hoy no tiene en su Road Map de desarrollo de producto la implementación de soluciones de Big Data e Inteligencia Artificial. Seamos sinceros, a todos nos motiva el hecho de tener en nuestra empresa un software que no sólo nos va a solucionar la vida, como prometen tantos, sino también que lo va a hacer con el uso de las últimas tecnologías.

Por un lado, porque sabemos que apostar por estas tecnologías, aunque en sí las desconozcamos, es un valor seguro, porque no paramos de oír hablar sobre sus bondades a todos los niveles. Y por otro, porque sabemos que de cara a nuestros potenciales clientes el uso de estas tecnologías puede ser un gran activo comercial.

No obstante, el hecho de emplear estos habilitadores denota la clara apuesta de mi empresa por el I+D+i, y todos sabemos cuánto valoran las empresas el hecho de apostar por soluciones de presente y futuro con una escalabilidad presupuesta y capaces de crecer al mismo ritmo que yo.

Luego, asumiendo la gran importancia que pueden tener estas tecnologías dentro de mi portfolio de productos y servicios, es importante tener unas nociones mínimas de todo lo que compete a cada tecnología. Un mundo lleno de terminologías y conceptos, a veces ambiguos, que vamos a intentar clarificar.

1. Big Data

“Cuando hablamos de Big Data nos referimos a conjuntos de datos o combinaciones de conjuntos de datos cuyo tamaño (volumen), complejidad (variabilidad) y velocidad de crecimiento (velocidad) dificultan su captura, gestión, procesamiento o análisis mediante tecnologías y herramientas convencionales, tales como bases de datos relacionales y estadísticas convencionales o paquetes de visualización, dentro del tiempo necesario para que sean útiles.” POWERDATA.

1.1. Tipos de Big Data

Podemos clasificarlos según dos criterios: procedencia y estructura. Así, según su procedencia, los datos pueden llegar desde distintas fuentes, entre otras:

  • Web y Redes Sociales: información disponible en Internet, como contenido Web, generada por los usuarios en su actividad en las redes sociales o información de búsquedas en buscadores.
  • Machine-to-Machine (M2M): datos generados a partir de la comunicación entre sensores inteligentes integrados en objetos de uso cotidiano.
  • Transacciones: incluye registros de facturación, llamadas o transacciones entre cuentas.
  • Biométricos: datos generados por tecnología de identificación de personas mediante reconocimiento facial, de huellas dactilares o mediante información genética.
  • Generados por personas: a través de correos electrónicos, servicios de mensajería o grabaciones de llamadas.
  • Generados por organizaciones tanto públicas como privadas: datos relacionados con el medioambiente, estadísticas gubernamentales sobre población y economía, historiales clínicos electrónicos, etc.

Por otro lado, según su estructura los datos pueden ser:

  • Estructurados: datos que tienen definidos su formato, tamaño y longitud, como las bases de datos. A menudo son datos numéricos, así que, en muchos casos, los gestionan máquinas y no humanos. Este tipo de datos es información que ya está ordenada en bases de datos relacionales o SQL, en hojas de cálculo, Data Lakes y/o Data Warehouse.
  • No estructurados: datos sin formato específico que están desorganizados y no están en un formato predeterminado porque pueden ser casi cualquier cosa, como ficheros de texto (Word, PDF, correos electrónicos) o contenido multimedia (audio, vídeo, o imágenes), almacenados en forma de clústeres o sistemas NoSQL.
  • Semiestructurados: datos almacenados según una cierta estructura flexible y con metadatos definidos, como XML y HTML, JSON, y las hojas de cálculo (CSV, Excel). Pueden contener ambas formas de datos (estructurados o no estructurados), como registros de servidores web o datos de sensores que haya configurado. Para ser precisos, son datos que, a pesar de no estar clasificados en un repositorio concreto (una base de datos), contienen información vital o etiquetas que segregan elementos individuales dentro de los datos.

1.2. Soluciones en Big Data

  • Smart Data: El almacenamiento de grandes volúmenes de datos no garantiza que se pueda extraer valor de estos. Queda identificar cuáles son los datos realmente necesarios. Datos que pueden ser procesados e incorporados a los modelos analíticos más avanzados para tratar de obtener ventajas competitivas y eficiencias. Es así como obtenemos el Smart Data, los datos que aportan valor a la empresa.
  • Business Intelligence: Se utilizan para evaluar, optimizar y coordinar las operaciones internas de una compañía. El BI abarca todas las tecnologías, aplicaciones y prácticas para recolectar, integrar y analizar la información sobre el rendimiento y las finanzas para que, a partir de ese análisis, se puedan tomar decisiones para mejorar sus procesos actuales.
  • Business Analytics: Así como el Business Intelligence, el Business Analytics recolecta, analiza datos y genera tableros visuales. Sin embargo, la gran diferencia radica en el enfoque del análisis de los datos. El Business Analytics generalmente implica análisis estadístico y de modelos predictivos para establecer tendencias, averiguar por qué suceden las cosas y hacer una estimación informada sobre cómo se desarrollarán las cosas en el futuro. Hay cuatro tipos principales de análisis:
    • Analítica descriptiva: El análisis descriptivo ilustra lo que sucedió en el pasado utilizando los datos históricos disponibles y muestra los datos en una forma o visualización fácilmente comprensible. En general, los datos se ilustran mediante gráficos, diagramas de barras, diagramas circulares, mapas, diagramas de dispersión, etc. En resumen, se realiza un análisis descriptivo para comprender o ilustrar los patrones en los datos.
    • Análisis predictivo: Extrapola los datos disponibles para predecir lo que puede suceder en el futuro. Las herramientas que se utilizan para el análisis predictivo son el análisis de series de tiempo utilizando métodos estadísticos y otros algoritmos de minería de datos. El análisis predictivo generalmente se realiza para predecir qué eventos pueden suceder en el futuro.
    • Análisis exploratorio: Encuentra correlaciones o relaciones ocultas entre características en los datos. Esto nos ayuda a estimar valores para una característica dependiente cuando hay información disponible para las características independientes. El análisis exploratorio se realiza básicamente para determinar la causa detrás de los eventos que han sucedido en el pasado.
    • Análisis prescriptivo: Se utiliza para descubrir el mejor resultado de eventos pasados ​​cuando se dan las características de los datos y los parámetros operativos de un sistema. Ayuda a desarrollar estrategias para eventos futuros en condiciones similares. Las técnicas involucran herramientas de simulación y estas simulan las condiciones de operación o características para finalmente llegar al mejor resultado. Las técnicas de simulación establecen estrategias para planificar eventos similares en el futuro. La analítica prescriptiva se realiza básicamente para saber cómo se pueden hacer que ocurran los eventos preferibles en el futuro. Ejemplo: análisis de flujo de potencia, etc.

 

 2. Inteligencia Artificial

“La inteligencia artificial o IA (Artificial Intelligence o AI en inglés) es la simulación de procesos de inteligencia humana por parte de máquinas, especialmente sistemas informáticos. Estos procesos incluyen el aprendizaje (la adquisición de información y reglas para el uso de la información), el razonamiento (usando las reglas para llegar a conclusiones aproximadas o definitivas) y la autocorrección.” TECHTARGET.

2.1. Tipos de Inteligencia Artificial

  • Machine Learning (aprendizaje automático o aprendizaje de máquinas): Es la capacidad que tiene una IA, un software o un robot para aprender por su cuenta. Sigue los pasos clásicos de la IA: Aprendizaje, entrenamiento y resultados. Y puede ser de 2 tipos: Supervisado (el desarrollado le dice lo que hace bien o mal) o no supervisado (la propia IA tiene que aprender a descubrir lo que hace bien y lo que hace mal, en función de unas reglas que diseña el desarrollador)
  • Sistema experto: Son sistemas que trabajan a través de lógica racional. Intenta emular a un experto humano en una determinada materia. Desde un trabajador de atención al cliente a una escritora, un comentarista de deportes o un médico.
  • Deep Learning (aprendizaje profundo): Es un tipo de aprendizaje automático cuyo objetivo va más allá, abarcando y procesando más datos al mismo tiempo. Utiliza redes neuronales para aprender a través de capas de información cada vez más abstractas, como haría nuestro cerebro. Resulta esencial para trabajar con grandes cantidades de datos.
  • Redes neuronales: A diferencia de otros sistemas que imitan el comportamiento del cerebro humano, las redes neuronales intentan copiar el comportamiento de las neuronas. Una neurona artificial recibe datos de entrada, aplica operaciones matemáticas y una función de activación y genera un resultado. Es un mecanismo sencillo, pero la complejidad llega cuando millones de neuronas trabajan en paralelo para crear Redes Neuronales Artificiales o RNA. No siguen órdenes, sino que se asocian entre sí y cambian sus entradas y salidas mediante el aprendizaje y el error según la tarea encomendada.

 

2.2. Soluciones en Inteligencia Artificial

Aunque existen multitud de soluciones, vamos a nombrar las más destacadas:

  • Visión artificial: Engloba todas las aplicaciones industriales y no industriales en las que una combinación de hardware y software proporciona orientación operativa a los dispositivos en la ejecución de sus funciones basándose en la captura y el procesamiento de imágenes. La visión artificial no debe confundirse con la visión por ordenador, aunque la diferencia es sutil. Esta última se centra en comprender las imágenes digitales después de procesarlas y analizarlas, es decir, de extraer todos los detalles posibles. Por el contrario, la artificial no necesita analizar todos los detalles de la imagen, sino solo aquellos que impulsen a realizar una acción determinada. Por ejemplo, la visión artificial de un coche autónomo solo se preocupa de detectar obstáculos para evitar colisiones.
  • Inteligencia Semántica: Es un conjunto de tecnologías de análisis automático de miles de datos con vistas a establecer correlaciones y razonamientos con una lógica en su interpretación similar a la humana. Así, la inteligencia semántica, puede establecer relaciones y sacar conclusiones que de otro modo, dada la gran cantidad de información, sería difícil de asimilar.
  • Procesamiento de Lenguaje Natural (PLN): Consiste en transformar el lenguaje natural en un lenguaje formal como el de la programación, que los ordenadores puedan procesar. Esta técnica puede utilizarse para clasificar textos según su contenido para elaborar chatbots (como en el ejemplo, es un sistema de respuestas automáticas según el contenido de las preguntas), traducir entre lenguas, redactar documentos, recuperar información, etc.

 

Para terminar, sólo me gustaría recordarte que Inforges es siempre una apuesta segura para poner en verdadero valor todo el potencial de tu ecosistema de datos. Desde el departamento de Transformación Digital queremos apoyarte para que puedas tomar siempre las mejores decisiones. Y ahí es dónde el poder del dato cobra valor. Así que si te interesa el tema, por favor, no dudes en contactarnos en pimorenoc@inforges.es

Big Data e Inteligencia Artificial: un mar de términos por clarificar


Contacta con nosotros

  Otros artículos relacionados: