La preparación de datos es el mayor desafío para las empresas al implementar inteligencia artificial generativa
La Preparación de Datos para la Implementación de IA
Desafíos en la Implementación de IA
La implementación de la inteligencia artificial (IA) representa un desafío significativo para muchas empresas, especialmente en la preparación de datos. Aunque los directores están presionando para adoptar la IA, los ejecutivos de TI, como los directores de información, reconocen que la situación es más compleja que tener un caso de uso sólido. Prukalpa Sankar, cofundadora de la plataforma de gobernanza de datos Atlan, señala que el verdadero obstáculo no es la creación de modelos de IA, sino la falta de datos listos para su uso. Ella menciona que “todos están listos para la IA, excepto sus datos”.
Estado Actual de la Preparación de Datos
Un estudio global reciente que incluyó a más de 1,300 ejecutivos de tecnología y datos reveló que solo el 18% de las empresas se consideran completamente listas para implementar la IA, lo que significa que sus datos son accesibles y están unificados. Otro 40% considera que están mayormente listos, pero no han alcanzado la preparación total. Para lograr esta preparación, deben superar varios obstáculos.
Organización y Clasificación de Datos
El primer reto consiste en encontrar y organizar todos los datos, una tarea que recae principalmente en los ingenieros de datos. Sankar explica que es necesario reunir datos aislados en diferentes unidades de negocio para utilizarlos en un caso de uso específico. Además, las empresas deben llevar a cabo un proceso complejo de etiquetado y clasificación de datos, crucial para asegurar que los datos privados se manejen adecuadamente. Por ejemplo, un chatbot de recursos humanos puede acceder a datos de nómina, mientras que un chatbot general no debería tener acceso a esa información.
La Gobernanza de Datos en la Era de la IA
Esto se enmarca dentro de la gobernanza de datos, que se refiere a cómo una empresa gestiona sus activos de datos a través de políticas, procesos y estándares. Matt Carroll, CEO y cofundador de la plataforma de seguridad de datos Immuta, indica que aunque la gobernanza de datos no es un concepto nuevo, la IA transforma la manera en que se gestiona. Según Carroll, la gobernanza tradicional se basaba en un sistema estructurado y eficiente, pero con la llegada de la IA, este enfoque ya no es suficiente.
Las empresas deben estar preparadas para agregar constantemente nuevos datos para respaldar los modelos de IA, tanto de fuentes internas como externas. Carroll resume la preparación para la IA en tres aspectos fundamentales: las empresas deben ser capaces de encontrar los datos, utilizarlos y observar cómo se están utilizando.
La Importancia de la Gobernanza de Datos
La madurez de una pipeline de gobernanza de datos no es común en todas las industrias. Un informe de preparación para la IA de 2024 elaborado por el MIT encontró que la gobernanza de datos, la confianza y la seguridad son áreas de mayor enfoque en instituciones gubernamentales y financieras en comparación con otros sectores. Carroll enfatiza que esta práctica debe extenderse más allá de los bancos y el gobierno, ya que no son las únicas industrias que manejan datos sensibles.
Las empresas que buscan implementar soluciones de IA, ya sean generativas o de otro tipo, deben mantener un diálogo constante entre TI, el departamento legal y otros ejecutivos de la organización, así como con los departamentos a los que estos se dirigen.
Mecanismos para la Preparación Continua de Datos
Carroll aboga por que las empresas implementen un enfoque continuo hacia la preparación de datos, incluso después de haber comenzado a desplegar la IA. Una de las formas de lograr esto es a través de un hotline de IA, que puede ser un canal de Slack en una empresa pequeña o una línea de atención dedicada en una más grande. Es crucial que los expertos en el dominio tengan una línea directa con el equipo de ingeniería para reportar problemas, como errores o etiquetado incorrecto de datos.
Carroll sugiere establecer un ciclo de retroalimentación, donde un comité de revisión de modelos pueda reevaluar o eliminar un modelo si es necesario. Este proceso no debería verse como negativo, sino como parte del proceso de la IA. Además, es esencial realizar pruebas continuas en los modelos para detectar comportamientos anómalos y asegurar que cumplan con los estándares de calidad de la empresa.
Creación de Puntuaciones de Preparación para la IA
Desde el inicio de sus trayectorias en la implementación de IA, Sankar ha observado que las empresas están creando puntuaciones de preparación para la IA para ayudar a cuantificar el proceso de organización de sus datos. Esta puntuación medible podría clasificar un conjunto de datos en una escala de 5.0, según diversos factores. Sankar destaca que “a menos que se mida, nada se mueve”.
Nuevos Roles en la Gobernanza de Datos
Otra tendencia que los expertos han notado es la incorporación de un título secundario de administrador de datos en el rol principal de un empleado. Carroll explica que, aunque una persona esté en el negocio y conozca bien su dominio, ahora también se espera que sea responsable de un conjunto de datos que podría ser utilizado para la IA. Además, los gobernadores de datos altamente especializados, que podrían tener títulos como ejecutivos de gobernanza de datos o ingenieros de gestión de datos, son cada vez más difíciles de encontrar, pero su importancia está en aumento.
La Infraestructura de Datos como un Mercado
Sankar compara el ecosistema de infraestructura de datos con un mercado. “De un lado del mercado tienes casos de uso de IA listos para el negocio”, dice, “y del otro lado está tu complicada infraestructura de datos”. Para las organizaciones que buscan implementar la IA, los expertos coinciden en que la preparación de datos debe ser la prioridad número uno. Sin embargo, incluso la amplia categoría de preparación de datos se descompone en aspectos más específicos.
Preguntas Éticas en la Preparación de Datos
Antes de abordar el primer paso, Carroll menciona que es pertinente plantear una pregunta que puede no ser bien recibida en la alta dirección: “En la preparación de datos, también hay una cuestión de si deberías hacerlo en absoluto”. Esto implica que cada empresa debe tomar decisiones éticas sobre si deben o no exponer ciertos tipos de datos en sus sistemas. Solo con ese visto bueno, las empresas pueden realmente perseguir la preparación para la IA.