Con la explosión de diferentes tipos de datos, las empresas luchan por obtener un valor significativo de sus datos almacenados. Los equipos de datos están sobrecargados de trabajo, obligados a satisfacer las necesidades de diferentes departamentos dentro de una organización mientras intentan mantener políticas de datos coherentes.
Esta es la tesis común de Shirshanka Das y Swaroop Jagadish, al menos los cofundadores de Datos acrílicos, una startup que proporciona herramientas para ayudar a las empresas a organizar y aparentemente administrar mejor sus datos. Acryl anunció hoy que ha recaudado $21 millones en una ronda de financiación Serie A liderada por 8VC con la participación de Sherpalo Ventures y Guillermo Rauch, fundador y director ejecutivo de Vercel, lo que eleva el total recaudado a $30 millones de dólares.
Antes de lanzar Acryl Data, Das fue ingeniero principal de software en LinkedIn y, antes de eso, miembro de equipos técnicos primero en PayPal y luego en Yahoo! (divulgación completa: propietario de TechCrunch). Jagadish llegó a Acryl a través de Airbnb, LinkedIn y Yahoo!
«Acryl Data es una plataforma de metadatos impulsada por la comunidad que proporciona controles centrales sobre la pila de datos descentralizada», dijo Jagadish, el CTO, a TechCrunch en una entrevista por correo electrónico. «Con la misión de brindar claridad a los datos, Acryl ofrece un catálogo de datos con soluciones para el descubrimiento de datos, el gobierno, el linaje y la observabilidad».
¿Qué es exactamente un catálogo de datos? Bueno, es un inventario de activos de datos en una organización. Los catálogos de datos consisten en metadatos en los que se almacenan las definiciones de los objetos de la base de datos, como tablas base, índices, usuarios y grupos de usuarios.
Los catálogos de datos son una moneda de diez centavos la docena; vea cómo los ofrecen nuevas empresas como Castor, Stemma, Select Star y Alation, por nombrar algunas. Pero Jagadish argumenta que el enfoque de Acryl ofrece varias ventajas clave sobre sus rivales.
La principal de ellas es la plataforma de Acryl, que se basa en el marco DataHub de código abierto, se ejecuta en metadatos «impulsados por eventos». Al realizar operaciones solo cuando se activa, Acryl puede reducir el costo de mantener el catálogo de datos al tiempo que habilita una variedad de flujos de trabajo basados en activadores, afirma Jagadish.
“La explosión de datos durante la última década ha llevado a las empresas a adoptar una gama de nuevas tecnologías, pero también ha creado un panorama de datos fragmentados”, agregó. «Algunos problemas se han vuelto más fáciles, como la orquestación, la transformación, el almacenamiento, el movimiento y la visualización de datos, pero otros problemas han resurgido como desafíos, como el descubrimiento de datos, la calidad de los datos y la gestión de datos. Los intentos de resolver el problema, como como herramientas tradicionales de gobernanza y observabilidad, se han aislado innecesariamente, lo que ha dado lugar a más ineficiencias y soluciones inconsistentes… Acryl está diseñado para ayudar a los equipos a pasar de la simple visibilidad de los datos al conocimiento de los datos, del conocimiento a la acción y de la acción a la automatización”.
Más allá de eso, Acryl ofrece un módulo de «observabilidad» destinado a monitorear la calidad de los datos en tiempo real. El módulo, acertadamente llamado Observer, monitorea e intenta detectar problemas de calidad de datos; en teoría, ayuda a prevenir interrupciones de datos y acelera las resoluciones donde ocurren.
Con Acryl, los clientes también pueden realizar pruebas de metadatos, lo que revela áreas de optimización de costos, como activos de datos costosos o infrautilizados. Los monitores configurables que impulsan estas pruebas permiten a los usuarios definir y evaluar continuamente un conjunto de condiciones en los activos de datos de una organización.
«Nuestro ‘competidor’ más común es el statu quo del desarrollo personalizado, ya que los ingenieros de datos establecen procesos y protocolos manuales por sí mismos en lugar de implementar una solución más automatizada», dijo Jagadish.
Acryl tiene planes ambiciosos para el futuro, incluidas las capacidades de inteligencia artificial que «curan de manera inteligente» los metadatos y sugieren etiquetas y términos del glosario comercial para documentar aún más los catálogos de datos. Además, la compañía tiene como objetivo lanzar una herramienta impulsada por IA para generar resúmenes que describan las características clave de un catálogo de datos determinado, como su confiabilidad y uso.
Acryl, que emplea a 25 personas, no divulga demasiado a su clientela. Pero la startup reveló que cuenta con Notion, Zendesk, Robinhood, OVO Energy, BetterUp y Riskified entre sus clientes.
Jagadish agregó que DataHub, que fundó mientras estaba en LinkedIn y administrado por el personal de Acryl, es utilizado por compañías como Pinterest, Stripe, Optum, Expedia, Saxo Bank y Peloton. Él es optimista de que las características que Acryl construye sobre DataHub convencerán al menos a algunos de ellos para que se conviertan.
«El rápido ritmo de cambio en el ecosistema de datos está desafiando tanto a las empresas como a los proveedores», dijo Jagadish. «Aunque inevitablemente surgen problemas, Acryl aumenta la productividad de los equipos de datos. Los usuarios comerciales tienen un recurso central para hacer y responder preguntas, en lugar de procesos ad hoc para cada problema, mientras que los profesionales de datos pueden usar las funciones de análisis de impacto y linaje de Acryl para reducir drásticamente el tiempo para resolver problemas de datos.
