¿Listo para pasar a la acción y acelerar la innovación? Lee nuestro Flipbook de Innovación

Synthetic Data: Información diseñada para adiestrar a las IAs

Synthetic Data: Información diseñada para adiestrar a las IAs

Synthetic Data: Información diseñada para adiestrar a las IAs

Al igual que las celebridades del museo de cera o las versiones en pastel de objetos domésticos, los datos sintéticos pueden ser difíciles de distinguir de los reales. Synthetic Data: Información diseñada para adiestrar a las IAs.

Puedes pensar en ellos como datos que se leen, ven o actúan como si hubieran sido recopilados de personas reales. En realidad, han sido creados por una inteligencia artificial. Así es como funciona: los algoritmos de aprendizaje profundo se entrenan con datos del mundo real y luego hacen lo que los modelos hacen mejor: marcar patrones y tendencias. Luego, usan estos patrones para crear un conjunto de datos completamente nuevo sin vínculos con ningún individuo real.

El objetivo: preservar tanto la información de los datos como la privacidad personal. Los primeros usuarios de la industria incluyen campos altamente regulados. Algunos ejemplos son la salud, los seguros, la banca y las telecomunicaciones. La inversión en nuevas empresas de datos sintéticos está fluyendo. En octubre, Facebook adquirió AI.Reverie por un monto no revelado. En enero, Mostly AI recaudó 25 millones de dólares. El mes pasado, Synthetaic recaudó 13 millones de dólares.

Synthetic Data: Información diseñada para adiestrar a las IAs

En 2021, el mercado de datos sintéticos valía 110 millones de dólares, según una instantánea de Cognilytica, una empresa de análisis de IA. Para 2027, la firma proyecta que los datos sintéticos tendrán un valor de 1.15 mil millones de dólares. Para 2024, predice Gartner, el 60% de todos los datos de entrenamiento de IA podrían ser sintéticos.

Los datos sintéticos pueden tomar la forma de datos tabulares (registros de compra, transacciones financieras…), imágenes o vídeo. En esta entrada nos centraremos en los datos tabulares.

¿Por qué los datos sintéticos están ganando fuerza?

Los datos personales han sido un producto de moda desde que existe el comercio. Para los minoristas, ayuda a informar el inventario de la tienda. Para las instituciones financieras, participa en las ofertas de tarjetas de crédito y préstamos. En cuanto a las aplicaciones y otras empresas, es algo que pueden monetizar directamente.

Synthetic Data: Información diseñada para adiestrar a las IAs

Los sistemas modernos de IA necesitan más y más datos de alta calidad para entrenar. Grandes cantidades de este tipo de datos son difíciles de localizar y propensos a sesgos. Al mismo tiempo, las leyes de privacidad se hacen cada vez más estrictas. Algunos ven una solución en los datos sintéticos.

En el frente de la privacidad, la investigación sugiere lo fácil que es volver a identificar datos anónimos. Esto es sin importar cuánta información sobre un individuo se haya eliminado o modificado.

«Las técnicas que se desarrollan en la era de los datos pequeños simplemente no funcionan para estos ricos datos de comportamiento que tenemos hoy en día. Esto es porque todo el mundo tiene esta huella digital única que hace que sea tan fácil volver a conectar un conjunto de datos supuestamente anonimizados tradicionalmente con otra información flotando por la web». Esto es lo que dijo Alexandra Ebert, directora de Mostly, una compañía de datos sintéticos con sede en Viena.

Además, los datos recopilados del mundo real generalmente reflejan racismo, sexismo y otros sesgos que se encuentran en la sociedad. Los algoritmos entrenados con esos datos pueden aprender y propagar esos patrones a gran escala. Los datos sintéticos podrían ayudar a hacer posible la realización de auditorías más profundas de los sistemas de IA de lo que es posible con los datos tradicionales.

Comentarios
Subscribirse
Notificar de
guest
0 Comentarios
Comentarios online
Ver todos los comentarios
Agenda próxima
No hay eventos próximos
Destacados
Otros artículos
Podcasts
EP123: Simulación molecular en la Universidad Andrés Bello usando AWS
*
*
*
El nombre de usuario o nick es el nombre público para comentarios y foro. ¡Eligelo bien, luego no se puede cambiar!
*
*
    Fuerza: muy débil
    *
    Al registrarse en decisores, acepta los Términos del sitio web y la política de privacidad
     
    *
    *
     

    Únete a los decisores

    Súmate a la comunidad de directivos que afronta todos los retos de un comité de dirección.

    Iniciar sesión
    *
    *
     
     
    Contraseña olvidada
    Por favor, introduce tu usuario o tu correo electrónico.
    *
     

    ¡Mantente informado! y únete a nuestro canal de Telegram

    ¡Hola! hemos visto que te ha interesado esta noticia, tenemos un canal de Telegram donde las comentamos ¿Quieres unirte?

    0
    Nos encanta oír tus pensamientos, por favor deja un comentariox