Si entras en la página del gigante del comercio electrónico Alibaba, un servicio de compra al por mayor que es una especie de respuesta china a eBay, verás imágenes y descripciones de cualquier cosa que quieras comprar, desde fregaderos de cocina hasta yates de lujo.
Cada producto tiene un título corto, pero en su mayoría son poco más que una lista de palabras clave: términos de búsqueda elegidos para asegurarse de que ese cargador USB de celular o ese par de overoles ignífugos emerjan primeros en un mar de miles y miles de productos similares.
Parece fácil, pero tiene un cierto arte.
Alibaba, sin embargo, reveló recientemente que está entrenando Inteligencia Artificial (IA) para que genere esas descripciones de forma automática.
Y no son los únicos.
En las últimas décadas, la Inteligencia Artificial ha sido enseñada a componer música, pintar cuadros o escribir (malos) poemas. Ahora escribe también texto de anuncios, a un ritmo de 20.000 líneas por segundo.
"Los bots generativos son el nuevo chatbot", explica Jun Wang, del University College London. "Generar texto es solo una de sus aplicaciones".
El texto ideal a un par de clics
Lanzado por la rama de marketing digital de Alibaba (Alimama), el escritor de texto por Inteligencia Artificial aplica el aprendizaje profundo (deep learning) y la tecnología de procesamiento del lenguaje natural a millones de descripciones de productos en las páginas Tmall y Taobao de Alibaba para generar nuevo texto.
"La herramienta elimina la incomodidad de tener que pasar horas buscando inspiración para el diseño mirando los listados de los competidores y las páginas de los fabricantes", dice un portavoz de Alibaba. "El usuario puede crear su texto ideal con solo un par de clics".
Más allá de sus incursiones en el mundo del arte, crear texto insulso como el que se utiliza en un anuncio es donde los sistemas generadores van a tener un mayor impacto en el corto plazo.
El software producirá millones de palabras e imágenes que verán, e influirán, sobre millones de personas cada día.
Y si hacen el trabajo lo suficientemente bien, nunca nos daremos cuenta de la diferencia.
La línea entre lo que es agencia de los hombres y de las máquinas ya está difuminada en internet.
Los bots de Twitter diseminan semillas de desinformación, los bots de spam generan correos extrañamente poéticos sobre el Viagra, y los agregadores automáticos encuentran y republican artículos de noticias online tan rápido que puede ser difícil determinar quién publicó antes qué y cuándo.
"Bienvenidos al futuro"
Consideremos las noticias sobre el redactor de Alibaba. La versión en inglés de la nota de prensa fue utilizada por varios sitios de noticias, en su mayoría de Reino Unido, Estados Unidos e India.
Pero entre esos primeros reportes aparecía un video en un desconocido canal de Youtube llamado "Breaking News" ("Últimas noticias").
Ahí, una voz sintetizada lee la noticia, con subtítulos que aparecen sobre una serie de imágenes de archivo relacionadas con Alibaba y el comercio electrónico.
Y escondido en la descripción del video hay un vínculo a la fuente del texto: un artículo publicado hace más o menos una hora antes por el International Business Time, una página web con base en India.
La rapidez y la extraña chapucería con la que se reutilizó la historia original ?los subtítulos están copiados encima como si fueran parte del texto principal? sugieren que el video se generó de forma automática.
También lo hace el hecho de que, además del video de Alibaba, el canal parece no postear nada que no sean reportes de noticias sobre fútbol internacional, también republicadas a partir de otras fuentes.
Es posible que alguien esté eligiendo qué historias republicar, pero no se ve ningún tipo de actividad humana en el canal ni en la cuenta de Twitter asociada al mismo.
Así que tenemos noticias sobre una Inteligencia Artificial producida por otra. Bienvenidos al futuro: al mismo tiempo raro y mundano.
"No es ciencia ficción", dice Wang.
Herramienta simple
El investigador de UCL cree que la publicidad es un entorno ideal para la Inteligencia Artificial generadora porque tiene un objetivo claro. "Lo que quieres es maximizar el número de personas que hacen clic y luego compran", dice. "No estamos hablando de generar arte".
Según Alibaba, utilizar esta herramienta es simple. Proporcionas un vínculo al objeto para el cual quieres una descripción y luego haces clic en un botón. "Esto genera numerosas ideas de texto y opciones", dice el portavoz de Alibaba.
"El usuario puede entonces alterar todo, desde la duración al tono, como le parezca mejor".
La herramienta es también prolífica. Alibaba dice que puede producir 20.000 líneas de texto por segundo y que se está utilizando casi un millón de veces al día por parte de empresas ?incluso por la marca de ropa estadounidense Dickies? que quieren crear múltiples versiones de anuncios que sigan consiguiendo llamar nuestra atención cuando se presentan en espacios de distintos tamaños en las páginas web.
Y no solo lo hace Alibaba. Su principal rival, JD.com, dice que también utiliza software, que llama "robot de Inteligencia Artificial escritor" para generar descripciones de productos.
Según la página web de tecnología ZDNet, el sistema de JD.com puede producir más de1.000 "piezas de contenido" al día y tiene una debilidad por el lenguaje florido, describiendo por ejemplo los anillos de boda como un símbolo de "gotas de santo matrimonio del cielo".
Escepticismo
Mark Riedle, del Instituto de Tecnología de Georgia, es escéptico sobre que esas herramientas sean tan buenas como sugieren todas estas relaciones públicas favorables.
Incluso si ignoramos la afirmación en la nota de prensa de Alibaba de que su redactor de Inteligencia Artificial puede clavar el test de Turing, durante el que la Inteligencia Artificial debe pasar como humano, hay preguntas sobre este enfoque.
Para empezar, no sabemos cuán buenos estos sistemas para conseguir ese objetivo claro de hacer que la gente haga clic y luego compre, un proceso conocido como conversión.
Aprender a producir texto que describe un objeto es, definitivamente, el tipo de cosa en la que los sistemas generadores se han convertido en buenos, dice Riedl. "Puedes tomar una imagen o unas cuantas palabras clave y producir algo que se parece a una descripción de producto".
La Inteligencia Artificial puede reconocer la imagen de una cámara, por ejemplo, buscar lo que sabe sobre este objeto y hacer una corta descripción que parezca escrita por un humano.
Pero esto es solo la mitad del trabajo. "Crear texto trata realmente de long tail (en español larga cola, o agregación de nichos)", dice Riedl.
Para convertir clics en ventas, especialmente cuando la competición por la atención online es tan feroz, necesitas ocuparte de las preocupaciones e intereses específicos de una audiencia particular, posiblemente de nicho.
"No quieres decir solo 'esta es la cámara y estas son las características', quieres decir por qué alguien debería comprarla o por qué esta cámara resuelve problemas que otras no resuelven", dice Riedl.
"Esto requiere mucho más contexto. Vas a querer tener mucha más información sobre tu producto y sobre tu audiencia", explica.
El problema con un enfoque de aprendizaje automático como el que utilizan Alibaba y JD.com es que el sistema generador tenderá a aprender lo más promedio.
"La Inteligencia Artificial es muy buena con los formatos genéricos, pero cuanto más quieras especializar o personalizar, se vuelve un problema mucho, mucho más difícil", dice Riedl. "No creo que estemos ahí todavía".
Quizás no, pero es ahí adonde nos dirigimos.
Publicidad personalizada
Para entender por qué, primero tienes que sumergirte en las formas en que la publicidad está ya personalizada y adaptada a tus hábitos.
Wang, por ejemplo, es cofundador de una empresa llamada MediaGamma, que utiliza el aprendizaje por refuerzo ?un tipo de aprendizaje automático que está detrás también del software de DeepMind AlphaGo?, para ayudar a los anunciantes a comprar espacio de anuncios.
Cuando visitas una página web con anuncios, los que verás probablemente serán diferentes a los que verá otra persona. Esto es porque los anuncios han sido seleccionados específicamente para ti.
Tan pronto como cargas una página web, la página permite a los agentes publicitarios de internet saber quién la está visitando, y entonces comienza una guerra de ofertas de alta velocidad que generalmente involucra a unos 100 anunciantes.
Los ganadores pueden mostrarte sus anuncios. Y todo el proceso termina en 100 milisegundos, más rápido que un abrir y cerrar de ojos.
En ese contexto, la IA de MediaGamma ayuda a los anunciantes a realizar ofertas más inteligentes en esta subasta automática. ¿Cuánto vale la atención de esta persona?
"No necesariamente sabemos quién eres, pero conocemos tu actividad en línea", explica Wang.
Los rastreadores de Google operan en alrededor del 75% de los sitios web más populares. Y las tres redes publicitarias más grandes, Adsense, Admob y DoubleClick, son administradas por Google.
Y hay pocos lugares en Internet en los que Google no puede rastrearte. Y si Google no puede verte, Facebook, que tiene rastreadores en el 25% de esos sitios, probablemente sí.
Esos rastreadores registran lo que buscamos: qué sitios web visitamos y cuánto tiempo pasamos en ellos.
Digamos que a alguien le interesan los zapatos y se sabe que compró un tipo particular de calzado en una tienda en particular. La IA de MediaGamma aprende a categorizar a los usuarios de Internet en base a toda la información que tiene disponible.
Si tu actividad en línea es similar a la de la persona que compró calzado anteriormente, le indicará a un anunciante de calzado que haga una oferta.
"Es muy probable que te conviertas", dice Wang. "También estimamos, para este tipo de usuarios en este tipo de mercado, cuánto hay que ofertar para ganar".
Pero esto es solo el comienzo. El mes pasado, MediaGamma ganó una subvención de la 'agencia de innovación' del gobierno del Reino Unido para desarrollar IA más avanzada que puede generar texto e imágenes para anuncios específicos.
Esto involucraría en la práctica juntar algo así como el redactor de Alibaba con la tecnología actual de análisis de usuario de MediaGamma.
Así, en lugar de utilizar tu actividad online para decidir qué anuncio existente deberías ver, esa información podría utilizarse pronto para generar un anuncio personalizado sobre la marcha.
"Podríamos tener un anuncio publicitario específicamente adaptado a los gustos de una persona", explica Wang.
O en manos de Alibaba, dicho sistema podría generar una descripción de artículo a medida, diseñada para gustar a tus preferencias individuales, según lo que sabe sobre tus hábitos de compra.
Esto sería una venta directa a la larga cola que Riedl imagina.
Próximo paso: inteligencia narrativa
Estos sistemas de IA son cada vez más inteligentes, pero ¿se están volviendo más creativos?
Aquí va una famosa historia de seis palabras de Ernest Hemingway: "Se vende: zapatos de bebé, nunca usados".
Es un anuncio, similar a las descripciones producidas por la IA de Alibaba. Pero la resonancia emocional de las palabras de Hemingway proviene de su profunda comprensión de la vida humana, algo que las máquinas no tienen.
Incluso si produjeran esas palabras, no reaccionaríamos de la misma manera. Al menos no todavía.
Riedl, sin embargo, está interesado en darle a la IA una forma de inteligencia narrativa, la capacidad de construir y entender historias más como hacen las personas.
Uno de sus sistemas experimentales, llamado Shezarade, genera narrativas breves basadas en información de fuentes abiertas sobre actividades humanas comunes, como una salida al cine. Aquí va un extracto de una de esas historias:
Con las palmas sudorosas y el corazón acelerado, John fue a la casa de Sally para su primera cita. Sally, su bonito vestido blanco flotando en el viento, entró cuidadosamente en el auto de John. John y Sally condujeron al cine. John y Sally estacionaron el auto en el estacionamiento. Deseoso de sentirse preparado, John ya había comprado boletos para la película con anticipación. Un ujier de rostro pálido estaba parado frente a la puerta; John mostró los boletos y la pareja entró. Sally tenía sed, así que John se apresuró a comprar bebidas antes de que comenzara la película. John y Sally encontraron dos buenos asientos cerca de la parte de atrás. John se sentó y levantó el brazo para que él y Sally pudieran acurrucarse. John le prestó más atención a Sally durante la película y bebía nerviosamente su bebida. Finalmente, reuniendo coraje, John extendió su brazo para abrazar a Sally. Se sintió aliviado y eufórico al sentir que ella se acercaba a él como respuesta. Sally se levantó para usar el baño durante la película, sonriendo tímidamente a John antes de salir.
No es del todo Hemingway, pero la generación narrativa es un área en crecimiento para la IA. Y, para Riedl, la inteligencia narrativa ayudará a la IA a entender el mundo de manera más parecida a como lo hacemos nosotros; a menudo contamos historias para darle sentido a las cosas.
Tal comprensión podría hacer que las IA con las que interactuamos, como Siri, parezcan menos extrañas.
Por otra parte, además de contar historias y convertirse en mejores vendedores, también se pueden usar IA más creativas para generar correos electrónicos de campaña personalizados o publicaciones en redes sociales para candidatos políticos.
También estamos viendo cómo los primeros redactores de IA generan breves boletines de noticias: la agencia de noticias Xinhua de China anunció recientemente que comenzaría a usar software para escribir algunos de sus informes de noticias.
Esto ha generado inquietud, ya que muchos consideran que Xinhua es una máquina de propaganda para el gobierno chino. Y si tienes cientos de bots que propagan una versión particular de una historia, esto podría ser difícil de contrarrestar y podría tener grandes implicaciones en relación al sesgo de las noticias.
Sin embargo, esto es hacia donde nos dirigimos: vemos que cada vez más empresas, campañas políticas y firmas consultoras comienzan a utilizar AI para ayudar en sus comunicaciones.
Deberíamos tratar de detectar esto cuando sea posible. Pero eso es más fácil decirlo que hacerlo. Es posible que descubramos que conocemos estos mensajes generados por máquinas tanto como las subastas de anuncios en línea que se ejecutan cada vez que se abre un sitio web.
"Nadie se da cuenta", dice Wang.