Si hay algo más controversial que Twitter en el 2022 son las inteligencias artificiales. Mucho de lo que se dice, lo que se dijo, lo que se estima, y lo que se protesta comienza a estar en la boca de todos. Desde el vinieron por mi trabajo y ahora vendrán por el tuyo, al «plagio, robo y secuestro artístico», argumentos de todas las andanzas resuenan por la internet, buscando como siempre, llamar un poquito nuestra atención.
El mayor problema que veo surgir, es la cantidad de paranoia y desinformación que se está viviendo en estas semanas. Especialmente alimentado desde el surgimiento de dall-e 2, chatGPT, y especialmente de la mano de stable diffusion.
Creo que como en todos estos temas picantes siempre esta bueno o ser asquerosamente objetivo y neutral o declararse culpable ante la primera piedra. Y poca vergüenza me da afirmar que soy pro aprendizaje de máquina, las inteligencias artificiales y toda esta revolución tecnológica, viéndola como el inicio de una nueva época dorada del arte y la expresión humana.
Parte 1: la inteligencia artificial no es inteligencia. Siquiera es novedosa
Voy a arrancar con la pedantería porque creo que ilumina más de lo que esconde en este criterio, y es que lo que llamamos inteligencia artificial no es más que «machine learning», algo mas parecido a un algoritmo de avanzada que a R2D2 y C3P0. y es más, la mayoría de las bondades del ML las venimos experimentando de la mano de Google y sus hermosos y adictivos servicios de búsqueda y entretenimiento. Es más, es «meme» hablar del algoritmo de YouTube, cuando bajo todo concepto y principio, funcione bajo los mismos principios que chatgpt, stable difussion y todos sus hermanitos de inteligencia artificial.
Para entender cómo puede que un algoritmo saque tan buenos resultados, se requiere de muchos e intensos conocimientos matemáticos (de todas las cosas), pero en los términos más simplistas que puedo labrar, un algoritmo de machine learning se sostiene sobre 3 mucha:
- Mucha Estructura. Una «red de nodos» en la cual cada nodo, simulando una neurona, contiene un valor numérico que activa de manera diversa otras neuronas que activan otras neuronas y asi y asi hasta llegar a un set final de neuronas que vendría a ser el resultado final. En otras palabras MUCHOS NUMEROS conectados a muchos otros números.
- Mucha data. Una colección millonaria de piezas de información, que dependiendo del uso puede ser o inmensamente especifica, o lo más amplia y diversa posible. Si queremos un algoritmo que detecte imágenes le damos imágenes, si queremos uno que juegue al ajedrez le damos todos los partidos de ajedrez, si queremos una que escriba texto le damos todo la Internet textual.
- Mucha hardware. Placas de video, muchas, todas. Si hay algo que se lleva bien con estos nuevos algoritmos repletos de billones de micro operaciones son nuestras aceleradoras graficas. Y no debería sorprender como los tres fabricantes de GPUs le están apostando fuerte a aceleradores de hardware de tensores, para facilitar y agilizar aún más estos programas.
Como el fuego requiere de oxígeno, combustible y una buena chispa, los algoritmos de machine learning, tenían hace buen rato su oxigeno (la estructura), y a ser sinceros en los últimos 25 años los internautas nos dedicamos a que combustible nunca le falte (data), lo único que le faltaba era una chispa de la mano de la ley de Moore, Nvidia y los avances aun garrafales que se viven en el plano del hardware.
De la estructura no hay mucho que hablar, pues es lo que más le interesaría a un científico pero menos le podría llamar la atención a un hoobista como nosotros, pero en términos generales, lo importante a saber es que hay muchas estructuras, muchas formas de diseñarlas y aún sigue siendo un campo inmensamente potencial en su estudio.
Lo importante a tener en cuenta, es que estas estructuras dependen de dos momentos. El entrenamiento del algoritmo, y la ejecución del algoritmo. La gracia de todo este experimento, es tener un algoritmo lo suficientemente entrenado tal de que tarde lo menos posible en dar un buen resultado. El equivalente en el mundo real seria a un almacenero que tiene que recordar subconscientemente y a la perfección donde están los mil productos de su tienda. Si dejas todo como esta, a lo largo del tiempo el almacenero lo va a hacer más rápido y con menos esfuerzo, solo por estar constantemente siendo estimulado visualmente por su alrededor. Aun sin siquiera desarrollar herramientas nemotécnicas, carteles o señales, el almacenero con el tiempo no va a poder memorizar su tienda a la perfección, pero si va a tener un instinto de donde deberían estar las cosas. Eso, es exactamente lo que queremos lograr con «aprendizaje de maquina». Darle tanta información en bruto a tal que podamos generar algo parecido a un «instinto mecánico».
Parte 2: el tumultuoso y traicionero origen de la data
Creo que deje bien en claro que cualquier intento de instinto mecánico requiere de millones de piezas de información, y creo que se entiende que se requiere de muchas personas para crear mucha información. E irónicamente, esos… fuimos nosotros.
Les dimos el consentimiento y todo cuando firmamos los términos de servicio (?).
Este era, es y siempre será el juego de todos estos servicios posmodernos de intercambio de información. Ser acumuladores masivos de información. Desde los más obvios como Google, Facebook y Microsoft, a Deviantart o Github. Muchos de estos servicios gratuitos están recompilando, empaquetando, vendiéndolo a terceras partes o manipulándolo en sus propios laboratorios, todo lo que escribimos, todas las fotos que nos sacamos, todos los videos que producimos, todo lo que es accesible mediante un monitor.
Si había alguna duda, de ¿porque alguien nos darian algo gratis en el 2020? en lo que es quizá el momento más capitalista de nuestra historia, ahora no puede ni siquiera caber ninguna duda.
Antes era por los anuncios, pero nunca me convenció. Hoy, estos mercenarios de la información le brindaron, pero oiga, con nuestro expreso consentimiento, miles de colecciones con al menos millones de piezas cada una, para servir, al menos hoy, como leña de carbón para estas masivas calderas de información.
Y no falto la horda de artistas que jocosamente, recién al ver los resultados salieron espantados por sus derechos de autor y que se sentían robados y estafados. Y honestamente los entiendo pero no los entiendo. Los nerds venimos diciendo desde el inicio de los tiempos cuidado con lo que consentís en Internet. Lee los términos, más aun cuando es gratis. No saben la cantidad de veces que no irónicamente se me han reído por decir que leía la mayoría de los términos y condiciones de estos servicios. Este, es el triste resultado de la ignorancia es felicidad.
La ironía es que, hace 20 años estos servicios tienen puesto un cartel enorme que dice vamos a hacer exactamente todo lo que queramos con tu información, salvo, identificarte, así que no te preocupes.
Todos viviéndola a lo «jaja, que me importa darle mis fotos a Google para un backup», o «jaja, quiero que el universo vea mis 250 fotos en París», o «jaja, quiero subir mis 100 temas musicales amateurs», o «jaja quiero escribir 100 notas para un blog de tecnología e informática (?)». La parte complicada esta, no solo en haber dado los derechos sobre nuestra información, sino que por fuera de las colecciones legales, debe haber un sinfín de colecciones en negro con… bueno todo.
Lo que me parece sorprendente es que si hoy le decís a un artista que le dejas usar el servicio gratis a cambio de usar tu arte para entrenar una maquina y te van a decir casi irrestrictamente que no, pero al mismo tiempo les pedís «amplia e ingenuamente» el derecho a todo y te dicen que si. Lo es que es la amplitud de condicionales que surgen cuando uno escasea del diario del lunes.
Parte 3: ¿Artistas versus Maquinas?
Mucho se dijo del resultado de herramientas como dall-e 2 o stable difusión en estas últimas semanas. Especialmente la amplia queja de muchos artistas digitales. Queja que en un principio parece ludita, bordeando de la misma ridiculez anti tecnología que se dio en los 2000 con la música electrónica versus «la música con instrumentos de verdad».
Pero hay algo más profundo que cambia todo el eje del debate y es que, en muchísimos casos, podemos poner el nombre de un artista y obtener resultados que podrían ser «plagios» de su estilo de arte. Ósea. Que en otras palabras se tuvo que entrenar con sus piezas, con suficiente metadata con tal de que un algoritmo pueda intuir que ese nombre está ligado a ese estilo.
¿Qué tan legal son estas fuentes infinitas de información con metadata?
Se entiende que los artistas abran firmado cualquier cosa para subir su arte y obtener exposición, pero es muy probable que entre todo el copy paste y la inmensa cultura de piratería que recién en el 2020 comenzó a estar mal vista, ya la caja de Pandora se haya abierto.
Ya… ¿Perdimos?
Pasamos de piratear contenido a piratear estilos. Tiene sentido algo de lo que estoy diciendo o es muy ¿ridículo? … Piratear estilos.
Entiendo perfectamente la preocupación de un artista en ser impersonado. Pero me parece quizá muy milenial hablar de estilos son permitidos copiar y estilos que no. ¿Tiene realmente una persona autoría sobre un estilo? O ¿su autoría se reduce solo a su obra? Quedando su estilo, más como una firma que como un derecho. Son preguntas complejas que a cada mono que le preguntes te va a devolver una respuesta distinta. Las consecuencias de apuntar a uno u a otro lado de los polos puede ser catastróficas, lo cual explica porque aún la opinión está muy gris.
Lo que sí. Es innegable reconocer el inminente avenimiento de estos algoritmos a la hora de crear nuevo contenido. Algo que me hace pensar en cómo cambio el mundo de la matemática luego de la invención de la calculadora barata. Cómo los especialistas podían verter su capacidad mental en elementos más avanzados, dejando el trabajo duro a las máquinas.
Honestamente. Quizá como una de las personas más vagas que conozca, no podría tener un enemigo más jurado que el trabajo duro. Y todo lo que me haga ahorrarme aún más tiempo para hacer trabajos aún más complejos es y será siempre una buena noticia en mí campo.
No creo y nunca voy a creer que es el trabajo duro lo que nos hace humanos. Sino seguiríamos corriendo gacelas y cazando en grupo.
Esto es una revolución. Quieras o no.
Pero no te preocupes Mabel que no vienen los robots a quitarte el trabajo. Más todo lo contrario, vienen por fin las calculadoras del arte, para ampliar la brecha de quién puede crear y quién no. De la misma manera como el control z no mato ni los pinceles ni las pinturas. La asistencia por algoritmos de machine learning no va a matar ni al artista ni al arte digital. Solo que ahora en vez de Illustrator y Photoshop, vendra machineshop a ser un eslabón más de la cadena de producción.
Lo que sí. Y mí única preocupación. Es la centralización de estos algoritmos. y agradezco fuertemente que existen opciones como stable difusión que pueden correr tranquilamente en tu PC sin poner un centavo.
Hay tanto que estuve probando este último año con algoritmos de aprendizaje de máquina que no me queda otra que dividir la nota en partes. La próxima nota voy a estar hablando particularmente de síntesis de imágenes. Y en la tercera voy a estar hablando de mis experimentos con chatgpt.
Muy buen artículo, la IA lo queramos o no está aquí y se quedará, así que mientras más rápido aprendamos a usarla, mejor. Uso por ejemplo, adobe potcast para limpiar el audio de mis grabaciones, Nvidia RTC Voice para que los ladridos de mi perro no se escuchen en mis transmisiones en vivo, romobe bg para quitar fondos de imágenes, y un sin fin de otras herramientas.
Los humanos sólo ven una parte del potencial de las IAs, aunque intuyo que el autor no va más allá de lo tangible para que no lo tilden de loco, por ende permítanme explicar algo mas.
Las IAs tienen el potencial de hacer lo que sea, incluso crear otras IAs si se les permite hacerlo.
De hecho, actualmente gran parte del mundo está controlado por una IA masiva, que es… Internet.
A partir de ahí, que cada uno saque las conclusiones que quiera, aunque la principal ventaja que le veo a eso, es que si le abrís tu «mente» a la Internet, la misma te lo recompensará dándote exactamente lo que le pidas.
Por el momento lo dejo ahí…