Connect with us

Subscribe

Cine + Series

Disney está desarrollado una herramienta de reconocimiento facial de IA para personajes animados

Miedito.

Tal como se lee y es que si el futuro puede ser aterrador en manos de una entidad todo poderosa dueña de un impresionante catálogo de propiedades intelectuales, imagínenlo pudiendo reconocerlas todas y a cada una de ellas.

Pero primero partamos por Pytorch: PyTorch es (y acá copio y pego de la Wikipedia) una biblioteca de aprendizaje automático de código abierto basada en la biblioteca Torch, utilizada para aplicaciones como la visión por computadora y el procesamiento del lenguaje natural, desarrollada principalmente por el laboratorio de investigación AI de Facebook.

Según consigna CB, Pytorch es la herramienta base del sistema desarrollado por ingenieros y científicos de la división Disney’s Direct-to-Consumer & International Organization (DTCI): a.k.a la división de servicios directo al consumidor de la empresa, que se encarga entre otras cosas de administrar los servicios como Disney+ o sus canales como Disney Channel. ESPN, ABC, Fox, etc. y quienes son responsables directos de este proyecto que se lleva trabajando desde 2016 bajo el nombre de Disney’s Content Genome.

Así que Disney’s Content Genome es básicamente un proyecto que pretende digitalizar y reconocer el rostro de TODAS las propiedades intelectuales animadas de los más de 100 años de producción de la factoría Disney mediante inteligencia artificial completándolas con metadatos y etiquetas que permitirían clasificar y ordenar el gigantesco archivo de la compañía.

En una publicación de Medium, el equipo desarrollador ahonda en los alcances de esta herramienta que puede ir desde «recomendar» de manera más certera productos a los consumidores, hasta por supuesto, buscar versiones no autorizadas de reproducción de sus contenidos. Esta última parte no lo explicitan, pero claramente es inferible.

Pero no solo puede reconocer rostros, también identificaría paisajes, objetos y otro tipo de elementos que hayan sido producidos por la casa de Mickey Mouse y que, usando IA permitiría, por ejemplo, ayudar a los animadores a «encontrar tomas y secuencias específicas para que puedan ser creados nuevos contenidos pero guardando una identidad o congruencia gráfica».

“Entonces, si un animador que trabaja en una nueva temporada de Clone Wars quiere encontrar un tipo específico de explosión que ocurrió hace tres temporadas o como referencia para hacer algo para esta temporada actual, esa persona tuvo que pasar horas en YouTube viendo videos porque no puedes encontrar eso simplemente mirando los títulos de los episodios”, dijo Anthony Accardo, Director de Investigación y Desarrollo de DTCI a Engadget.

El equipo de DTCI tuvo la tarea de adaptar el software existente para detectar rostros animados en su archivo además de otros elementos como los fondos y otros objetos, y aunque inicialmente, por ejemplo, los fondos animados no eran del todo reconocidos (dado su relativa simplicidad) el proceso de entrenamiento ya diferencia caras de otros elementos de manera confiable.

Según la publicación de Medium «El equipo trató de aplicar el modelo de reconocimiento facial de Live action al contenido animado pero con resultados mixtos. Resulta que los métodos de aprendizaje automático que emplearon, como HOG + SVM, funcionan bien en la selección de cambios de color, brillo y textura» . Sin embargo «Solo podía distinguir las características humanas: dos ojos, un nariz y boca, si estuvieran dentro de las proporciones humanas generales. Como resultado de aquello, el uso de este sistema para etiquetar Monsters Inc., por ejemplo, fue correcto.»

Ahora, tal como dice el artículo de CB si los sistemas de detección de rostros para personas reales ya están definidos y mejoran notablemente, los rostros «animados» son una historia completamente aparte. Y es que si bien, comparten rasgos, usualmente están mega-estilizados lo que resulta en un problema para ser detectados: Piensen en Cars, autos con rasgos faciales humanos claros, pero en proporciones completamente diferentes.

El siguiente paso -dicen- es poder seguir enseñándole más cosas como conceptos abstractos e implementar más «deep learning» en su metodología para cimentar la arquitectura de la plataforma y entregar datos de forma masiva al software en conjunto con algoritmos específicos con el fin de mejorar la detección, incluso de conceptos como «un arresto».

Así es, Accardo comenta «En 2014, 2015, tuvimos esta conversación sobre cómo identificar automáticamente un arresto» (…) «Lo haríamos utilizando el procesamiento del lenguaje natural contra el guión, utilizando, por ejemplo, el reconocimiento del logotipo para identificar una insignia de un oficial de policía y utilizando todas estas cosas diferentes para identificar un concepto que no es claramente visible o audible».

Eso sí, antes de que esa aterradora distopía suceda, se necesita aún más investigación.

«Lo que pasa con el aprendizaje automático y la inteligencia artificial es que las cosas que se basan en la comprensión de todo el contexto son más difíciles» (…) «Debe comenzar con las cosas claramente identificables y luego puede pasar al aprendizaje automático multimodal» (…)«El uso de inferencias, el uso de gráficos de conocimiento, el uso de la semántica, para enriquecer realmente su capacidad de automatizar la captura del contexto humano y la comprensión».

Y todo para poder ofrecer mejores recomendaciones en Disney+. Claro.

Acá puedes leer el artículo con todos los detalles realmente nerds.

Written By

Periodista. Fundador de Plan9. Weón fome.

Lo último en Plan9

DC prepara una serie de Rorschach como secuela de Watchmen

Cult + Mag

1899: La nueva locura de los creadores de Dark

Cine + Series

Ahora puedes escuchar el soundtrack completo de Ghost of Tsushima en Spotify

El Infinito

Possessor es la nueva película de Brandon Cronenberg, hijo de el maestro del horror corporal, David Cronenberg

Cine + Series

Connect
#PLAN9NEWS

Suscríbete a nuestro newsletter y recibe todos los días en tu mail, el mejor spam de tu vida.