Programación

Cómo distinguir imágenes con la ayuda de la Ciencia de Datos

Debora Slotnisky

1 de ago. de 2017 • 3 min de lectura

Concluyó el programa de Data Science impartido durante el primer semestre del año en Digital House y, como es habitual, los alumnos presentaron sus proyectos integradores. En este sentido, Amanda Delgado Rocke y Florencia Kabas trabajaron en el desarrollo de un sistema para el análisis de imágenes. Básicamente, apelaron al machine learning, esto es, crear un sistema que aprenda automáticamente para que detecte y clasifique imágenes con nieve, de aquellas no nevadas.“Corroborar el tipo de foto en base a datos binarios. De esta manera, teníamos dos tipos de clasificaciones: imágenes nevadas e imágenes sin nieve con el objetivo de identificar paisajes del primer tipo. Para eso, el desafío inicial fue trabajar con fotos disponibles en internet y convertirlas en datos”, explicaron las estudiantes. A tal fin utilizaron el motor de búsqueda Bing, de Microsoft, para realizar el scrapeo, es decir, enfocarse en una búsqueda determinada para recolectar datos no estructurados. “Consideramos que para esta labor Bing es mejor que Google porque es más flexible. Además, apelamos al uso de imágenes disponibles sin costo. Así es como obtuvimos un DataSet con 1450 imágenes etiquetas”, ilustraron. El DataSet es una representación de datos residente en memoria que proporciona una modelo de programación relacional coherente independientemente del origen de datos que contiene.

Como las imágenes eran de distintos formatos decidieron convertirlas a RGB, y luego le asignaron un código a cada tipo de color. De esta manera obtuvieron miles de columnas según la cantidad de colores de las imágenes. Para simplificar el trabajo apelaron a la variable de saturación, esto es, el colorido de una imagen. Así es como un color muy saturado tiene un color intenso, mientras que un color menos saturado parece más descolorido y gris; y sin saturación, un color se convierte en un tono grisáceo. Con posterioridad, redimensionaron las imágenes para que todas tengan el tamaño y orientación para poder compararlas. Como resultado, pudieron disminuir los cientos de columnas del DataSet a solo 512. MétodosCon ese DataSet utilizaron dos métodos para proseguir con el trabajo: vecinos cercanos y árboles de decisión. El primero detecta imágenes nevadas en función de las imágenes cercanas, por eso es un método por comparación. En tanto, en el segundo, es un algoritmo el que busca variables que le provean de información y así toma decisiones para agrupar solo a las imágenes nevadas. “Con esta metodología obtuvimos un nivel de acierto del 70%, por eso pensamos en otra alternativa para elevar el porcentaje, que fue optimizado al 82% a través de grid search y random forest que lograron elevar el rendimiento de nuestro algoritmo”, detallaron. Grid search hace búsquedas de parámetros y valores que entran en el modelo y los prueba para decidir al mejor combinación posible, mientras que random forest toma un modelo, lo repite muchas veces y lo compara, en este caso con muchas otras imágenes para definir.

Para concluir, las alumnas expresaron al resto de los alumnos que luego presentaron otros 10 proyectos: “Con esta realización de este proyecto nos dimos cuenta que queremos seguir avanzando en el campo del procesamiento de imágenes en base al análisis de datos no estructurados”.