Se suele creer que la Inteligencia Artificial acabará con el trabajo humano, que se nos desplazará en favor de robots inteligentes que harán todas las tareas. Sin embargo, los algoritmos de inteligencia artificial y todos sus subconjuntos específicos (machine learning, Deep learning) están en una fase de maduración muy temprana y siempre habrá trabajos en los que seremos mejores.
Las tareas cognitivas humanas son demasiado complejas, por lo general, para que las máquinas las puedan replicar. Un buen algoritmo de IA es mucho más eficaz que el cerebro para determinadas cosas, pero que son, en realidad, muy específicas. Por ejemplo, para reconocer una cara, para detectar un posible tumor maligno con días de antelación o para proporcionarnos la mejor oferta de vuelos baratos.
Sea como sea, cualquier algoritmo de aprendizaje automático necesita siempre de la retroalimentación constante humana para identificar mejor las señales que reciben. Es decir, caras, expresiones, lugares o cualquier conjunto de entrada debe ser validado por operadores humanos. O, dicho de otro modo, todo debe ser etiquetado correctamente para que los algoritmos sepan exactamente qué están procesando.
El etiquetado de datos es la selección manual de datos por realizada por humanos en aplicaciones de aprendizaje automático e IA. El etiquetado de datos es esencial por las limitaciones propias de los algoritmos y el software. Algunas de esas limitaciones no se pueden resolver sin intervención humana, por ejemplo, la diferencia entre un jarrón y un gato. Por el contrario, el software se puede programar para realizar cálculos muy complejos y automatizar actividades pesadas para hacerlas manualmente.
El entrenamiento de los algoritmos de machine learning es esencial para que estos aprendan a procesar los datos de entrada para obtener las respuestas adecuadas. Sin los etiquetadores de datos (o Data Labelers en inglés), esto no sería posible.
Los trabajadores que se dedican al etiquetado tienen la tarea de catalogar millones de pequeños fragmentos de imágenes, así como datos. Estos conjuntos de datos de todo tipo servirán para alimentar al algoritmo de machine learning de manera que aprenda lo más rápido posible. ¿Durante cuánto tiempo es necesario entrenar al sistema de machine learning? La respuesta corta es siempre. Los sistemas de inteligencia artificial siempre pueden mejorar y siempre pueden entrenarse para obtener mejores resultados.
Este trabajo no es algo muy valorado en términos de remuneración porque requiere un nivel de especialización menor que otros como la programación o el diseño, y tiene una complejidad técnica mucho menor. Pero sin etiquetadores, no tendríamos buenos sistemas de machine learning.
Para hacernos una idea del volumen de trabajo de los etiquetadores de datos, una sola hora de grabación de imágenes a bordo de un coche autónomo puede convertirse en hasta 800 horas de trabajo para etiquetar todos los objetos que salen, de manera que los algoritmos del coche autónomo aprendan constantemente.
Deja tu comentario sobre "Los etiquetadores de la Inteligencia Artificial, profesionales imprescindibles"