Mejorar la genética mediante el aprendizaje automático (Machine Learning)

La evolución de las técnicas y herramientas de aprendizaje automático en la última década ha facilitado el desarrollo de la IA en diferentes industrias, también dentro de la genética porcina.  Desde 2020, Topigs Norsvin ha estado utilizando el aprendizaje automático en las predicciones rutinarias de la composición de la canal de cerdos vivos, basándose en imágenes de tomografía computarizada. Recientemente hemos lanzado un modelo mejorado que creará predicciones más precisas y mejorará así la ganancia genética.

Con el aumento de la competencia internacional, la mejora de las herramientas para obtener beneficios genéticos y una mayor atención al bienestar y la sostenibilidad de los animales, se necesitan objetivos de selección más amplios que abarquen al animal en su totalidad.


Para obtener beneficios genéticos, por ejemplo, en salud y robustez, necesitamos datos relevantes sobre un amplio conjunto de animales. Estos datos se basan a menudo en sensores y técnicas de imagen, y la salida de estas fuentes de datos está menos estructurada que los datos tradicionales utilizados en la selección de animales. Desde 2015, el aprendizaje profundo es el método de vanguardia para encontrar estructuras en datos no estructurados como imágenes y vídeos.


Imitando al cerebro
El aprendizaje profundo, y más concretamente las redes neuronales convolucionales (CNN), es una técnica muy eficiente para trabajar con datos de imágenes. Las CNN son modelos matemáticos inspirados en la forma en que el cerebro humano procesa los datos visuales. Las señales se propagan entre capas de neuronas, y cada neurona aprende de los datos durante un proceso llamado entrenamiento.


Para entrenar el modelo, necesitamos muchos datos etiquetados. Los datos etiquetados son ejemplos de lo que se quiere que el modelo prediga. Si quiere que el modelo prediga el tamaño de los distintos cortes de la canal basándose en imágenes de TAC, se debe clasificar manualmente los píxeles de las imágenes de TAC para que pertenezcan a los distintos cortes: lomo, órganos internos, vientre, etc. Cuantas más imágenes etiquetadas manualmente tenga, mejor funcionará el modelo.

Una vez entrenado, el modelo puede clasificar píxeles con precisión en imágenes de TC no vistas previamente.


Etiquetado asistido por ordenador
Hacer todas las anotaciones desde cero requiere mucho trabajo manual, por lo que a menudo empezamos a entrenar el modelo con un conjunto relativamente pequeño de datos. A continuación, podemos utilizar este primer modelo para realizar el etiquetado grueso y recurrir a los anotadores humanos para corregir y perfeccionar el resultado antes de volver a entrenar el modelo con más datos etiquetados. De este modo, el modelo evoluciona hasta convertirse en un buen modelo de predicción asistido por anotaciones humanas.

Compartir esta entrada: