FGSet: Conectando Conjuntos de Dados Simulados, Controlados e do Mundo Real para Analise de ´ Graos de Fertilizantes
Resumo
Os fertilizantes desempenham um papel crucial na agricultura moderna, sendo insumos essenciais para maximizar a produtividade das culturas e garantir a segurança alimentar. No entanto, a ausência de conjuntos de dados bem anotados tem dificultado significativamente os avanços na análise automatizada de fertilizantes. Este artigo apresenta três conjuntos de dados inovadores, desenvolvidos para criar e validar sistemas de detecção e classificação de fertilizantes, com foco no uso de ambientes simulados e controlados para melhorar o desempenho de modelos em dados reais limitados.
O primeiro conjunto de dados é sintético, gerado por um simulador que cria representações em visão superior de amostras de fertilizantes a partir da fusão de imagens individuais de grãos. Esse conjunto oferece uma fonte de dados altamente controlada e diversificada, ideal para o desenvolvimento e teste inicial de algoritmos. O segundo conjunto é coletado em um ambiente controlado, sob condições otimizadas e realistas, proporcionando um equilíbrio entre precisão experimental e relevância prática. Por fim, o terceiro conjunto captura as condições reais do campo agrícola, sendo coletado em ambientes desafiadores para refletir as complexidades inerentes à aquisição de dados agrícolas.
O treinamento de modelos de aprendizado de máquina nos conjuntos sintético e controlado, seguido de ajuste fino com o conjunto de dados reais limitados, demonstrou ser altamente eficaz para superar a escassez de dados. Essa abordagem melhora a precisão e a robustez dos modelos, permitindo avanços em cenários diversos. Esses conjuntos de dados fortalecem significativamente os processos de treinamento e avaliação de modelos, abrindo caminho para avanços na agricultura de precisão. Ao aprimorar a precisão e a eficiência na gestão de fertilizantes, esses recursos contribuem para o desenvolvimento de práticas agrícolas sustentáveis.
Este artigo detalha a criação, as características e as possíveis aplicações desses conjuntos de dados, destacando como sua natureza complementar promove o desenvolvimento robusto de modelos e inovações práticas.