blog informativo

A importância da otimização de hiperparâmetros em modelos de Machine Learning aplicados à mineração

Nos últimos anos, o uso de Machine Learning (ML) na mineração cresceu significativamente, particularmente em aplicações relacionadas à predição de teores, recuperação metalúrgica, classificação geológica e variáveis geometalúrgicas como dureza, consumo energético ou throughput.

No entanto, um dos aspectos mais importantes — e ao mesmo tempo mais subestimados — no desenvolvimento de modelos preditivos corresponde à otimização de hiperparâmetros.

É relativamente comum encontrar estudos onde algoritmos são comparados utilizando apenas parâmetros padrão. Em muitos casos, isso leva a conclusões incorretas sobre o verdadeiro desempenho dos modelos. Um algoritmo aparentemente “ruim” pode superar amplamente outro caso seus hiperparâmetros sejam ajustados corretamente.

Na mineração, onde os datasets costumam ser limitados, caros e espacialmente correlacionados, a correta otimização de hiperparâmetros pode representar a diferença entre um modelo robusto e outro completamente inutilizável operacionalmente.

O objetivo deste artigo é revisar:

O que são hiperparâmetros
Por que são importantes
Como afetam o desempenho de modelos de ML
Quais metodologias de otimização existem
Exemplos aplicados a variáveis geometalúrgicas
Riscos associados ao overfitting
Recomendações práticas para mineração

O que são hiperparâmetros?

Em termos simples, hiperparâmetros correspondem a configurações externas que controlam o comportamento de um algoritmo de Machine Learning.

Diferentemente dos parâmetros internos do modelo, que são aprendidos automaticamente durante o treinamento, os hiperparâmetros devem ser definidos pelo usuário antes de treinar o modelo.

Por exemplo:

Random Forest

Alguns hiperparâmetros típicos são:

Número de árvores
Profundidade máxima
Número mínimo de amostras
Quantidade de variáveis avaliadas por nó

XGBoost

Entre os mais relevantes encontram-se:

Learning rate
Número de estimadores
Profundidade
Regularização
Subsampling
Column sampling

Redes neurais

Em redes neurais, os hiperparâmetros incluem:

Número de camadas
Quantidade de neurônios
Learning rate
Batch size
Funções de ativação
Dropout
Optimizer

Todos esses parâmetros afetam diretamente a capacidade preditiva, a estabilidade, o tempo de treinamento, a generalização e o risco de overfitting.

Por que os hiperparâmetros são tão importantes?

Dois modelos utilizando exatamente o mesmo algoritmo podem apresentar desempenhos completamente distintos dependendo de como seus hiperparâmetros são configurados.

Por exemplo:

um modelo excessivamente complexo pode memorizar ruído
um modelo excessivamente simples pode não capturar padrões reais
um learning rate incorreto pode impedir a convergência
árvores demais podem aumentar o overfitting
poucas árvores podem gerar underfitting

Na mineração, isso é especialmente relevante devido a:

datasets relativamente pequenos
alta variabilidade espacial
ruído geológico
presença de outliers
domínios complexos
distribuições altamente assimétricas

Um tuning inadequado pode levar a modelos estatisticamente atrativos durante o treinamento, mas completamente inconsistentes quando aplicados em novas áreas do depósito.

Overfitting e underfitting

Um dos principais objetivos da otimização corresponde a encontrar o equilíbrio correto entre capacidade preditiva e generalização.

Underfitting

O underfitting ocorre quando o modelo é simples demais para capturar a complexidade real dos dados.

Consequências:

baixo desempenho
alto viés
incapacidade de modelar relações não lineares

Exemplos:

árvores muito pequenas
poucos estimadores
regularização excessiva

Overfitting

O overfitting ocorre quando o modelo aprende ruído e particularidades específicas do conjunto de treinamento. Na mineração, isso é particularmente perigoso devido à autocorrelação espacial.

Consequências:

métricas artificialmente elevadas
baixo desempenho em validação
baixa capacidade de extrapolação

Muitas vezes, um modelo parece extremamente preciso simplesmente porque as amostras de treinamento e validação estão espacialmente próximas.

Exemplo de otimização de hiperparâmetros

Neste exemplo, foi desenvolvido um modelo Random Forest Regressor com o objetivo de prever o teor de uma variável de interesse a partir de um conjunto de variáveis geoquímicas.

Com o objetivo de maximizar a capacidade preditiva do modelo, utilizou-se o Optuna, uma biblioteca de otimização de hiperparâmetros baseada em técnicas de busca inteligente que permitem explorar de maneira eficiente o espaço de soluções. Diferentemente de abordagens tradicionais como Grid Search ou Random Search, o Optuna emprega algoritmos de otimização sequencial que aprendem com avaliações prévias para concentrar a busca nas regiões mais promissoras. Durante o processo, cada combinação de hiperparâmetros foi avaliada mediante validação cruzada utilizando o coeficiente de determinação (R²) como métrica objetivo.

A Figura 1 apresenta as curvas de validação obtidas para os principais hiperparâmetros do modelo otimizado. Essas curvas permitem visualizar como o desempenho do Random Forest varia à medida que a complexidade do modelo muda. Em geral, observa-se que níveis muito baixos de complexidade conduzem a situações de underfitting, nas quais o modelo é incapaz de capturar adequadamente a variabilidade do teor, enquanto configurações excessivamente complexas tendem a aumentar o risco de overfitting, reduzindo a capacidade de generalização sobre dados não observados. Os valores selecionados pelo Optuna correspondem à região onde o desempenho em validação atinge seu máximo ou permanece estável.

Figura 1: Curvas de validação para os hiperparâmetros do modelo otimizado

Os resultados obtidos demonstram claramente o benefício da otimização de hiperparâmetros. O modelo base de Random Forest alcançou um R² de 0,454, enquanto o modelo otimizado elevou esse valor para 0,696, o que representa uma melhoria relativa de 53,25% na capacidade explicativa do modelo. Da mesma forma, o RMSE diminuiu 25,35% e o MAE foi reduzido em 16,54%, evidenciando uma melhoria significativa na precisão das predições.

Esses resultados demonstram que a otimização sistemática de hiperparâmetros constitui uma etapa fundamental no desenvolvimento de modelos preditivos para estimativa de teores, permitindo extrair um desempenho consideravelmente superior mesmo a partir de algoritmos já consolidados como o Random Forest.

Reflexão final

A otimização de hiperparâmetros representa um dos aspectos mais importantes do Machine Learning aplicado à mineração. Em muitos casos, as diferenças entre um modelo útil e outro inutilizável não dependem do algoritmo selecionado, mas sim de como ele foi ajustado.

No entanto, a otimização não deve ser entendida apenas como um problema matemático. Na mineração, os modelos precisam respeitar:

coerência geológica
continuidade espacial
domínios
suporte
comportamento operacional

O verdadeiro desafio não consiste em construir o modelo com o maior R², mas em desenvolver modelos robustos, interpretáveis e capazes de generalizar corretamente em novas áreas do depósito.

A combinação entre conhecimento geológico, geoestatística e otimização inteligente de Machine Learning representa atualmente uma das áreas mais promissoras para o desenvolvimento de modelos avançados.

Diante disso, surge uma pergunta cada vez mais relevante: quantos modelos considerados “ruins” na mineração realmente falharam por causa do algoritmo… e quantos simplesmente devido a um processo inadequado de otimização?