L’entropia e l’information gain nel Machine Learning

In machine learning, l’entropia e l’information gain sono concetti fondamentali utilizzati nell’ambito degli alberi decisionali e dell’apprendimento supervisionato per prendere decisioni sulla divisione dei dati durante il processo di addestramento di un modello. Questi concetti sono spesso associati all’algoritmo ID3 (Iterative Dichotomiser 3) e alle sue varianti, come il C4.5 e il CART.

Machine Learning with Python - Confusion Matrix

La Matrice di Confusione nei problemi di Classificazione del Machine Learning

La matrice di confusione è uno strumento di valutazione ampiamente utilizzato nel machine learning per misurare le prestazioni di un modello di classificazione. Fornisce una panoramica dettagliata delle previsioni fatte dal modello rispetto alle classi reali dei dati. La matrice di confusione è particolarmente utile quando si lavora con problemi di classificazione in cui le classi possono essere più di due.

Machine Learning - L'algoritmo CHAID

L’algoritmo CHAID in Machine Learning con Python

CHAID (Chi-squared Automatic Interaction Detector) è un algoritmo utilizzato per la costruzione di alberi di decisione, in particolare per la suddivisione di variabili in base alle loro interazioni con le variabili di destinazione. A differenza degli alberi decisionali tradizionali, che si basano principalmente sull’indice di Gini o sull’entropia per la scelta delle suddivisioni, CHAID utilizza test del chi-quadro per determinare le suddivisioni ottimali in modo automatico.

Random Forest

Random Forest nel Machine Learning con Python

Random Forest è un algoritmo di apprendimento automatico che si basa sulla creazione di un insieme di alberi decisionali. Ogni albero viene creato utilizzando un subset casuale dei dati di addestramento e produce una previsione. Alla fine, le previsioni di tutti gli alberi vengono combinate attraverso il voto della maggioranza per ottenere la previsione finale.

Gradient Boosting

Gradient Boosting nel Machine Learning con Python

L’algoritmo Gradient Boosting è una tecnica di apprendimento automatico che si basa sulla creazione sequenziale di modelli deboli, spesso alberi decisionali, per creare un modello più forte in grado di affrontare problemi di regressione e classificazione. L’obiettivo principale del Gradient Boosting è ridurre l’errore del modello combinando i punti deboli dei modelli individuali.

Introduzione a D3

Introduzione a D3

Sono passati già alcuni anni da quando ho scritto un libro completamente dedicato alla libreria D3.js e alla visualizzazionde dei dati. In questo tempo la libreria si è sviluppata ulteriormente passando dalla versione 3 alla verione 6. Alcune cose sono cambiate ed altre sono rimaste le stesse. Con questo articolo, colgo l’occasione per riprendere in mano questa libreria e cominciare a riscoprirla insieme.

Deep Learning

Deep Learning

Il Deep learning è una tecnica computazionale che permette di estrarre e trasformare i dati da fonti come, per esempio, il parlare umano o la classificazione di immagini, usando strati multipli di reti neurali. Ciascuno di questi strati prende i suoi input dagli strati precedenti e li rifinisce, così in maniera progressiva. Gli strati vengono addestrati da algoritmi che minimizzano i loro errori e migliorano la loro accuratezza. In questo modo le reti imparano ad effettuare dei compiti specifici.