~

Machine Learning: algoritmi predittivi

Algoritmi predittivi nel Machine Learning

Algoritmi predittivi nel Machine Learning

Mative impiega questi algoritmi predittivi sui propri dati time series. Qui in basso una breve descrizione di come funzionano un accenno su come possono essere utilizzati.

Linear Regression

La regressione lineare è un metodo statistico che modella la relazione tra una variabile dipendente (target) e una o più variabili indipendenti (predittori) tramite una linea retta. La formula è:

[ y = \beta_0 + \beta_1x_1 + \beta_2x_2 + \ldots + \beta_nx_n + \epsilon ]

Dove:

  • ( y ) è la variabile dipendente.
  • ( x_i ) sono le variabili indipendenti.
  • ( \beta_i ) sono i coefficienti che rappresentano l'impatto di ogni variabile indipendente.
  • ( \epsilon ) è l'errore residuo.

OLS Linear Regression

La regressione lineare OLS (Ordinary Least Squares) è una specifica forma di regressione lineare che minimizza la somma dei quadrati delle differenze tra i valori osservati e i valori predetti. In pratica, si cerca la linea di miglior fit che minimizza l'errore quadratico medio:

[ \text{Minimizza} \sum (y_i - \hat{y}_i)^2 ]

Dove:

  • ( y_i ) sono i valori osservati.
  • ( \hat{y}_i ) sono i valori predetti.

ARIMA

ARIMA (AutoRegressive Integrated Moving Average) è un modello utilizzato per l'analisi delle serie temporali, che combina tre componenti:

  1. AutoRegressive (AR): il modello utilizza valori passati per predire valori futuri.
  2. Integrated (I): differenzia i dati per renderli stazionari.
  3. Moving Average (MA): utilizza errori passati nella previsione di valori futuri.

Il modello è spesso scritto come ARIMA(p, d, q), dove:

  • ( p ) è l'ordine del termine autoregressivo.
  • ( d ) è il numero di differenze necessarie per rendere la serie stazionaria.
  • ( q ) è l'ordine del termine della media mobile.

Fourier Transformation

La trasformata di Fourier è un metodo matematico per trasformare una funzione da dominio del tempo a dominio della frequenza. Viene utilizzata per analizzare le componenti frequenziali dei segnali. Nel contesto delle serie temporali, può essere usata per identificare cicli o pattern periodici:

[ F(k) = \sum_{n=0}^{N-1} x(n) e^{-2\pi i \frac{kn}{N}} ]

Dove:

  • ( x(n) ) è il segnale nel dominio del tempo.
  • ( F(k) ) è la rappresentazione nel dominio della frequenza.
  • ( N ) è il numero di campioni.
  • ( i ) è l'unità immaginaria.

[Top]