Documento

Panoramica del Database

Che cos’è questo database

Questo database raccoglie statistiche calcistiche da 5 fonti diverse per costruire un dataset completo destinato a progetti di machine learning applicato al Fantacalcio (Serie A italiana).

L’idea di fondo: unire voti fantacalcio, statistiche avanzate (xG, xA), dati di mercato, infortuni e metriche dettagliate partita per partita in un unico posto, con entità unificate (un giocatore = una riga in players, anche se appare su 5 siti diversi).

Numeri chiave:

  • ~3.400 giocatori, ~5.000 club, ~4.200 partite
  • ~273.000 voti partita-per-partita (Fantacalcio)
  • ~169.000 tiri con xG individuale (Understat)
  • ~184.000 dettagli prestazione per partita (Understat)
  • 35 tabelle + 1 vista ML pronta all’uso
  • 10 stagioni di dati (2014/15 - 2024/25)

Le fonti dati

Fonte Cosa fornisce Tabelle principali
Fantacalcio.it Voti, fantavoti, bonus/malus, quotazioni, FVM, ruoli fc_player_seasons, fc_player_matches, fc_quotation_history, fc_fvm_history
Bera Statistiche aggregate con metriche per-90 minuti bera
SofaScore 80+ metriche stagionali (tiri, passaggi, duelli, portiere) sofascore
Transfermarkt Trasferimenti, valori di mercato, infortuni tm_transfers, tm_player_injuries, tm_injury_missed_clubs, tm_market_value
Understat xG, xA, mappa tiri, dettagli partita, pressing, stats per posizione/situazione us_players, us_player_shots, us_player_match_details, us_team_history, ecc.

Flusso dei dati

Scrapers (API) → Database MySQL → v_player_season_stats → ML Models
  • Fantacalcio API (porta 8080) — voti, quotazioni, FVM
  • Transfermarkt API (porta 8081) — trasferimenti, infortuni, valori di mercato
  • SofaScore API (porta 8082) — metriche avanzate stagionali
  • Understat — xG, xA, dati a livello di singolo tiro
  • Bera — aggregati con metriche per-90