Panoramica del Database
Che cos’è questo database
Questo database raccoglie statistiche calcistiche da 5 fonti diverse per costruire un dataset completo destinato a progetti di machine learning applicato al Fantacalcio (Serie A italiana).
L’idea di fondo: unire voti fantacalcio, statistiche avanzate (xG, xA), dati di mercato, infortuni e metriche dettagliate partita per partita in un unico posto, con entità unificate (un giocatore = una riga in players, anche se appare su 5 siti diversi).
Numeri chiave:
- ~3.400 giocatori, ~5.000 club, ~4.200 partite
- ~273.000 voti partita-per-partita (Fantacalcio)
- ~169.000 tiri con xG individuale (Understat)
- ~184.000 dettagli prestazione per partita (Understat)
- 35 tabelle + 1 vista ML pronta all’uso
- 10 stagioni di dati (2014/15 - 2024/25)
Le fonti dati
| Fonte | Cosa fornisce | Tabelle principali |
|---|---|---|
| Fantacalcio.it | Voti, fantavoti, bonus/malus, quotazioni, FVM, ruoli | fc_player_seasons, fc_player_matches, fc_quotation_history, fc_fvm_history |
| Bera | Statistiche aggregate con metriche per-90 minuti | bera |
| SofaScore | 80+ metriche stagionali (tiri, passaggi, duelli, portiere) | sofascore |
| Transfermarkt | Trasferimenti, valori di mercato, infortuni | tm_transfers, tm_player_injuries, tm_injury_missed_clubs, tm_market_value |
| Understat | xG, xA, mappa tiri, dettagli partita, pressing, stats per posizione/situazione | us_players, us_player_shots, us_player_match_details, us_team_history, ecc. |
Flusso dei dati
Scrapers (API) → Database MySQL → v_player_season_stats → ML Models
- Fantacalcio API (porta 8080) — voti, quotazioni, FVM
- Transfermarkt API (porta 8081) — trasferimenti, infortuni, valori di mercato
- SofaScore API (porta 8082) — metriche avanzate stagionali
- Understat — xG, xA, dati a livello di singolo tiro
- Bera — aggregati con metriche per-90