Digital Humanities e Data Management / Informatica per i Beni Culturali (2025/2026)

01. Introduzione

➡️ Mail: sebastian.barzaghi2@unibo.it
➡️ ORCID: 0000-0002-0799-1527
➡️ Sito: sebastian.barzaghi2

"Drucker, J. (2011). Humanities Approaches to Graphical Display. Digital Humanities Quarterly, 5(1). https://www.proquest.com/scholarly-journals/humanities-approaches-graphical-display/docview/2555208513/se-2"

C'era una volta un'epidemia di colera...

1854, quartiere di Soho, Londra.

Un’epidemia di colera causa decine di morti in pochi giorni.

John Snow, un medico, decide di mappare i casi, identificando ogni evento di contagio e segnalandolo su una mappa del quartiere.

Ciò permette di rintracciare la fonte dell'epidemia fino a una pompa dell'acqua.

"Drucker, J. (2011). Humanities Approaches to Graphical Display. Digital Humanities Quarterly, 5(1). https://www.proquest.com/scholarly-journals/humanities-approaches-graphical-display/docview/2555208513/se-2"

Cosa intendiamo con dati?

Nell’immaginario comune i dati sono legati al digitale, ma hanno radici ben più profonde: da sempre rappresentano qualcosa che usiamo per "provare", "misurare", "fattualizzare" qualcosa.

  • Numeri e statistiche?
  • Fonti primarie / secondarie?
  • Fatti?
  • Eventi storici?
  • Interpretazioni?
  • Testi / immagini / video / ...?
Gualandi, B., Pareschi, L., & Peroni, S. (2023). What do we mean by “data”? A proposed classification of data types in the arts and humanities. Journal of Documentation, 79(7), 51-71. https://doi.org/10.1108/JD-07-2022-0146
"Drucker, J. (2011). Humanities Approaches to Graphical Display. Digital Humanities Quarterly, 5(1). https://www.proquest.com/scholarly-journals/humanities-approaches-graphical-display/docview/2555208513/se-2"

Qualcosa che viene "dato"?

Il numero di nuovi romanzi pubblicati da un singolo editore tra il 1855 e il 1862.

Si tratta di un dato (datum, participio passato di dare): qualcosa che viene dato dalla natura all'osservatore.

Si tratta di un approccio realista: secondo questa visione, i dati sono indipendenti dall'osservatore.

⚠️ I dati sono neutrali, oggettivi, ed estranei a processi di intervento umano?

"Drucker, J. (2011). Humanities Approaches to Graphical Display. Digital Humanities Quarterly, 5(1). https://www.proquest.com/scholarly-journals/humanities-approaches-graphical-display/docview/2555208513/se-2"

Non è così semplice...

La comparsa nel 1855 di quattordici romanzi dipende da molteplici eventi che si sovrappongono e si influenzano a vicenda: stesura, acquisizione, revisione, pre-stampa e pubblicazione.

⚠️ Un dato non esiste di per sé, ma esiste nel momento in cui viene generato, raccolto e/o interpretato attraverso strumenti e sforzi umani.

💡 Ciò che è considerabile dato dipende da chi lo usa, da come lo usa, e per quale scopo.

""

Un dato è "qualcosa che viene preso"

➡️ I dati sono rappresentazioni di entità usate come prova di fenomeni per scopi di ricerca, studio, o altre pratiche di creazione della conoscenza.

Queste entità possono essere intersoggettive o soggettive; fisiche o concettuali; persistenti o effimere; personali o pubbliche; esplicite o implicite.

L'importante è la loro natura di evidenza per spiegare, dimostrare, usare qualcosa.

Andersson, L., Huvila, I., & Sköld, O. (2024). An Introduction to Paradata. In "Perspectives on Paradata: Research and Practice of Documenting Process Knowledge" (pp. 1-14). Cham: Springer International Publishing. https://doi.org/10.1007/978-3-031-53946-6_1
"Noppe, N., Vanvelk, J., & Callens, N. (2023). The hands-on guide to research data management for KU Leuven researchers, students, and research support staff in the humanities and social sciences. Zenodo. <a href="https://doi.org/10.5281/zenodo.8010618">https://doi.org/10.5281/zenodo.8010618</a>"
"Gontier, C., Jordan, J., & Petrovici, M. A. (2022). DELAUNAY: a dataset of abstract art for psychophysical and machine learning research. arXiv preprint arXiv:2201.12123. https://doi.org/10.48550/arXiv.2201.12123"

I dati sono raccolti in dataset

➡️ Un dataset è una raccolta di dati organizzati secondo criteri precisi per sostanziare una particolare analisi, interpretazione o argomento.

Quando parliamo di dati, in realtà stiamo parlando di dataset!

⚠️ Riflette le circostanze che hanno portato alla sua creazione e gestione (strumenti, limiti, bias, responsabilità…).

🔎 Quanto sono importanti i dataset? [1], [2], [3], [4]

"Up close: Preservation, Protection and Conservation-Restoration of Modern and Contemporary Works of Art. https://www.mg-lj.si/en/exhibitions/3639/exhibition-photos-up-close/"

Perché è importante parlare di dati anche in ambito umanistico?

I dati possono essere utilizzati per scrivere un articolo scientifico, organizzare una collezione bibliografica, realizzare una mostra.

💡 Nel breve termine, altri persone potrebbero essere interessate a riutilizzare i nostri dati o a collaborare su nuovi progetti.

💡 Nel lungo periodo, i dati possono essere conservati da musei, archivi e gallerie nazionali, diventando parte del patrimonio storico a disposizione delle generazioni future.

""

Spesso il contesto è più importante

Nelle discipline umanistiche tendiamo ad avere dati descrittivi e interpretativi di altri dati: per descrivere opere culturali, eventi, collezioni bibliografiche lavoriamo più che altro sulle relazioni e i contesti (sociali, geografici, storici, umani).

💡 In questa prospettiva, un ruolo fondamentale è svolto dai metadati che documentano in maniera strutturata i chi, i cosa, i come, i quando, i dove, i perché dei dati.

Andersson, L., Huvila, I., & Sköld, O. (2024). An Introduction to Paradata. In "Perspectives on Paradata: Research and Practice of Documenting Process Knowledge" (pp. 1-14). Cham: Springer International Publishing. https://doi.org/10.1007/978-3-031-53946-6_1

I metadati di un oggetto

Ogni volta che viene scattata una foto con un dispositivo digitale, dei metadati vengono creati automaticamente, come:

  • Data di creazione;
  • Nome del file;
  • Impostazioni del dispositivo;
  • Geolocalizzazione.

Anche un libro è ricco di metadati visibili sulla copertina e nel frontespizio, come:

  • Titolo;
  • Autore;
  • Editore.

Dati su dati

➡️ I metadati sono dati che descrivono un oggetto informativo e ne documentano alcune caratteristiche.

Esempi di metadati includono l'autore di un libro, il contenuto testuale, la data di pubblicazione, e così via.

💡 I metadati possono essere visti come l'insieme di tutto ciò che si può dire su un dato (oggetto informativo) in un determinato momento, a qualsiasi livello di aggregazione.

I metadati possono riferirsi a tante cose

💡 I metadati costituiscono una forma di documentazione (di solito strutturata) che descrive o rappresenta le caratteristiche di un oggetto.

🔎 Quindi, possono essere usati per descrivere tanto gli oggetti fisici (per esempio, frammenti di vasi, reperti archeologici, quadri, libri, persone, ecc.), quanto gli oggetti digitali (per esempio, software, foto, dataset, videogiochi, modelli 3D, ecc.).

I metadati possono essere tante cose

💡 I metadati possono assumere molte forme diverse.

🔎 A partire da semplice testo libero (per esempio, l'etichetta di un'opera d'arte esposta in un museo), pensato per un utilizzatore umano, i metadati possono esistere anche sotto forma di contenuto codificato in un formato altamente strutturato, standardizzato e comprensibile dalle macchine (per esempio, un file MARC).

I metadati sono sempre associati ai dati che descrivono

💡 I metadati accompagnano ciò che descrivono in vari modi.

🔎 Possono essere presenti direttamente nei dati stessi (per esempio, un file PDF o un'immagine digitale), oppure possono essere registrati in oggetti separati collegati in qualche maniera ai dati che descrivono (per esempio, file di testo, fogli di calcolo, ma anche una scheda di catalogo o l'etichetta di un'opera esposta in un museo).

Esistono diversi tipi di metadati

  • Descrittivi: descrivono dati usando dettagli sul contenuto che permettono a questi dati di essere rintracciabili, identificabili e selezionabili (es. titolo);
  • Strutturali: forniscono informazioni sulla costruzione e sull'organizzazione dei dati all'interno della loro collezione (es. indice);
  • Amministrativi: permettono la gestione dei dati nel tempo, fornendo informazioni sulle loro origini e le loro modalità di utilizzo (es. licenza).

Anche gli umanisti usano e producono (meta)dati

Ogni tipo di attività basata sulla conoscenza comporta la produzione e/o il riutilizzo di dati, anche se il termine dato non viene utilizzato in ogni contesto.

🔎 Esempio: uno studente che utilizza delle fonti (primarie o secondarie) per corroborare i contenuti della propria tesi di laurea produce almeno una bibliografia, ovvero un insieme di dati bibliografici.

🔎 Esempio con Zotero: [1]

Gualandi, B., Pareschi, L., & Peroni, S. (2023). What do we mean by “data”? A proposed classification of data types in the arts and humanities. Journal of Documentation, 79(7), 51-71. https://doi.org/10.1108/JD-07-2022-0146

Le discipline umanistiche sono dominate da paradigmi tradizionali

⚠️ Il modo in cui il linguaggio viene usato nelle discipline umanistiche tende ad essere ermetico, individualista, ambiguo.

⚠️ I dati umanistici sono spesso non accessibili a causa di licenze troppo stringenti.

⚠️ I dati umanistici sono complessi e raramente documentati nell'ottica di una loro gestione adeguata.

"Stéfan Sinclair and Geoffrey Rockwell, CC BY 4.0 <https://creativecommons.org/licenses/by/4.0>, via Wikimedia Commons"

La tradizione si (in/s)contra con il digitale

Le tecnologie digitali mettono in discussione paradigmi esistenti e permettono di sviluppare nuovi metodi di indagine, produzione e disseminazione scientifica dei dati umanistici.

Un paio di esempi:

"Stéfan Sinclair and Geoffrey Rockwell, CC BY 4.0 <https://creativecommons.org/licenses/by/4.0>, via Wikimedia Commons"
"Betik, B. & Cors, A. (2023). 5 Reasons Why All Graduate Education Should Include the Digital Humanities. Edinburgh University Press. https://euppublishingblog.com/2023/10/20/graduate-education-digital-humanities/"

Un nuovo paradigma

➡️ Col termine Digital Humanities (DH) ci si riferisce ad un insieme di discipline in rapida espansione che esplora, sviluppa e applica metodi e strumenti digitali alle scienze umanistiche.

Spesso vengono utilizzate tecnologie digitali per esplorare domande di ricerca in ambito umanistico.

In altri casi, vengono formulare domande di ricerca di natura umanistica su questioni riguardanti tecnologie digitali e il loro impatto sulla società.

"Betik, B. & Cors, A. (2023). 5 Reasons Why All Graduate Education Should Include the Digital Humanities. Edinburgh University Press. https://euppublishingblog.com/2023/10/20/graduate-education-digital-humanities/"

Le diverse prospettive delle DH

1️⃣ Le DH nascono da una prospettiva testuale, focalizzata sulla digitalizzazione di fonti fisiche e sull'utilizzo di strumenti computazionali per organizzare ed analizzare materiali digitalizzati.

2️⃣ In seguito, le tipologie di fonti si moltiplicano (immagini, audio, video, ecc.), entrano in gioco anche i materiali nativamente digitali, e cresce un maggiore interesse verso l'epistemiologia (il come).

3️⃣ Ora, sta aumentando l'interesse verso l'impatto che la digitalizzazione, la dataficazione, l'algoritmizzazione e l'AI stanno avendo sulla società e sulla cultura.

Concetti computazionali chiave

  • Decomposizione: dividere un problema in parti più piccole e gestibili;
  • Riconoscimento di pattern: cercare somiglianze e tendenze nei componenti del problema;
  • Astrazione: focalizzarsi solo sulle informazioni rilevanti, rimuovendo dettagli non necessari;
  • Sviluppo di algoritmi: sviluppare una soluzione sequenziale al problema.

🔎 Slide su Computational Thinking

Il tempo dei macroscopi

➡️ Un macroscopio è un dispositivo (fisico, digitale, concettuale) che fornisce una visione d'insieme su qualcosa, sintetizzando elementi in relazione l'uno con l'altro e individuando pattern, tendenze, casi particolari, eccezioni, dettagli.

Ci permette di osservare ciò che è troppo grande, lento, o complesso per essere compreso dal solo occhio umano.

Può essere un dataset, un servizio, un software, una metodologia...

Le DH sono un'emanazione della Digital Literacy

Opportunità di esplorare, sperimentare, e sviluppare abilità trasversali e desiderabili come:

  • Pensiero computazionale;
  • Gestione dei dati;
  • Programmazione;
  • Cooperazione interdisciplinare;
  • Conoscenza su privacy dei dati, licenze, interazione con l'ecosistema Web e con le AI...

Il progetto d'esame

Nota: alcuni dettagli possono cambiare!

Dataset storico-artistico

Dataset costituito da metadati descrittivi di dipinti risalenti al periodo compreso tra il 1400 e il 1900.

Obiettivo: implementazione di un progetto di gestione dei dati che coinvolge:

  • 2 o 3 domande di ricerca;
  • Acquisizione, esplorazione, pulizia e manipolazione dei dati;
  • Analisi dei dati culturali sulla base delle domande scelte;
  • Presentazione del processo e risultati.

Dataset bibliografico

Dataset costituito da metadati descrittivi di pubblicazioni scientifiche che a partire dal 2000 trattano di biblioteconomia.

Obiettivo: implementazione di un progetto di gestione dei dati che coinvolge:

  • 2 o 3 domande di ricerca;
  • Acquisizione, esplorazione, pulizia e manipolazione dei dati;
  • Analisi bibliometrica sulla base delle domande scelte;
  • Presentazione del processo e risultati.

Ne riparleremo, ma intanto questa è l'idea generale

  • Scelta della modalità (in gruppo o individuale);
  • Scelta di uno dei dataset;
  • Raccolta, processamento e analisi dei dati tramite Python (usando Colab come ambiente di sviluppo);
  • Documentazione non strutturata tramite Markdown;
  • Documentazione strutturata tramite metadati standardizzati;
  • Pubblicazione dei materiali su GitHub e Zenodo;
  • Presentazione orale.

Digital Humanities e Data Management / Informatica per i Beni Culturali (2025/2026)

01. Introduzione ✅

➡️ Mail: sebastian.barzaghi2@unibo.it
➡️ ORCID: 0000-0002-0799-1527
➡️ Sito: sebastian.barzaghi2