L’operazione Avalanche nella Nuvola: cultura e innovazione

La ricerca dei contentuti culturali del progetto Avalanche è sempre andata di pari passo con l’innovazione tecnologica in quanto, nel mondo attuale, la conservazione (e la diffusione) della conoscenza non può prescindere dallo sfruttamento e dalle potenzialità offerte delle tecnologie digitali.

Nell’edizione 2019 abbiamo già pubblicato a maggio l’archivio digitale dei ragazzi sul sito www.avalancheday.org e l’anno si chiude ora con un nuovo importante risultato che aggiunge un tassello ulteriore al progetto di rendere la città di Battipaglia protagonista della valorizzazione dell’operazione Avalanche e di tutto il territorio teatro di quella importante esperienza.

L’archivio/catalogo digitale, in via di costituzione grazie alla piattaforma Open Source Italiana xDams (www.xdams.org) viene ora pubblicato non solo nella tradizionale forma web ma, sempre mediante Internet, anche in formato Open Data e più specificatamente in formato Linked Open Data.

Cosa sono gli Open Data e i Linked Open Data

Gli Open Data sono un grande strumento di condivisione della conoscenza perché non solo si pubblica l’informazione in modo libero ma la si rende riusabile anche per scopi ulteriori e differenti, così che da conoscenza si generi ulteriore conoscenza. Le informazioni vengono pubblicate come “dati” e pertanto offerte in maniera accessibile affinché possano essere rielaborate. La caratteristica degli open data è che il riuso dei dati può avvenire in maniera automatica senza che si sia costretti ad estrapolare le informazioni da un post.

Facciamo un esempio: ho individuato 10 luoghi dove si è combattutto nel 1943. Desidero condividere questa informazione con tutti e quindi scrivo un post dove descrivo le caratteristiche di questi 10 siti, rilascio il mio testo con licenza creative commons che permette a chiunque di utilizzare quanto ho scritto. Se qualcuno è interessato a riprodurre tutto il testo non avrà difficoltà ma se desidera costruire un’app con la quale creare un  itinerario culturale deve estrarre le informazioni dal mio testo (nome, citta, coordinate, orari di apertura ecc.).

Rilasciare queste informazioni come Open Data significa costruire un output che contenga solo i dati essenziali, estrapolati dal contewst descritttivo, per esempio un livello minimo open data può essere costituito dalla pubblicazione di un foglio excel.

Tutte le maggiori organizzazioni internazionali e nazionali si sono impegnate negli ultimi anni nel promuovere la diffusione degli open data.

Il limite principale degli open data, in formati come excel, è che devo caricarele informazioni su una mia base dati e se il produttore aggiorna le informazioni devo ripetere l’importazione.

Cosa sono i Linked Open Data (LOD)

In questo contesto i Linked Open Data possono essere considerati il livello più innovativo che si possa offrire per il riutilizzo dei dati perché assolutamente “machine readable”, ovvero ri-elaborabili da un computer senza che sia necessario coinvolgere il produttore originario dei dati. I dati, pubblicati con questa tecnologia inoltre sono “linkabili” a dati presenti su altri archivi Open facendo in modo che si accresca sempre più l’enorme nuvola delle conoscenza mondiale. Con una certa semplificazione (dovuta alla necessità di sintesi) attraverso i Linked Data posso dire che la mia risorsa (per esempio l’evento operazione Avalanche) è collegata a una già presente (molto spesso si utilizza la voce Wikipedia come riferimento) e questo consente quindi di collegare il mio dato a tutti i dati presenti in formato LOD che fanno riferimento, direttamente o indirettamente alla risorsa scelta.

Il mio dato, il mio archivio non sono più entità singole e isolate ma sono inserite in contesti più ampi, inoltre la tecnologia utilizzabile con i LOD prevede che sia possibile accedere al dato direttamente da un punto fornito dal provider di dati  (endpoint).

La spiegazione è un po’ complessa ma possiamo aiutarci integrando l’esempio intyrodotto prima, lo sviluppatore di app, che al punto precedente scaricava il file excel per ottenere i miei dati, ora si può collegare al mio endpoint per costruire iu suoi itinerari. Uno dei miei luoghi è Salerno e lo svilupatore sa, dai i mei dati, che quella risorsa corrisponde alla voce di Wikipedia “Salerno”.   Esistono grandi banche dati del Mibac sui beni culturali del territorio, attraverso i linked open data so che alcuni degli oggetti descritti sono collegati a Salerno. A questo punto lo sviluppatore può utilizzare anche questi dati per descrivere uno scenario sempre più completo del patrimonio culturale, storico e naturale dell’area della “Battaglia di Salerno”.

Chiunque potrà utilizzare i dati del progetto della nostra Città per offrire servizi ed app nuovi e innovativi.

Sir Tim Berners Lee, universalmente riconosciuto come il padre del Web con la sua celebre “proposal” al CERN, ha intrapreso da diversi anni una campagna di sensibilizzazione per promuovere l’utilizzo di questa tecnologia affinché la sua diffusione renda sempre più facile riutilizzare i dati presenti in Rete. Questa è la cloud mondiale dei dati.

Il nostro progetto

Per questo motivo si è scelto di puntare su una tecnologia cosi innovativa, il progetto LOD Avalanche è stato curato, grazie all’associazione Mubat (www.mubat.it) da regesta.exe (www.regesta.com), partner tecnologico del progetto con esperienza internazionale nel mondo dei Linked Open Data. L’iniziativa rientra anche nel progetto Erasmus plus “the house of rising memory” che l’Istituto Alfonso Gatto sta coordinando da quasi due anni con il College Diderot in Normandia.

Nel nostro progetto sono stati estratti i dati dall’archivio digitale xDams e trasformati in formato RDF per poterli pubblicare sun un database pubblico (triplestore).  I dati sono al momento fruibili nel formato web tradizionale e anche su una installazione di test e all’indirizzo http://195.78.211.120/lodview/project/mubat.html nonchè sul portale realizzato mediante un’altra applicazione Open Source di regesta.exe, ovvero LODView, un browser di navigazione LOD molto diffuso.

Il rilascio dell’infrastruttura tecnologica non è un punto d’arrivo quanto di partenza perché ora occorre rendere maggiore la consistenza dell’archivio affinché possa assolvere all’obiettivo stesso per cui è nato: ovvero porsi come riferimento web a riguardo dell’operazione Avalanche. Uno dei nodi nella prossima versione della LOD cloud che vedete di seguito sarà il progetto Avalanche a Battipaglia.

The Avalanche operation in the Cloud: culture and innovation

The research of the cultural contents of the Avalanche project has always gone hand in hand with technological innovation since, in today’s world, the conservation (and dissemination) of knowledge cannot ignore the exploitation and potential offered by digital technologies.

In the 2019 edition in May we have already published the digital archive of the youngsters on the website www.avalancheday.org and the year now closes with a new important result that adds a further step to the project of making the city of Battipaglia a protagonist of enhancement of the Avalanche operation and of the whole territory, theatre of that important experience.

The digital archive/catalogue, being set up thanks to the Italian Open Source platform xDams (www.xdams.org), is now published not only in the traditional web form but, again via the Internet, also in Open Data format and more specifically in Linked Open Data.

What are Open Data and Linked Open Data

Open Data is a great tool for sharing knowledge because the information not only is published freely but it is also made reusable for further and different purposes, so that further knowledge is generated from knowledge. The information is published as “data” and therefore offered in an accessible manner so that it can be reprocessed. The characteristic of open data is that the reuse of data can take place automatically without being forced to extrapolate information from a post.

Let’s take an example: I have identified 10 places where there was fighting in 1943. I want to share this information with everyone, so I write a post, in which I describe the characteristics of these 10 sites, and I release my text under a creative commons license that allows anyone to use what I wrote. If someone is interested in reproducing all the text, he/she will have no difficulty but, if he/she wants to build an app in order to create a cultural itinerary, he/she must extract the information from my text (name, city, coordinates, opening hours, etc.).

Releasing this information as Open Data means building an output that contains only the essential data, extrapolated from the descriptive context, for example a minimum open data level can be constituted by the publication of an excel sheet.

All the major international and national organizations have been committed in recent years to promoting the dissemination of open data.

The main limitation of open data, in formats such as excel, is that I must upload the information to my database and, if the producer updates the information, I have to repeat the import.

What are Linked Open Data (LOD)

In this context, Linked Open Data can be considered the most innovative level that can be offered for the reuse of data because it is absolutely “machine readable”, that is, it can be re-processed by a computer without having to involve the original producer of the data. The data published with this technology can also be linked to data present in other Open archives through links thus making sure that the enormous cloud of world knowledge grows more and more. With a certain simplification (due to the need for synthesis), I can say that through Linked Data my resource (for example the Avalanche operation event) is connected to another one already present (very often the Wikipedia entry is used as a reference) and this allows then to link my data to all the data present in LOD format that refer, directly or indirectly, to the chosen resource.

My data, my archive are no longer single and isolated entities but are inserted in wider contexts, furthermore the technology that can be used with LODs provides the possibility to access the data directly from a point provided by the data provider (endpoint).

The explanation is a bit complex, but we can help ourselves by resuming the example introduced before, the app developer, who in the previous point downloaded the excel file to get my data; now he can connect to my endpoint to build his routes. One of my places is Salerno and the developer knows, from my data, that this resource corresponds to the Wikipedia entry “Salerno”. There are large Mibac databases on the cultural heritage of the territory, through linked open data I know that some of the objects described are connected to Salerno. At this point the developer can also use this data to describe an increasingly complete scenario of the cultural, historical and natural heritage of the “Battle of Salerno” area.

Anyone can use the data of the project of our city to offer new and innovative services and apps.

Sir Tim Berners Lee, universally recognized as the father of the Web with his famous “proposal” to the CERN, has been undertaking an awareness campaign for several years to promote the use of this technology so that its dissemination makes it easier and easier to reuse data present on the Net. This is the global data cloud.

Our project

For this reason, it was decided to focus on such an innovative technology. The LOD Avalanche project was managed thanks to the Mubat association (www.mubat.it) by regesta.exe,  technological partner of the project with international experience in the world of Linked Open Data. The initiative is also part of the Erasmus plus project “the house of rising memory” that the Alfonso Gatto Institute has been coordinating for almost two years with the Diderot College in Normandy.

In our project the data was extracted from the xDams digital archive and transformed into RDF format to be able to publish them on a public database (triplestore). The data are currently available in the traditional web format and also on a test installation and at the address http://195.78.211.120/lodview/project/mubat.html , as well as on the portal created using another Open Source application by regesta.exe, or LODView, a very popular LOD navigation browser.

The release of the technological infrastructure is not a point of arrival, but a starting point because now it is necessary to increase the consistency of the archive so that it can serve its purposes: that is to act as a web reference regarding the Avalanche operation. One of the nodes in the next version of the LOD cloud that you see below will be the Avalanche project in Battipaglia.

Opération Avalanche dans le Cloud : culture et innovation

La recherche des contenus culturels du projet Avalanche est toujours allée de pair avec l’innovation technologique puisque, dans le monde d’aujourd’hui, la conservation (et la diffusion) des connaissances ne peut ignorer l’exploitation et le potentiel offerts par les technologies numériques.

Dans l’édition 2019, nous avons déjà publié les archives numériques des enfants sur le site Web www.avalancheday.org en mai et l’année se termine maintenant avec un nouveau résultat important qui ajoute une étape supplémentaire au projet de faire de la ville de Battipaglia un protagoniste de valorisation de l’opération Avalanche et de l’ensemble du territoire, théâtre de cette importante expérience.

L’archive/catalogue numérique, en cours de constitution grâce à la plateforme italienne Open Source xDams (www.xdams.org), est désormais publiée non seulement sous la forme web traditionnelle mais, toujours via Internet, également au format Open Data et plus précisément dans les données ouvertes liées.

Que sont les données ouvertes et les données ouvertes liées

Les données ouvertes sont un excellent outil pour partager les connaissances, car non seulement les informations sont publiées librement, mais elles sont également réutilisables à d’autres fins, de sorte que des connaissances supplémentaires soient générées à partir des connaissances. Les informations sont publiées en tant que « données » et donc proposées de manière accessible afin qu’elles puissent être retraitées. La particularité des données ouvertes est que la réutilisation des données peut s’effectuer automatiquement sans être obligé d’extrapoler des informations à partir d’un poste.

Prenons un exemple : j’ai identifié 10 endroits où ils ont combattu en 1943. Je veux partager cette information avec tout le monde et ensuite j’écris un post où je décris les caractéristiques de ces 10 sites, je publie mon texte avec une licence creative commons qui permet à quiconque d’utiliser ce que j’ai écrit. Si quelqu’un est intéressé à reproduire tout le texte, il n’aura aucune difficulté mais s’il veut créer une application avec laquelle créer un itinéraire culturel, il doit extraire les informations de mon texte (nom, ville, coordonnées, heures d’ouverture, etc. ).

Diffuser ces informations en Open Data signifie construire une sortie qui ne contient que les données essentielles, extrapolées à partir du contexte descriptif, par exemple un niveau minimum de données ouvertes peut être constitué par la publication d’une feuille excel.

Toutes les grandes organisations internationales et nationales se sont engagées ces dernières années à favoriser la diffusion des données ouvertes.

La principale limitation des données ouvertes, dans des formats tels qu’Excel, est que je dois télécharger les informations dans ma base de données et si le producteur met à jour les informations, je dois répéter l’importation.

Que sont les données ouvertes liées (LOD)

Dans ce contexte, Linked Open Data peut être considéré comme le niveau le plus innovant qui puisse être proposé pour la réutilisation des données car il est absolument « machine readable », c’est-à-dire qu’il peut être retraité par un ordinateur sans avoir à impliquer l’original producteur des données. Les données, publiées avec cette technologie, sont également « liables » aux données d’autres archives ouvertes, de sorte que l’énorme nuage de connaissances mondiales se développe de plus en plus. Avec une certaine simplification (due au besoin de synthèse) grâce aux données liées je peux dire que ma ressource (par exemple l’événement d’opération Avalanche) est connectée à une déjà présente (très souvent l’entrée Wikipedia sert de référence) et cela permet ensuite de lier mes données à toutes les données présentes au format LOD qui renvoient, directement ou indirectement, à la ressource choisie.

Mes données, mes archives ne sont plus des entités uniques et isolées mais sont insérées dans des contextes plus larges, de plus la technologie utilisable avec les LOD permet d’accéder directement aux données depuis un point fourni par le fournisseur de données (endpoint).

L’explication est un peu complexe mais nous pouvons nous entraider en intégrant l’exemple présenté précédemment, le développeur de l’application, qui au point précédent a téléchargé le fichier excel pour récupérer mes données, maintenant vous pouvez vous connecter à mon endpoint pour construire ses itinéraires. L’un de mes endroits est Salerne et le développeur sait, à partir de mes données, que cette ressource correspond à l’entrée Wikipedia “Salerno”. Il existe de grandes bases de données Mibac sur le patrimoine culturel du territoire, grâce à des données ouvertes liées, je sais que certains des objets décrits sont liés à Salerne. À ce stade, le développeur peut également utiliser ces données pour décrire un scénario de plus en plus complet du patrimoine culturel, historique et naturel de la zone “Bataille de Salerne”.

Tout le monde peut utiliser les données du projet de notre ville pour proposer des services et des applications nouveaux et innovants.

Sir Tim Berners Lee, universellement reconnu comme le père du Web avec sa fameuse “proposition” au CERN, a entrepris depuis plusieurs années une campagne de sensibilisation pour promouvoir l’utilisation de cette technologie afin que sa diffusion rende de plus en plus facile la réutilisation des données présentes sur le Net. C’est le cloud de données mondial.

Notre projet

Pour cette raison, il a été décidé de se concentrer sur une technologie aussi innovante, le projet LOD Avalanche a été géré, grâce à l’association Mubat (www.mubat.it) par regesta.exe (www.regesta.com), partenaire technologique du projet .avec une expérience internationale dans le monde de Linked Open Data. L’initiative s’inscrit également dans le projet Erasmus plus « la maison de la mémoire montante » que l’Institut Alfonso Gatto coordonne depuis près de deux ans avec le Collège Diderot en Normandie.

Dans notre projet, les données ont été extraites de l’archive numérique xDams et transformées au format RDF pour pouvoir les publier sur une base de données publique (triplestore). Les données sont actuellement disponibles au format web traditionnel et également sur une installation de test et à l’adresse http://195.78.211.120/lodview/project/mubat.html ainsi que sur le portail créé à l’aide d’une autre application Open Source de regesta. exe, ou LODView, un navigateur de navigation LOD très populaire.

La libération de l’infrastructure technologique n’est pas un point d’arrivée mais un point de départ car maintenant il faut augmenter la cohérence de l’archive pour qu’elle puisse remplir le même objectif pour lequel elle est née : c’est-à-dire servir de référence web concernant l’opération Avalanche. L’un des nœuds de la prochaine version du cloud LOD que vous voyez ci-dessous sera le projet Avalanche à Battipaglia.

Salerno War Cemetery
William Wyler e John Sturges, Hollywood in guerra