Microsoft Office e i segreti dell’Xml

di |
logomacitynet696wide

Che cosa vuol dire che l’azienda di Redmond utilizzerà l’eXtensible Markup Language come formato standard per i file della prossima versione della sua suite? Che cos’è l’Xml, in realtà? Macity ha sentito al riguardo un esperto dell’Università di Milano, che ci ha spiegato brevemente i rischi che si possono correre.

Come avevamo visto alcuni giorni fa, Microsoft abbraccerà  l’Xml come formato standard per i suoi documenti. L’eXtensible Markup Language è tuttavia un insieme di standard da tempo diffusi che popolano soprattutto la rete.

I feed Rss sono un tipo di Xml, così come molte basi di dati utilizzate ad esempio dai moderni web-server oppure da altre applicazioni web-based. L’impatto che Microsoft potrebbe avere in questo mondo è paragonabile a quello che a suo tempo ebbe Internet Explorer e Frontpage, cioè portare “fuori standard” lo standard?

Abbiamo sentito Mattia Monga, ricercatore del Dipartimento di informatica e comunicazione dell’Università  statale di Milano e gli abbiamo fatto alcune veloci domande.

Quali sono le caratteristiche di un documento Xml?

Ogni documento XML deve essere ben formato e valido. Ben formato significa che rispetta le regole minime dell’XML, la forma dei tag. Per esempio, ogni tag deve apririsi – usiamo le parentesi quadrate al posto dei segni di maggiore e minore – così: [pippo] e chiudersi [/pippo] e i tag non possono “accavallarsi”, devono cioè essere ben parentesizzati. Perché sia valido, poi, un documento deve essere conforme ad un DTD, che è una grammatica specifica del documento (l’url del dtd è richiamato nella prima riga dell’xml, di solito) che stabilisce quali tag possono essere usati e in quale ordine ([pippo] puo` venire solo dopo [pluto] e se c’è [paperino] non c’è [gastone], ad esempio).

Quali rischi ci sono di uscire dalla standardizzazione, dai dettami dell’Xml?

Il primo è che il dtd può non essere pubblico. Questo vuol dire che non sono in grado di stabilire qual è la forma “generale” del documento. Se ho un po’ di esempi posso però cercare di capire le regole in maniera più facile che col formato binario

Altri rischi?

Il secondo rischio è che il dtd può reinventare la ruota. E` in corso un grande sforzo per la produzione di dtd standard per moltissime cose (per esempio per le date, i libri, eccetera): ciò facilita l’adozione di semantiche comuni anche senza la necessità  di vere e proprie ontologie condivise. Ovviamente, se uno si ridefinisce il tag capitolo, paragrafo, e via dicendo, qesto può essere un ostacolo alla diffusione di dtd standard.

Cosa potrebbe succedere con i documenti Xml di Microsoft?

Posso dare solo una risposta generale perché non conosco nello specifico i dettagli del caso di Microsoft. Credo che il problema sia soprattutto il secondo (con qualche spruzzata del primo qui e là ), ma, ripeto, non conosco nel dettaglio la diatriba.