Requisito n. 1
Enunciato: organizzare e delineare la struttura logica del libro di testo utilizzando gli stili di paragrafo.
Perché questa richiesta di utilizzare gli stili di paragrafo? Che avranno mai di così importante? E cosa sono i tag di Acrobat?
Il formato PDF dispone di un proprio set di tag standard, un po’ come fosse una DTD (è soltanto una semplificazione, non prendetela alla lettera), e dispone di vari elementi, adatti a descrivere il significato semantico dei contenuti a cui si applicano.
I tag PDF presentano molte similitudini con i tag XML. I tag PDF indicano la struttura del documento, per esempio la porzione di testo che costituisce un’intestazione, una sezione, un segnalibro e così via.
La struttura organizzativa del documento viene rappresentata da una struttura logica ad albero. Questa struttura indica l’ordine di lettura preciso e agevola la navigazione, specialmente nel caso di documenti lunghi e articolati senza modificare l’aspetto grafico del PDF.
La struttura ad albero consente alla tecnologia assistiva di interpretare il contenuto del documento e di presentarlo in modo appropriato.
La maggior parte delle tecnologie assistive, come gli screen reader, utilizza i tag presenti nella struttura del documento per stabilire l’ordine di lettura del testo opportuno e per trasmettere il significato di immagini e altri elementi del contenuto in un formato alternativo, per esempio un formato audio.
Un documento senza tag è sprovvisto delle informazioni sulla struttura, pertanto è necessario che Acrobat le ricavi rispettando le impostazioni definite nelle Preferenze del programma per l’ordine di lettura. In questi casi spesso si verifica che gli elementi di una pagina vengano letti nell’ordine errato, o che vengano completamente ignorati.
La struttura ad albero logica è visibile nel pannello Tag, che rappresenta il contenuto del documento come se fosse costituito da blocchi informativi nidificati (in Acrobat, aprire un file PDF e selezionare Vista > Pannelli di navigazione > Tag – Figura 1).
Se avete creato il PDF a partire da un documento in cui sono presenti stili di paragrafo, noterete come questi stili siano stati trasformati in “tag di Acrobat”.
La mappa ruolo
Per rendere accessibile il documento, è necessario mappare i tag creati a partire dal programma utilizzato per creare il pdf ai tag standard di Acrobat.
I tag standard rendono disponibili a software e periferiche di supporto elementi strutturali e semantici per l’interpretazione della struttura del documento e la presentazione del contenuto in un formato significativo per l’utente.
Per esempio, è possibile che un file PDF presenti tag XML acquisiti da uno schema XML o, come abbiamo visto, tag generati a partire dagli stili di paragrafo. Per rendere il PDF realmente accessibile, è necessario che i tag personalizzati dispongano di una mappa ruolo. In questo modo la tecnologia assistiva potrà estrarre informazioni semantiche dal documento, come l’elenco dei titoli presenti e il loro livello, elenchi puntati e numerati, tabelle, figure analogamente a quanto normalmente facciamo scansionando una pagina visualmente.
La mappa ruolo consente di correlare ciascun tag personalizzato a un tag standard.
I tipi di tag standard per elementi Adobe sono disponibili nelle finestre di dialogo Nuovo tag e Proprietà Ritocco di Acrobat.
Gli elementi standard PDF sono (dall’help di Acrobat):
Elementi contenitore
Gli elementi contenitore rappresentano il livello più alto e offrono un raggruppamento gerarchico agli altri elementi di livello blocco.
<Document>- L’elemento principale nella struttura ad albero tag di un documento.
<Part>- Rappresenta una suddivisione ampia del documento e può raggruppare unità di contenuto di dimensioni inferiori, ad esempio elementi reparto, articolo o sezione.
<Div>- È un elemento di livello blocco generico o un gruppo di elementi di livello blocco.
<Art>- È un corpo del testo indipendente e viene considerato un resoconto singolo.
<Sect>- Si tratta di un tipo di elemento contenitore generico, paragonabile a Reparto (DIV Class=“Sect”) in codice HTML; in genere è un componente di un elemento parte o articolo.
Elementi titolo e paragrafo
Sono elementi di blocco che includono specifici livelli di titoli e paragrafi di testo generici <P>. Un elemento <H> può presentarsi come primo child di un livello div superiore. Per le situazioni in cui non esistono sezioni annidate sono disponibili sei livelli di titolo <H1>–<H6> generici.
Elementi etichetta ed elenco
Gli elementi etichetta ed elenco sono elementi di livello blocco utilizzati per conferire una struttura agli elenchi.
<L>- Una qualsiasi sequenza di voci dal significato o da un altro tipo di pertinenza simile. È possibile che gli elementi secondari diretti siano elementi voce di elenco.
<LI>- Qualsiasi voce inclusa in un elenco. È possibile che presenti un elemento etichetta (facoltativo) e corpo elenco (obbligatorio) come elemento secondario.
<LBL>- Etichetta. Un punto elenco, un nome o un numero di identificazione per distinguere un elemento dagli altri all’interno dello stesso elenco.
<LBody>- Elemento corpo elenco. Il contenuto descrittivo di una voce di elenco.
Elementi testo speciale
Gli elementi di testo speciale identificano parti del testo non utilizzate come paragrafo generico (P).
<BlockQuote>- Elemento virgolette blocco. Uno o più paragrafi attribuiti ad un autore diverso da quello del testo immediatamente circostante.
<Caption>- Elemento didascalia. Una breve parte di testo che descrive una tabella o una figura.
<Index>- Elemento indice. Una sequenza di voci contenenti testo identificativo ed elementi di riferimento che indicano la ricorrenza di tale testo nel corpo principale del documento.
<TOC>- Elemento sommario. Un elemento contenente un elenco strutturato di voci ed etichette che identificano le voci e dotato di una struttura gerarchica separata.
<TOCI>- Elemento voce di sommario. Un elemento contenuto in un elenco associato ad un elemento sommario.
Elementi tabella
Gli elementi tabella conferiscono struttura alle tabelle.
<Table>- Elemento tabella. Una disposizione bidimensionale di celle di testo o di dati contente elementi riga di tabella come elementi secondari, nonché un elemento didascalia come primo o ultimo elemento secondario (facoltativo).
<TR>- Elemento riga di tabella. Una riga di intestazioni o dati in una tabella. È possibile che contenga elementi di cella di tipo intestazione di tabella e dati di tabella.
<TD>- Elemento di cella dati di tabella. Una cella di tabella contenente dati diversi dal tipo intestazione.
<TH>- Elemento di cella intestazione di tabella. Una cella di tabella contenente un’intestazione o dei dati che descrivono una o più righe oppure colonne di una tabella.
Elementi di livello in linea
Gli elementi di livello in linea identificano una porzione di testo caratterizzata da una formattazione o un comportamento specifico. Sono distinti dagli elementi di livello blocco. È possibile che gli elementi di livello in linea contengano o siano inclusi in elementi di livello blocco.
<BibEntry>- Citazione bibliografica. Una descrizione che riporta la fonte originale delle informazioni menzionate nel testo.
<BlockQuote>- Una parte di testo in linea attribuita ad un autore diverso da quello del testo circostante. È un elemento distinto da virgolette blocco, che a differenza del testo in linea includono uno o più paragrafi per intero.
<Span>- Un segmento di testo in linea qualsiasi. In genere, viene utilizzato per delimitare del testo associato ad un gruppo di proprietà di stile.
Elementi di livello in linea speciali
Sono simili agli elementi in linea; descrivono una parte di testo in linea caratterizzata da una formattazione o un comportamento speciale.
<Code>- Elemento voce codice. Codice di programmazione informatica incorporato in un documento.
<Figure>- Elemento voce figura. Una rappresentazione visiva o un elemento di grafica associato al testo cui si riferisce.
<Form>- Elemento voce modulo. Un’annotazione modulo PDF compilabile o già compilata.
<Formula>- Elemento voce formula. Una formula matematica.
<Link>- Elemento voce collegamento. Un collegamento ipertestuale incorporato in un documento. L’oggetto di destinazione può essere all’interno dello stesso documento, in un altro file PDF oppure su un sito Web.
<Note>- Elemento voce nota. Documentazione o testo esplicativo, ad esempio una nota a piè di pagina o di chiusura, a cui viene fatto riferimento all’interno del corpo del testo principale.
<Reference>- Elemento voce riferimenti. Una citazione di testo o dati non inclusi nel documento.
Tutti questi elementi sono disponibili nella scheda Tag di Acrobat Pro, che permette di applicarli ai vari elementi del documento o di modificare i tag assegnati.
In questo modo il file PDF godrà di diversi vantaggi, poiché i tag standard rendono disponibili a software e periferiche di supporto un gruppo basilare di elementi strutturali e semantici per l’interpretazione della struttura del documento e la presentazione del relativo contenuto in un formato significativo per l’utente.
Inoltre, la conversione a altri formati sarà senza dubbio più precisa ed efficace (per esempio, quando viene creata una versione del documento in HTML).
- Per visualizzare e modificare le mappe ruolo degli elementi, selezionare Modifica mappa ruolo nel menu del pannello Tag.
- Nella finestra di dialogo che si aprirà (Figura 2), espandere la struttura per visualizzare i tag personalizzati presenti nel documento (a sinistra) e il tag standard Acrobat assegnato (a destra).
- Per modificare il ruolo di un elemento, selezionare l’elemento e fare clic sul pulsante Modifica elemento (il pulsante non è disponibile fino a quando non viene selezionato un elemento.
- Digitare nella casella di testo Valore il nome dell’elemento standard PDF da mappare al tag personalizzato (rispettando maiuscole/minuscole, per esempio H1 e non h1).
Il ruolo assegnato varrà per tutti i tag personalizzati presenti nel documento. Nell’albero dei tag non sarà visibile alcuna modifica, ma la tecnologia assistiva utilizzerà per renderizzare il documento i ruoli da noi assegnati.
Tag:mappa ruolo, PDF, stili di paragrafo

