prof. Nunzio Brugaletta | BIt WOrld |
Inizialmente il computer veniva utilizzato per l'elaborazione di dati numerici o alfanumerici ma con il passare del tempo, la diffusione dei personal computer e la presa di coscienza, da parte degli utenti, delle potenzialità di queste macchine, sorge l'esigenza e si studiano i modi come utilizzare il computer per l'elaborazione di informazioni più generali. I problemi che si pongono a questo punto sono di due ordini:
Come trasformare in dati digitali (che utilizzano soltanto i due stati 1 e 0) informazioni riguardanti cose che, almeno all'apparenza, sembrano non avere niente a che fare con il mondo digitale: una immagine, un suono, un'animazione. In questi casi si tratta di studiare i modi migliori per conservare e riprodurre una immagine o un suono nel modo più vicino possibile alla realtà. Per fare un esempio relativo ad altri ambiti si può pensare alle regole della prospettiva che permettono di rappresentare un oggetto tridimensionale in un foglio di carta che, per sua natura, si presterebbe soltanto a rappresentare oggetti bidimensionali. Nei prossimi paragrafi si esporranno le principali tecnologie che stanno alla base della digitalizzazione di dati multimediali.
Come conservare, per esempio, in una memoria di massa i dati digitali. Seguendo l'esempio precedente si potrebbe dire che bisogna stabilire in che modo conservare in un file, assieme ai dati sull'immagine, le regole della prospettiva in modo che un software possa, seguendo le regole descritte, interpretare in modo corretto i dati conservati.
Le convenzioni utilizzate per scrivere, interpretare e leggere i contenuti di un file vengono chiamate formato di file. Un file è semplicemente una stringa di byte e per rappresentare cose diverse è indispensabile stabilire il significato dei singoli byte: per esempio in un file che conserva una immagine, i primi byte potrebbero essere interpretabili come le dimensioni dell'immagine stessa. Il formato di un file può essere identificato:
per mezzo dell'estensione: si tratta di una serie di lettere (storicamente 3) precedute da un punto e accodate al nome del file. L'estensione indica le modalità di interpretazione del contenuto del file, servono all'utente per riconoscere immediatamente il genere del documento esaminato e può essere utilizzata per associare al file un applicativo così da permettere, in ambienti grafici, di aprire l'applicativo con il file già caricato semplicemente con un doppio click del mouse sul documento.
Alcune estensioni comuni:
Estensione |
Tipo di file |
---|---|
.txt |
File di testo puro senza formattazioni |
.odt |
File generati da Writer di OpenOffice |
.doc .docx |
File generati da Word di Office |
.htm .html |
Pagine web statiche |
.php .asp |
Pagine web dinamiche |
.zip .rar |
File compressi |
.png .gif .jpg |
File contenenti immagini |
.vaw .mp3 .ogg |
File sonori |
.avi .mpeg. .flv |
File video |
Utilizzando i magic number: in questo caso sono utilizzati i primi byte per l'identificazione. Per esempio negli script (file contenenti istruzioni per una shell) dei sistemi Linux vengono utilizzati #! (shabang).
Utilizzando descrizioni esplicite (metadati = informazioni che descrivono i dati): un esempio di questa modalità sono i cosiddetti tipi MIME (Multipurpose Internet Mail Extension). Le informazioni trasmesse in una rete sono precedute da una stringa di testo contenente il MIME content-type. Per esempio una stringa del tipo Content-type: text/plain identifica il file come testo ASCII puro.
In molti casi le specifiche di formato, il modo con cui sono stati codificati i dati, sono pubblicate ma esistono casi in cui il formato del file è considerato segreto industriale. In conseguenza si parla di formato aperto quando sono note le specifiche e di formato chiuso quando invece non sono note. Nel caso si tratti di un formato aperto non è indispensabile avere l'applicativo che ha generato il file per poterlo rileggere: è sempre possibile sviluppare un nuovo software che sia in grado di leggere il file.
Se si tratta di formato chiuso il file può essere aperto solo dall'applicazione che lo ha generato limitando la libertà dell'utente. Se si tratta di formati molto utilizzati (è il caso, per esempio, del formato .doc di Word) e si vuole leggere il file anche con software diversi rispetto a quelli con cui sono stati generati, si possono usare (sono le tecniche adottate dagli sviluppatori di OpenOffice) tecniche di reverse engineering. Si effettuano tante prove esaminando ogni volta il file ottenuto e si cerca di capire la codifica dei dati. Il reverse engineering fornisce risultati sempre più affidabili quante più sono le prove e le verifiche effettuate.
http://ennebi.solira.org | ennebi@solira.org |