prof. Nunzio Brugaletta BIt WOrld

EnneBi - Computer Science
Avanti Indietro Inizio


Codifica e conservazione di dati digitali

Inizialmente il computer veniva utilizzato per l'elaborazione di dati numerici o alfanumerici ma con il passare del tempo, la diffusione dei personal computer e la presa di coscienza, da parte degli utenti, delle potenzialità di queste macchine, sorge l'esigenza e si studiano i modi come utilizzare il computer per l'elaborazione di informazioni più generali. I problemi che si pongono a questo punto sono di due ordini:

Le convenzioni utilizzate per scrivere, interpretare e leggere i contenuti di un file vengono chiamate formato di file. Un file è semplicemente una stringa di byte e per rappresentare cose diverse è indispensabile stabilire il significato dei singoli byte: per esempio in un file che conserva una immagine, i primi byte potrebbero essere interpretabili come le dimensioni dell'immagine stessa. Il formato di un file può essere identificato:

Estensione

Tipo di file

.txt

File di testo puro senza formattazioni

.odt

File generati da Writer di OpenOffice

.doc .docx

File generati da Word di Office

.htm .html

Pagine web statiche

.php .asp

Pagine web dinamiche

.zip .rar

File compressi

.png .gif .jpg

File contenenti immagini

.vaw .mp3 .ogg

File sonori

.avi .mpeg. .flv

File video

In molti casi le specifiche di formato, il modo con cui sono stati codificati i dati, sono pubblicate ma esistono casi in cui il formato del file è considerato segreto industriale. In conseguenza si parla di formato aperto quando sono note le specifiche e di formato chiuso quando invece non sono note. Nel caso si tratti di un formato aperto non è indispensabile avere l'applicativo che ha generato il file per poterlo rileggere: è sempre possibile sviluppare un nuovo software che sia in grado di leggere il file.

Se si tratta di formato chiuso il file può essere aperto solo dall'applicazione che lo ha generato limitando la libertà dell'utente. Se si tratta di formati molto utilizzati (è il caso, per esempio, del formato .doc di Word) e si vuole leggere il file anche con software diversi rispetto a quelli con cui sono stati generati, si possono usare (sono le tecniche adottate dagli sviluppatori di OpenOffice) tecniche di reverse engineering. Si effettuano tante prove esaminando ogni volta il file ottenuto e si cerca di capire la codifica dei dati. Il reverse engineering fornisce risultati sempre più affidabili quante più sono le prove e le verifiche effettuate.



Avanti Indietro Inizio

http://ennebi.solira.org ennebi@solira.org