2011-04-24 07:36:29 +0000 2011-04-24 07:36:29 +0000
155
155

Comment puis-je déterminer le type de fichier sans extension sous Windows ?

Il m'arrive de recevoir de mes clients des fichiers dont l'extension de fichier est incorrecte. Par exemple, le nom est image.jpg mais le fichier est en fait une image TIFF. Dans de nombreux cas, je peux le clarifier en ouvrant le fichier dans un éditeur de texte, en regardant les premiers octets, puis en déduisant de quel type de fichier il s'agit.

Cela fonctionne pour moi avec les fichiers JPEG, TIFF, GIF et PDF. Cependant, il existe beaucoup d'autres types de fichiers.

Est-il possible d'automatiser l'identification du type de fichier correct en analysant les données qu'il contient ?

Réponses (5)

147
147
147
2011-04-24 07:47:21 +0000

Vous pouvez utiliser l'outil TrID qui dispose d'une bibliothèque croissante de définitions de types de fichiers pour identifier les fichiers avec.

Les caractères génériques sont supportés, donc dans votre exemple vous pourriez simplement mettre toutes les images à examiner dans un dossier, par exemple C:\verifyimages - ensuite vous pouvez utiliser la commande :

trid C:\verifyimages\*

Cela permettra d'examiner tous les fichiers du dossier verifyimages.


Il existe également une version GUI, TrIDNet :

Il existe une documentation sur la manière dont vous pouvez facilement intégrer TrID ou TrIDNet dans l'explorateur Windows et Total Commander :

Windows Explorer

Total Commander

53
53
53
2011-04-24 07:38:08 +0000

fichier

Fichier teste chaque argument pour tenter de le classer. Il existe trois séries de tests, effectués dans cet ordre : les tests de système de fichiers, les tests de nombre magique et les tests de langue. Le premier test qui réussit provoque l'impression du type de fichier.

Le type imprimé contient généralement l'un des mots text (le fichier ne contient que des caractères d'impression et quelques caractères de contrôle courants et est probablement lisible sans danger sur un terminal ASCII), executable (le fichier contient le résultat de la compilation d'un programme sous une forme compréhensible pour un noyau UNIX ou un autre), ou data signifiant autre chose (les données sont généralement “binaires” ou non imprimables). Les exceptions sont les formats de fichiers bien connus (fichiers de base, archives tar) dont on sait qu'ils contiennent des données binaires.

14
14
14
2011-04-24 13:16:09 +0000

J'ai travaillé pour la Bibliothèque nationale française, pour construire un système d'archives numériques qui contient non seulement des livres numérisés mais aussi des millions d'artefacts numériques avec toutes sortes de types de fichiers étranges. Nous avons utilisé JHOVE pour reconnaître les formats de fichiers.

JHOVE est un logiciel libre, il est maintenu par JSTOR et la bibliothèque de l'université de Harvard. Il est assez simple d'utiliser JHOVE .

1
1
1
2018-06-04 11:24:55 +0000

Vous pouvez vérifier le type de fichier depuis n'importe quel ordinateur, y compris Windows, à http://www.checkfiletype.com

1
1
1
2011-04-24 11:30:15 +0000

J'utilise les bibliothèques OutsideIn Oracle’s dans mes programmes. Ce n'est pas gratuit, mais ça marche bien, surtout pour les images. Le marché dit qu'il supporte plus de 500 types de fichiers.