2011-04-24 07:36:29 +0000 2011-04-24 07:36:29 +0000
155
155

Jak mogę określić typ pliku bez rozszerzenia w systemie Windows?

Czasami dostaję pliki od moich klientów, które mają nieprawidłowe rozszerzenie pliku. Na przykład, nazwa to image.jpg, ale plik jest w rzeczywistości obrazem TIFF. W wielu przypadkach mogę to wyjaśnić otwierając plik w edytorze tekstu, patrząc na kilka pierwszych bajtów, a następnie wydedukować, jaki typ pliku to jest.

To działa dla mnie z plikami JPEG, TIFF, GIF i PDF. Istnieje jednak o wiele więcej typów plików.

Czy możliwe jest zautomatyzowanie identyfikacji właściwego typu pliku poprzez analizę danych w nim zawartych?

Odpowiedzi (5)

147
147
147
2011-04-24 07:47:21 +0000

Możesz użyć narzędzia TrID , które posiada rosnącą bibliotekę definicji typów plików do identyfikacji plików.

Obsługiwane są symbole wieloznaczne, więc w twoim przykładzie możesz po prostu umieścić wszystkie obrazy, które mają być zbadane w folderze, np. C:verifyimages - wtedy możesz użyć polecenia:

trid C:\verifyimages\*

Spowoduje to zbadanie wszystkich plików znajdujących się w folderze verifyimages.


Dostępna jest również wersja GUI, TrIDNet :

Dostępna jest dokumentacja, jak można w prosty sposób zintegrować TrID lub TrIDNet z Eksploratorem Windows i Total Commanderem:

Windows Explorer

Total Commander

53
53
53
2011-04-24 07:38:08 +0000

plik ](http://gnuwin32.sourceforge.net/packages/file.htm)

File testuje każdy argument próbując go sklasyfikować. Istnieją trzy zestawy testów, wykonywane w tej kolejności: testy systemu plików, testy liczb magicznych i testy językowe. Pierwszy_ test, który się powiedzie powoduje wypisanie typu pliku.

Wypisany typ będzie zwykle zawierał jedno ze słów tekst (plik zawiera tylko znaki drukarskie i kilka zwykłych znaków sterujących i jest prawdopodobnie bezpieczny do odczytu na terminalu ASCII), wykonywalny (plik zawiera wynik kompilacji programu w postaci zrozumiałej dla jakiegoś jądra UNIX lub innego), lub dane oznaczające cokolwiek innego (dane są zwykle “binarne” lub niedrukowalne). Wyjątkiem są dobrze znane formaty plików (pliki rdzeniowe, archiwa tar), o których wiadomo, że zawierają dane binarne.

14
14
14
2011-04-24 13:16:09 +0000

Pracowałem dla Francuskiej Biblioteki Narodowej, aby zbudować system archiwum cyfrowego, który zawiera nie tylko zdigitalizowane książki, ale także miliony cyfrowych artefaktów z różnego rodzaju dziwnymi typami plików. Używaliśmy JHOVE do rozpoznawania formatów plików.

JHOVE jest open source, jest utrzymywany przez JSTOR i Bibliotekę Uniwersytetu Harvarda. Jest raczej prosty do użycia .

1
1
1
2018-06-04 11:24:55 +0000

Typ pliku można sprawdzić z dowolnego komputera, w tym z Windows, pod adresem http://www.checkfiletype.com .

1
1
1
2011-04-24 11:30:15 +0000

W moich programach używam bibliotek Oracle’s OutsideIn libraries . Nie są one darmowe, ale działają dobrze, szczególnie dla obrazów. Mowa rynkowa mówi, że obsługuje ponad 500 typów plików.