Страница 2 из 2

Re: файлы с расширением ABS

Добавлено: 09 окт 2011, 16:58
KSA
Да дело тёмное, вы правы... ;-)

Re: файлы с расширением ABS

Добавлено: 10 окт 2011, 19:08
Olej
Olej писал(а): Явно, что она использует магик-символы начальные...
Рассмотрение содержимого файла /usr/share/misc/magic многое проясняет.
- там не просто magic начальные символы файла принимаются в рассчёт...
- а многокритериальные определения по наличию-совпадению многих полей,
- вот для .odt документа:

Код: Выделить всё

# OpenOffice.org / KOffice / StarOffice documents
# Listed here because they ARE zip files
#
# From: Abel Cheung <abel@oaka.org>
>30     string          mimetype
...
# OpenDocument formats (for OpenOffice 2.x / StarOffice >= 8)
# http://lists.oasis-open.org/archives/office/200505/msg00006.html
>>50    string  vnd.oasis.opendocument. OpenDocument
>>>73   string  text
>>>>77  byte    !0x2d                   Text
!:mime  application/vnd.oasis.opendocument.text
...
- вот и эти поля в теле документа:

Код: Выделить всё

[olej@nvidia Kernel.BOOK.WWW]$ hexdump -s30 -n8 -c KERN_GPL.4.95.odt
000001e   m   i   m   e   t   y   p   e
0000026
&

Код: Выделить всё

[olej@nvidia Kernel.BOOK.WWW]$ hexdump -s50 -n23 -c KERN_GPL.4.95.odt
0000032   v   n   d   .   o   a   s   i   s   .   o   p   e   n   d   o
0000042   c   u   m   e   n   t   .
0000049
&

Код: Выделить всё

[olej@nvidia Kernel.BOOK.WWW]$ hexdump -s73 -n4 -c KERN_GPL.4.95.odt
0000049   t   e   x   t
000004d
& ...

Re: файлы с расширением ABS

Добавлено: 10 окт 2011, 19:29
Olej

Код: Выделить всё

[olej@nvidia Kernel.BOOK.WWW]$ cat utf.jpg 
UTF8 текстовый файл
[olej@nvidia Kernel.BOOK.WWW]$ file utf.jpg 
utf.jpg: UTF-8 Unicode text
- как работает распознавание UTF-8 Unicode - я не понимаю :-?, в магик-файле это записано так:

Код: Выделить всё

0       string  \335\163\146\163        Unicode text, UTF-8-EBCDIC
0       string  \376\377\000\000        Unicode text, UTF-32, big-endian
0       string  \377\376\000\000        Unicode text, UTF-32, little-endian
0       string  \016\376\377            Unicode text, SCSU (Standard Compression Scheme for Unicode)

Re: файлы с расширением ABS

Добавлено: 12 мар 2012, 19:56
tundra37
А вот это я скажу. Очень давно я заметил, что виндовый блокнот стал записывать в текстовый файл какой-то мусор вначале. Это началось, когда Винда стала работать с уникодом. Поэтому я перестал им пользоваться, а испорченные файлы правил в других редакторах. И вот сегодня я прочел непонятную фразу : записать UTF-8 без BOM :-o
Решил почитать. Оказалось что BOM - это НЕВИДИМЫЕ СИМВОЛЫ. С одной стороны это маркеры кодировки, а с другой почти ничему не мешают. Мешают они только если блокнотом готовить , например, файл PHP. Оно не работает после этого. Похоже именно по этим BOM и работает file. Если записать другим редактором, например Akel - file ничего не определит.