файлы с расширением ABS

Мысли и размышления о развитии ОС Linux, открытого софта в целом, его общих свойствах, обсуждения всяких околопингвиньих новостей и баек.

Модераторы: Olej, adminn

Правила форума
Все сообщения не по теме форума будут, без каких либо уведомлений, удаляться, а их авторы - убираться из регистрации.
Язык сообщений - исключительно русский.
KSA
Интересующийся
Сообщения: 4
Зарегистрирован: 07 окт 2011, 15:35
Контактная информация:

Re: файлы с расширением ABS

Непрочитанное сообщение KSA » 09 окт 2011, 16:58

Да дело тёмное, вы правы... ;-)

Аватара пользователя
Olej
Писатель
Сообщения: 21338
Зарегистрирован: 24 сен 2011, 14:22
Откуда: Харьков
Контактная информация:

Re: файлы с расширением ABS

Непрочитанное сообщение Olej » 10 окт 2011, 19:08

Olej писал(а): Явно, что она использует магик-символы начальные...
Рассмотрение содержимого файла /usr/share/misc/magic многое проясняет.
- там не просто magic начальные символы файла принимаются в рассчёт...
- а многокритериальные определения по наличию-совпадению многих полей,
- вот для .odt документа:

Код: Выделить всё

# OpenOffice.org / KOffice / StarOffice documents
# Listed here because they ARE zip files
#
# From: Abel Cheung <abel@oaka.org>
>30     string          mimetype
...
# OpenDocument formats (for OpenOffice 2.x / StarOffice >= 8)
# http://lists.oasis-open.org/archives/office/200505/msg00006.html
>>50    string  vnd.oasis.opendocument. OpenDocument
>>>73   string  text
>>>>77  byte    !0x2d                   Text
!:mime  application/vnd.oasis.opendocument.text
...
- вот и эти поля в теле документа:

Код: Выделить всё

[olej@nvidia Kernel.BOOK.WWW]$ hexdump -s30 -n8 -c KERN_GPL.4.95.odt
000001e   m   i   m   e   t   y   p   e
0000026
&

Код: Выделить всё

[olej@nvidia Kernel.BOOK.WWW]$ hexdump -s50 -n23 -c KERN_GPL.4.95.odt
0000032   v   n   d   .   o   a   s   i   s   .   o   p   e   n   d   o
0000042   c   u   m   e   n   t   .
0000049
&

Код: Выделить всё

[olej@nvidia Kernel.BOOK.WWW]$ hexdump -s73 -n4 -c KERN_GPL.4.95.odt
0000049   t   e   x   t
000004d
& ...

Аватара пользователя
Olej
Писатель
Сообщения: 21338
Зарегистрирован: 24 сен 2011, 14:22
Откуда: Харьков
Контактная информация:

Re: файлы с расширением ABS

Непрочитанное сообщение Olej » 10 окт 2011, 19:29

Код: Выделить всё

[olej@nvidia Kernel.BOOK.WWW]$ cat utf.jpg 
UTF8 текстовый файл
[olej@nvidia Kernel.BOOK.WWW]$ file utf.jpg 
utf.jpg: UTF-8 Unicode text
- как работает распознавание UTF-8 Unicode - я не понимаю :-?, в магик-файле это записано так:

Код: Выделить всё

0       string  \335\163\146\163        Unicode text, UTF-8-EBCDIC
0       string  \376\377\000\000        Unicode text, UTF-32, big-endian
0       string  \377\376\000\000        Unicode text, UTF-32, little-endian
0       string  \016\376\377            Unicode text, SCSU (Standard Compression Scheme for Unicode)

tundra37
Писатель
Сообщения: 149
Зарегистрирован: 03 мар 2012, 19:26
Контактная информация:

Re: файлы с расширением ABS

Непрочитанное сообщение tundra37 » 12 мар 2012, 19:56

А вот это я скажу. Очень давно я заметил, что виндовый блокнот стал записывать в текстовый файл какой-то мусор вначале. Это началось, когда Винда стала работать с уникодом. Поэтому я перестал им пользоваться, а испорченные файлы правил в других редакторах. И вот сегодня я прочел непонятную фразу : записать UTF-8 без BOM :-o
Решил почитать. Оказалось что BOM - это НЕВИДИМЫЕ СИМВОЛЫ. С одной стороны это маркеры кодировки, а с другой почти ничему не мешают. Мешают они только если блокнотом готовить , например, файл PHP. Оно не работает после этого. Похоже именно по этим BOM и работает file. Если записать другим редактором, например Akel - file ничего не определит.

Ответить

Вернуться в «Общий по Linux и открытому софту»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 3 гостя