Читать книгу Ошибки, проблемы, решения с текстами, файлами, программами. Пособие по «Технике безопасности» для начинающих айтишников и интересующихся - Ар'лан ис'Дрекхэм - Страница 9

ЧАСТЬ 1. ПРОБЛЕМЫ И ПРИЧИНЫ ВОЗНИКНОВЕНИЯ ОШИБОК ПРИ РАБОТЕ В WORD
Глава 6. Причина №6. Форматы файлов

Оглавление

А сейчас давайте приступим к рассмотрению еще одной из моих любимых тем. Это касается некоторых понятий о форматах файлов. Очень часто в интернете среди причин, вызывающих проблемы с текстовыми файлами, называют формат файла, что не в том формате сохранен файл. А дальше идут рассуждения о форматах и советы по исправлению. В данной ситуации очень обидно, что даже на сайте службы поддержки Ms Office дают также неправильные советы, а другие эти советы подхватывают.

Для начала давайте возьмем для примера несколько вопросов и ответим на них со стороны простого пользователя. За информацией для ответов на поставленные вопросы обращаться к общеизвестным источникам не будем.

Вопросы, которые являются разгадкой в решении проблем:

· Что такое формат?

· Чем отличаются между собой форматы?

· В каком формате лучше сохранить документ в *.doc, *.docx, *.rtf или еще в каком?

· С каким форматом чаще возникают проблемы?

Что такое формат?

Каждая программа работает с определенным типом файлов. Одни работают только с изображениями, другие – только с видео, а третьи – с текстами. Мы с Вами будем рассматривать сейчас форматы, связанные с текстами и изображениями.

Для каждой программы есть свой родной формат, который создавался для этой программы, а также есть универсальный формат, с которым могут без проблем работать другие программы. Сейчас файлы разных программ, сохраненные в родном формате, открываются другими программами без проблем.

Для Word родным форматом файлов являются *.rtf, *.doc и *.docx, эти форматы создавались разработчиками Word. Формат *.rtf многие считают, что он является универсальным для многих программ, а программисты его включают в список выгружаемых файлов из АС. Я не знаю, насколько, он является универсальным, т.к. он приносит много проблем, и считаю, что он больше подходит программистам и специалистам для поиска и определения проблем в тексте.

При рассмотрении вопросов, связанных с форматом, вспомнила, как, работая много лет тому назад системным программистом на ЕС ЭВМ, часто решала проблемы, возникающие при работе программ и операционной системы. Приходилось распечатывать в шестнадцатеричном виде ядро системы или программу, как показано на Рис. 1.6.1., чтобы определять проблему и адрес проблемы. Это очень помогало при поиске решения многих проблем с файлами и текстами.


Рис. 1.6.1. Текст, представленный в шестнадцатеричном виде


Первый столбик является адресом первого символа строки в шестнадцатеричном виде, второй столбик представляет текст в шестнадцатеричном виде, а третий столбик представляет сам текст.

На следующем Рис. 1.6.2. с помощью программы «Блокнот» представлена внутренняя структура текста, сохранённого в файле форматом *.rtf.


Рис. 1.6.2. Пример текста из файла в формате *.rtf


Я не сразу научилась работать с форматом *.rtf. Для меня вначале это было какой-то абракадаброй. А когда я представила текст в виде структуры или текста программы, то сразу разобралась с ним и стала быстро определять причины проблем.

Программы LibreOffice Writer или OpenOffice имеют свой родной формат «ODT», но в тоже время эти программы прекрасно открывают файлы всех форматов Word. Word открывает файлы формата «ODT».

Формат *.rtf универсален не только тем, что может использоваться разными программами, но может еще использоваться в старых версиях программ, с небольшими и решаемыми проблемами, если только в новой версии текстового редактора не использовались новые возможности при подготовке текста, формул.

Чем отличаются между собой форматы?

Для начала мы рассмотрим, как выглядят форматы различных файлов с внутренней и внешней стороны.

Начнем с внешнего отличия файлов. Чем разные файлы отличаются между собой, если мы посмотрим на файлы через программу «Проводник» или «Мой компьютер», установив на вкладке «Вид» «Таблица»? Отличаются файлы между собой расширением, которое нам говорит о формате файла, и типом документа, а также размером файла.

В качестве примера возьмем Рис. 1.6.3., где представлены файлы в форматах *.rtf, *.doc и *.docx, сохранённые в разных текстовых редакторах.


Рис. 1.6.3. Файлы с одинаковым текстом, сохраненные в разных программах и разных форматах


Если убрать расширение у файла и сохранить без расширения, то внешняя принадлежность файла формату и типу теряется. У меня такая ошибка часто происходила при сохранении файлов, полученных по электронной почте Ms Outlook, при переименовании файла случайно удаляется расширение или при выгрузке данных с одинаковыми именами, но в разных форматах. Примером являются файлы на следующем рисунке Рис. 1.6.4. файл 1165009d в формате *.pdf и его копия без расширения. Копия файла стала обезличенной, и открыть ее можно только методом подбора программ.


Рис. 1.6.4. Файлы, выгруженные из электронной почты Ms Outlook


Иногда можно случайно при переименовании файла с форматом *.rtf поставить другое расширение, например, *.pdf, как показано на Рис. 1.6.5.


Рис. 1.6.5. Неправильное расширение файла


А как понять, какой программой можно открыть этот файл? Очень просто! Для этого мы будем использовать внутреннюю часть файла.

У каждого файла есть заголовок, который указывает, в каком формате находится файл, а иногда и на версию программы, которая его создала. Заголовок файла о принадлежности к определенной программе и формату может находиться в начале файла или в конце.

Открыть можно с помощью программ «Блокнот», «Far» (Far Manager – консольный файловый менеджер для операционных систем семейства Windows) или «Total Commander», установив курсор на сбойный файл и нажав клавиши «F3» или «F4». В текстовом редакторе откроется файл в кодах.

С помощью программы «Блокнот» можно открыть файл, вызвав правой кнопкой мыши контекстное меню и выбрав «Открыть с помощью», как показано на Рис. 1.6.6.


Рис. 1.6.6. Открытие неизвестного файла с помощью правой кнопкой мыши


На Рис. 1.6.7. видно, как система предлагает список программ, с помощью которой надо открыть файл.


Рис. 1.6.7. Список программ для открытия файла


Выбираем программу «Блокнот», затем открываем файл, и видим на Рис. 1.6.8., что файл содержит в первой строчке «PDF-1.7».


Рис. 1.6.8. Содержимое файла без расширения


А теперь откроем в «Блокноте» файлы в форматах *.doc и *.rtf. Для файлов формата *.doc заголовок с данными о программе и формате находится в конце файла, как видно на Рис. 1.6.9.


Рис. 1.6.9. Содержимое файла в формате *.doc


А для файлов в формате *.rtf заголовок находится в самом начале и это тоже видно на Рис. 1.6.10.


Рис. 1.6.10. Содержимое файла в формате *.rtf


А теперь на Рис. 1.6.11. через программу «Проводник» посмотрим на файл в формате *.docx и его внешние отличия. Отличительными признаками файла будут расширение «*.docx» и тип «Документ Microsoft Office Word 2007».


Рис. 1.6.11. Через Проводник внешние отличия формата *.docx


На Рис. 1.6.12. представлена через программу «Блокнот» внутренняя часть содержимого файла в формате *.docx.


Рис. 1.6.12. Содержимое файла в формате *.docx


Файл в формате *.docx представляет собой zip-архив, содержащий текст в виде XML, графику и другие данные, которые ранее хранились в формате *.doc.

Хочется еще раз поблагодарить разработчиков этого формата. С появлением формата *.docx теперь можно легко определять проблемы, связанные со вставленными формулами и изображениями в текст.

Рассмотрим более глубокую структуру файла в формате *.docx, и для этого возьмем один из моих проблемных файлов. Как я уже раньше сообщала, что по технологии требуется сохранять файлы в формате *.doc и *.rtf. Данный файл после сохранения в формате *.rtf не открывался.

С помощью программ 7-Zip или WinRar откроем файл как архив и сделаем выгрузку содержимого. На Рис. 1.6.13. показано контекстное меню открытия файла в формате *.docx. Аналогично открываются файлы формата *.odt, созданные программами LibreOffice Writer или OpenOffice.


Рис. 1.6.13. Контекстное меню открытия файла в формате *.docx


На Рис. 1.6.14. показаны файлы и папки, выгруженные из архива файла.


Рис. 1.6.14. Выгруженные файлы и папки из архива файла в формате *.docx


Самый большой интерес представляет папка «media», содержащаяся в папке «word». На Рис. 1.6.15. показаны файлы и папки, содержащиеся в папке «word».


Рис. 1.6.15. Содержимое папки «word»


В папке «media» находятся формулы и изображения, среди которых может оказаться проблемный или неправильно созданный объект, а также лишние объекты. Для определения проблемных встроенных объектов в тексте использую два способа через «Проводник».

На Рис. 1.6.16. показаны файлы изображений, содержащихся в папке «media» через «Проводник», выбрав во вкладке «Вид» «Крупные значки».


Рис. 1.6.16. Файлы изображений в папке «media»


На данном рисунке сразу видно проблемный файл image3.png. А в тексте более тысячи встроенных объектов. Найти проблемный объект в тексте и переделать вручную очень тяжело.

Следующий способ определения дефектных файлов по размеру.

На Рис. 1.6.17. показаны файлы изображений, содержащихся в папке «media» через «Проводник», выбрав во вкладке «Вид» «Таблица» и отсортировав по размеру все файлы.

Ошибки, проблемы, решения с текстами, файлами, программами. Пособие по «Технике безопасности» для начинающих айтишников и интересующихся

Подняться наверх