[identity profile] alfare.livejournal.com posting in [community profile] useful_faq
Иногда требуется отформатировать текст, который чьи-нибудь кривые рученьки ровняли не человеческим способом, а насовав в него пробелов и переносов.

Пример:




Обычно мне удаётся это сделать автоматически заменой в Ворде, уловив закономерности в повторении лишних непечатаемых символов, сочетании их с пробелами, знаками абзаца и т. п. - и удалив все эти лишние симуляторы форматирования, из-за которых текст в другом редакторе выглядит с рваными где попало строками - легче повеситься, чем такое читать.

Например, в этом особо запущенном случае пришлось вначале заменить автоматически все сочетания "точка пробел знак абзаца пробел" на "точка знак абзаца знак абзаца". А затем опять заменить все сочетания "пробел знак абзаца пробел" на "пробел". Ну и после этого выделить весь текст и поставить форматирование "по ширине".

А вот интересно, нет ли менее извращённых способов исправлять такие косяки?

И ещё. Я мало работал с Вордом версий 2007 и выше - до сих пор предпочитаю 2003. Кто в теме: в последних версиях функционал замены стал сколько-нибудь заметно круче, удобнее, шире - или в этом смысле особых изменений не произошло?

Date: 2016-02-18 09:45 pm (UTC)
From: [identity profile] sevabashirov.livejournal.com
Я так же делаю, не особо это и извращенно.

Date: 2016-02-18 09:47 pm (UTC)
From: [identity profile] agalakhov.livejournal.com
Способ, которым пользуются американские издательства: вообще отказаться от Word и WYSIWYG, использовать специальные программы автоматической верстки (классика - TeX, есть и другие).

Date: 2016-02-18 10:27 pm (UTC)
From: [identity profile] agalakhov.livejournal.com
Именно. Только они вообще не предлагают вариантов. Они неинтерактивны. Форматирование входного текста они игнорируют полностью и переделывают все по-своему с учетом общих правил языка, типографики и заданных настроек. Управляются они вставкой команд-пометок прямо в текст. Переносы, нумерацию страниц, рисунков, кернинг и все такое они делают вообще сами. Человеческое вмешательство не только не требуется, но и нежелательно. (У начинающих как раз с этим проблема: по старой привычке они пытаются машине "помогать", а машина такой помощи не любит).

У таких систем недостаток один: пока пишешь текст, не видишь, как он будет выглядеть в итоге. Это сделано специально: идея в том, чтобы человек не тыкал пальцем "это - сюда", а объяснял, чего он хочет: "эту картинку вставь так, чтобы текст ее обтекал, этот абзац выдели, а вот здесь начинается новая глава". Машина сама знает, что следует делать в каждом из этих случаев. У нее есть тысячи правил оформления на все случаи жизни: от деловых писем и статей в научные журналы и до шахматных этюдов и нот (вплоть до того, что шахматную доску сама рисует).

Date: 2016-02-19 08:47 am (UTC)
From: [identity profile] agalakhov.livejournal.com
Ее как раз можно легко переучить, просто это делается не в тексте. Файлов два: в одном находится только текст (без правил оформления), в другом - только правила оформления (без текста). На самом деле даже не два, а больше, потому что правила разбиты на части. Обычно правила оформления никто не редактирует, готовых вариантов вполне достаточно на все случаи жизни. Но если вдруг нужно что-то особенное, можно сделать по-своему.

Пример: http://quest-book.ru/forum/viewtopic.php?t=2751 файл dogssh.pdf. Это я верстал в LaTeX. Здесь машина не только автоматически сделала верстку, но и сама перемешала и перенумеровала фрагменты. Автор писала текст подряд по ходу сюжета, а случайное запутывание, как требуется для книгры, делала система верстки. Обратите внимание на висячую пунктуацию, это тоже машина делала.

Date: 2016-02-19 09:01 am (UTC)
From: [identity profile] agalakhov.livejournal.com
Я для себя перешел на такие штуки, и вот почему. Очень часто, когда текст большой, уже после его написания хочется переделать все форматирование. В неинтерактивных системах я просто пробую несколько стилей и выбираю, какой мне больше нравится. Такие вещи, как изменение формата бумаги, при которых в классических WYSIWYG-системах все съезжает непонятно куда, тут происходят автоматически и занимают секунды.

На такие вещи трудно переучиться: это не способ набора текста, а способ мышления. Умение мысленно отделять содержание от представления. Но когда это удается, понимаешь, насколько на самом деле это удобнее.

Date: 2016-02-18 11:18 pm (UTC)
From: [identity profile] dr-trans.livejournal.com
TeX работает в PlainText и имеет огромную (мегабайты) базу данных шаблонов/стилей для всех мировых научных журналов, чтобы публикация уже шла сразу в верстку. В TeX используется что-то вроде HTML, но есть и графические оболочки под Word (работаем в Word), например, позволяющие форматировать текст визуально, а потом сохранять в формате TeX. Погуглите "LaTeX".
Edited Date: 2016-02-18 11:23 pm (UTC)

Date: 2016-02-19 11:45 am (UTC)
From: [identity profile] dr-trans.livejournal.com
Фишка LaTeX-а в том, что он забрасывает в Word пару своих кнопок. Мы работаем, как привыкли, в Ворде, рисуем формулы в вордовском редакторе формул и т.д., а потом экспортируем файл в формат TeX с выбранным шаблоном соответствующего журнала/издательства, где планируем публиковать текст. Таким образом не даже изучать язык разметки TeX, хотя, зная это язык, можно писать многоэтажные математические уравнения и химические формулы хоть в Блокноте, что тоже иногда удобно. Причем язык там довольно простой и очевидный, так что формулы легко читаются даже в виде кода. :)

Date: 2016-02-20 12:06 am (UTC)
From: [identity profile] alverena.livejournal.com
Это звучит как ночной кошмар и пытка - рисовать формулы в ворде, чтобы потом экспортнуть в ТеХ, который, в отличии от Ворда, считается лучшей штукой для набора формул. ))

Date: 2016-02-20 09:27 am (UTC)
From: [identity profile] dr-trans.livejournal.com
Есть люди, которые привыкли к Ворду. Есть случаи, когда надо объединить тексты, созданные частично в TeX и в Ворде.. Разное бывает...

Date: 2016-02-18 11:17 pm (UTC)
From: [identity profile] dr-trans.livejournal.com
Про CodeZapper и Перестройка2000 уже говорили?

Date: 2016-02-19 11:46 am (UTC)
From: [identity profile] dr-trans.livejournal.com
CodeZapper - это макросы для Ворда именно для чистки всякого мусора, например после распознавания или конвертации из PDF.

Date: 2016-02-19 05:36 am (UTC)
From: [identity profile] daxi.livejournal.com
делаю так же - это проще, чем заморачиваться с каким-то новым ПО :)

Date: 2016-02-19 10:29 am (UTC)
From: [identity profile] qyix7z.livejournal.com
>Кто в теме: в последних версиях функционал замены стал сколько-нибудь заметно круче, удобнее, шире - или в этом смысле особых изменений не произошло?
Окошко "найти и заменить" в следующих версиях ровно такое же, как в 2003.

Date: 2016-02-19 03:10 pm (UTC)
From: [identity profile] superparatruper.livejournal.com
Сохраняйте как "текстовый документ". А потом снова в ворд.

Date: 2016-02-19 06:40 pm (UTC)
From: [identity profile] lily-13.livejournal.com
Должна быть какая-то процедура - форматировать как один абзац. В чирайтере когда-то это было. :))