[identity profile] champansky.livejournal.com posting in [community profile] useful_faq
Суть такова:
есть большой объём художественного текста, он разбит на строки. Больше никакого форматирования нет, храниться это всё может, допустим в простом текстовом файле. Большинство строк является отдельными предложениями, начинающимися с прописных букв. Иногда с кавычек или тире (диалог). Некоторые же строки разорваны, т.е. начинаются со строчных.

Задача: сделать такой скрипт, чтобы можно было этот текст построчно обработав, выискивая строки, соответствующие определённым критериям («начинается со строчной буквы») и приклеивая их к предыдущей строке. Ну и ещё какие-нибудь мелочи, типа подсчёта символов в строках и т.д.

В какой программной среде есть такой функционал, чтобы можно было, не имея специальных знаний, разобраться с синтаксисом и сделать себе скрипты необходимой мне обработки текста?

Можно было бы и в экселе организовать, но там я не нахожу способа проверки «строчная/прописная». Или макросами можно? Нет ли чего-то попроще, заранее ориентированного на такую специфику?

Date: 2015-06-29 03:20 pm (UTC)
forever_live: (E8)
From: [personal profile] forever_live
Лучше "\n(^[A-ZЁА-Я])"

Но, всё равно, придётся вычитывать результат. Тем более, что выражение не учитывает все возможные заглавные буквы всех алфавитов.