Скрипт или софт для обработки текста
Jun. 27th, 2015 03:02 pm![[identity profile]](https://www.dreamwidth.org/img/silk/identity/openid.png)
![[community profile]](https://www.dreamwidth.org/img/silk/identity/community.png)
Суть такова:
есть большой объём художественного текста, он разбит на строки. Больше никакого форматирования нет, храниться это всё может, допустим в простом текстовом файле. Большинство строк является отдельными предложениями, начинающимися с прописных букв. Иногда с кавычек или тире (диалог). Некоторые же строки разорваны, т.е. начинаются со строчных.
Задача: сделать такой скрипт, чтобы можно было этот текст построчно обработав, выискивая строки, соответствующие определённым критериям («начинается со строчной буквы») и приклеивая их к предыдущей строке. Ну и ещё какие-нибудь мелочи, типа подсчёта символов в строках и т.д.
В какой программной среде есть такой функционал, чтобы можно было, не имея специальных знаний, разобраться с синтаксисом и сделать себе скрипты необходимой мне обработки текста?
Можно было бы и в экселе организовать, но там я не нахожу способа проверки «строчная/прописная». Или макросами можно? Нет ли чего-то попроще, заранее ориентированного на такую специфику?
есть большой объём художественного текста, он разбит на строки. Больше никакого форматирования нет, храниться это всё может, допустим в простом текстовом файле. Большинство строк является отдельными предложениями, начинающимися с прописных букв. Иногда с кавычек или тире (диалог). Некоторые же строки разорваны, т.е. начинаются со строчных.
Задача: сделать такой скрипт, чтобы можно было этот текст построчно обработав, выискивая строки, соответствующие определённым критериям («начинается со строчной буквы») и приклеивая их к предыдущей строке. Ну и ещё какие-нибудь мелочи, типа подсчёта символов в строках и т.д.
В какой программной среде есть такой функционал, чтобы можно было, не имея специальных знаний, разобраться с синтаксисом и сделать себе скрипты необходимой мне обработки текста?
Можно было бы и в экселе организовать, но там я не нахожу способа проверки «строчная/прописная». Или макросами можно? Нет ли чего-то попроще, заранее ориентированного на такую специфику?
no subject
Date: 2015-06-27 12:47 pm (UTC)Заменить по регулярному выражению "$([а-я])" на " $1"
Регулярные выражения есть в любых нормальных редакторах включая МС Ворд
no subject
Date: 2015-06-27 12:54 pm (UTC)Нет, мне не нужно менять строчные на прописные, мне нужно взять строку, которая начинается со строчной, и приклеить её (или её часть) к предыдущей строке.
no subject
Date: 2015-06-27 12:55 pm (UTC)И? Чем решение не устраивает? Зачем менять на прописные?
no subject
Date: 2015-06-27 12:59 pm (UTC)