Замена псевдоапострофов на апостроф
Sep. 7th, 2010 08:55 pm![[identity profile]](https://www.dreamwidth.org/img/silk/identity/openid.png)
![[community profile]](https://www.dreamwidth.org/img/silk/identity/community.png)
Как заменить апостроф (псевдоапостроф) в укр. тексте на его правильный вариант alt-039 (') или alt-0146 (’). Вроде как regexp написал, но меняет полкостью с буквами до и после него. Помогите разобраться.

Как можно реализовать замену любых не-типографских кавычек на елочки («»), используя regexp?
Если что, с использованием http://gskinner.com/RegExr/, Notepad++ (или варианты), OO Writer/Word но без php, javascript, с ними пока не умею

Как можно реализовать замену любых не-типографских кавычек на елочки («»), используя regexp?
Если что, с использованием http://gskinner.com/RegExr/, Notepad++ (или варианты), OO Writer/Word но без php, javascript, с ними пока не умею
no subject
Date: 2010-09-08 07:42 am (UTC)(Ссылка на картинку не работает.)
no subject
Date: 2010-09-08 08:27 am (UTC)Фильтрует чтоб был впереди не пробел и после символа тоже не пробел. В квадратных скобках перечисляю все символы, что могут бьт использованы для обозначения апострофа. Да, кстати, иногда в текстах ддаже звездочку стаявят, тогда, наверно, надо добавить \* в них.
no subject
Date: 2010-09-08 08:54 am (UTC)Для первого варианта с помощью RegExr, на вкладке Replace:
1 строка:
['"“”«»]
2 строка:
'
Текст примера: te'xt t“test» "
Результат обработки: te'xt t'test' '
no subject
Date: 2010-09-08 09:57 am (UTC)Вот ещё перегрузил картинку:
http://s004.radikal.ru/i207/1009/63/d486065e00b7.jpg
no subject
Date: 2010-09-08 10:08 am (UTC)no subject
Date: 2010-09-08 08:55 am (UTC)(\S)[`’«»"](\S) заменять на $1'$2
То есть он будет искать не-пробел, символ из набора, следующий не-пробел и заменять его на первую группу (не-пробел), апостроф и вторую группу (не-пробел).
К тому, что находится в круглых скобках, можно как раз обращаться через доллар при замене.
Можете ещё почитать http://regular-expressions.info, там достаточно дельно расписано всё, но на английском.
no subject
Date: 2010-09-08 10:07 am (UTC)no subject
Date: 2010-09-08 10:31 am (UTC)Мануалы читал, пока не выходит практически…
no subject
Date: 2010-09-08 08:58 am (UTC)"([^"]+)" => «$1»
Но тут, наверное, нужно будет ещё продумать. Этот вариант будет искать кавычку, не-кавычку много раз, снова кавычку и заменять её на ёлочку, то, что было между кавычками, и ещё одну ёлочку.
no subject
Date: 2010-09-08 10:44 am (UTC)Вот ваш результат:
http://s56.radikal.ru/i153/1009/38/67f605a36462.jpg