[identity profile] line-in-out.livejournal.com posting in [community profile] useful_faq
Товарищи, подскажите мне что-нибудь для моей задачи, я даже не могу придумать как погуглить.
Есть довольно большое число текстов.
Каждый текст содержит несколько смысловых кусков. 
На выходе нужно получить тексты, в которых эти куски заключены в определенные html-теги. 
то есть было "бла бла бла", стало "<tag1>бла</tag>   <tag2>бла</tag>   <tag3>бла</tag>"
Как себе представляю - ввожу текстовые данные в поля, как при заполнении форм на сайтах, и получаю на выходе текст с тегами.

Как задачу решить? Языков программирования не знаю. Какая программа может помочь? На крайний случай какой-нибудь php-скрипт посоветуйте что ли, допилить по-минимуму (заменить вид тегов) я смогу наверное....
Спасибо!

Date: 2011-03-04 06:18 pm (UTC)
From: [identity profile] blak-n-wait.livejournal.com
не знаю даже
может быть проще - макросы в ворде?
вообще не совсем ясно, в каком формате текст и какое условие заключения "в теги"

Date: 2011-03-05 11:00 am (UTC)
From: [identity profile] alex-djk1.livejournal.com
Кстате, не знаю сильно awk, но по моему он как раз на такое рассчитан. Почитайте про него.

Date: 2011-03-06 09:10 pm (UTC)
From: [identity profile] archaicos.livejournal.com
Вам (в смысле, программе/скрипту) нужно знать все эти особые слова чтобы их найти. Кроме того нужно понимать все формы этих слов. Кроме того, может понадобиться разбор структуры предложения чтобы что-то важное не пропустить и вообще верно сделать работу. Готовые решения такого рода, которые можно откуда-то взять и легко допилить напильником, вряд ли есть. Как минимум в программе нужен словарь русского языка со всеми словоформами или алгоритмом для их образования по базовой (им.п., ед.ч., м.р. и т.д. -> остальные). Это все непросто автоматизировать.

Date: 2011-03-04 06:13 pm (UTC)
From: [identity profile] dasboot.livejournal.com
Без определенного условия по заключению текста в теги единственный возможный способ решения этой задачи - руками.

Date: 2011-03-04 06:22 pm (UTC)
From: [identity profile] dasboot.livejournal.com
честно говоря - это мелочи по сравнению с необходимостью, например, подымать локальный вебсервер с CGI. Автоматизировать нужно только то, что можно автоматизировать. В данном случае я бы и сам тупо делал copypaste, возможно даже из банальных двух окошек блокнота с заранее забитыми открытыми и закрытыми тегами. Реализуемо, но затраты того не стоят, плюс если это вебформочка, так добавляются действия вида "скопировать" вначале в нее, а потом из нее и вставить обратно.

Date: 2011-03-04 06:23 pm (UTC)
From: [identity profile] dasboot.livejournal.com
А что это вообще за условие такое, ручной ввод? Вы таки пытаетесь треснуть мне мозг.
Edited Date: 2011-03-04 06:23 pm (UTC)

Date: 2011-03-04 07:03 pm (UTC)
From: [identity profile] dasboot.livejournal.com
хм, какие необычные теги

Date: 2011-03-04 07:43 pm (UTC)
From: [identity profile] excubitus.livejournal.com
Может, Вам какой-нибудь html-редактор подойдет, типа NoteTab Pro? Выделяете кусок текста, щелкаете по тегу, и он автоматически обрамляет текст. Есть все стандартные html-теги, можно добавлять свои.

Date: 2011-03-04 09:13 pm (UTC)
From: [identity profile] aterentiev.livejournal.com
ms excel
суммировать данные из ячеек с данными тегов, потом сохранить все как tab-delimited и удалить ручками (блокнотом) табы

Date: 2011-03-21 07:58 pm (UTC)
From: [identity profile] alb-wiki.livejournal.com
навесить любой тег, те же ← { } , потом заменить на нужное в любом текстовом редакторе.

Научиться польоваться регулярными выражениями (можно сказать, это не так сложно)