[identity profile] line-in-out.livejournal.com posting in [community profile] useful_faq
Товарищи, подскажите мне что-нибудь для моей задачи, я даже не могу придумать как погуглить.
Есть довольно большое число текстов.
Каждый текст содержит несколько смысловых кусков. 
На выходе нужно получить тексты, в которых эти куски заключены в определенные html-теги. 
то есть было "бла бла бла", стало "<tag1>бла</tag>   <tag2>бла</tag>   <tag3>бла</tag>"
Как себе представляю - ввожу текстовые данные в поля, как при заполнении форм на сайтах, и получаю на выходе текст с тегами.

Как задачу решить? Языков программирования не знаю. Какая программа может помочь? На крайний случай какой-нибудь php-скрипт посоветуйте что ли, допилить по-минимуму (заменить вид тегов) я смогу наверное....
Спасибо!

Date: 2011-03-05 11:00 am (UTC)
From: [identity profile] alex-djk1.livejournal.com
Кстате, не знаю сильно awk, но по моему он как раз на такое рассчитан. Почитайте про него.

Date: 2011-03-06 09:10 pm (UTC)
From: [identity profile] archaicos.livejournal.com
Вам (в смысле, программе/скрипту) нужно знать все эти особые слова чтобы их найти. Кроме того нужно понимать все формы этих слов. Кроме того, может понадобиться разбор структуры предложения чтобы что-то важное не пропустить и вообще верно сделать работу. Готовые решения такого рода, которые можно откуда-то взять и легко допилить напильником, вряд ли есть. Как минимум в программе нужен словарь русского языка со всеми словоформами или алгоритмом для их образования по базовой (им.п., ед.ч., м.р. и т.д. -> остальные). Это все непросто автоматизировать.