Программы для анализа текста
Dec. 7th, 2014 04:31 pm![[identity profile]](https://www.dreamwidth.org/img/silk/identity/openid.png)
![[community profile]](https://www.dreamwidth.org/img/silk/identity/community.png)
Искал я отзывы на одно лекарство, нашел, читаю - хорошие отзывы... Слишком хорошие. И речь гладкая, как у журналиста со стажем, все запятые на месте, стиль строгий - ни одного жаргонизма типа "ваще афигеть". Нормальный интернет-юзер так не пишет :)
Короче, жопное чувство просто вопиет, что два десятка отзывов написаны одним человеком, максимум двумя-тремя. Возникает вопрос: а нет ли в мире легкодоступных программ, которые анализируют текст по частоте использования слов и оборотов, еще по каким-то признакам, и выдают вероятностную оценку что автор тот же самый ?
Короче, жопное чувство просто вопиет, что два десятка отзывов написаны одним человеком, максимум двумя-тремя. Возникает вопрос: а нет ли в мире легкодоступных программ, которые анализируют текст по частоте использования слов и оборотов, еще по каким-то признакам, и выдают вероятностную оценку что автор тот же самый ?
no subject
Date: 2014-12-07 04:21 pm (UTC)no subject
Date: 2014-12-07 04:30 pm (UTC)PS Не подскажете, в каком словаре поискать слово "школота" ? ;)
no subject
Date: 2014-12-07 05:07 pm (UTC)PS Загляните в словарь dic.academic.ru :)
no subject
Date: 2014-12-07 06:54 pm (UTC)и давно этот сайт стал авторитетным академическим изданием по русскому языку?
no subject
Date: 2014-12-07 08:18 pm (UTC)Чем, по-вашему, тогда нужно пользоваться?
no subject
Date: 2014-12-07 08:50 pm (UTC)Да ну?
И откуда авторитет у этого сайта?
Домен принадлежит частному лицу, кто создатели непонятно...
>Чем, по-вашему, тогда нужно пользоваться?
Академическими изданиями, выпускающимися под соответствующим надзором.
Их последних, например, Малый академический словарь русского языка в 4х томах, тем более что словарь доступен онлайн. (http://feb-web.ru/feb/mas/mas-abc/0encyc.htm)
Издан Институтом лингвистических исследований РАН в 1999 году.
no subject
Date: 2014-12-07 09:12 pm (UTC)Раз словарь 1999 года, в него не вошли все новые слова, появившиеся в связи с развитием новых отраслей (информационных технологий, например).
no subject
Date: 2014-12-07 10:50 pm (UTC)да, верно, с другой стороны есть четкое описание проекта, информация о создателях и попечителях, впрочем речь в любом случае не о них о об издании: Малый академический словарь русского языка в 4х томах, издание выпущенное академией наук
>и обвешан рекламой
т.е. 6 блоков рекламы на академике Вас никак не смущают, а 2 блока смутили и Вы это даже назвали "обвешан"...
ну-ну, проблемы оказывается не только с русским языком...
>появившиеся в связи с развитием новых отраслей (информационных технологий, например).
О_о так!?
посвятите нас, пожалуйста, какая из новых отраслей и технологий породили слово "школота"?
no subject
Date: 2014-12-08 12:41 am (UTC)ну-ну, проблемы оказывается не только с русским языком...
Это не у меня проблемы. Это вы назвали Академик "неавторитетным", а взамен предоставили точно такой же, да ещё и сделанный на коленке. Фреймы сейчас ни один вменяемый специалист не использует.
no subject
Date: 2014-12-08 09:44 am (UTC)Технология сайтостроения никак не коррелирует с авторитетностью. Сайты многих государственных организаций построены по старинке.
Не говоря уже о том, что сайты никак не коррелируют с официальными академическими изданиями, изданными более чем авторитетными организациями и научными сотрудниками.
В том числе, в МАС на академике слово "школота" отсутствует.
И Вы так и не ответили: "какая из новых отраслей и технологий породили слово "школота"?"
no subject
Date: 2014-12-08 11:49 am (UTC)>В том числе, в МАС на академике слово "школота" отсутствует.
Конечно. Как в словаре 1999 года могло появиться слово, которое появилось совсем недавно?
>И Вы так и не ответили: "какая из новых отраслей и технологий породили слово "школота"?"
Новые слова появляются разными путями, в том числе и придумываются кем-то в интернете. Какие-то из слов будут долго использоваться и войдут в последствии в те самые академические словари, а какие-то будут благополучно забыты.
no subject
Date: 2014-12-08 01:15 pm (UTC)Тел: (495)695-9437
Факс: (495)695-9437
Институт мировой литературы им. А.М.Горького РАН (ИМЛИ РАН)
Адрес: 121069, Москва, ул. Поварская 25а
Тел: (095)695-9437 (Отдел информационных технологий)
Факс: (095)695-9437
Научно-технический центр “Информрегистр” Мининформсвязи РФ (НТЦ “Информрегистр”)
Адрес: 107553, Москва, Б.Черкизовская ул., д.21 стр.1
Тел.: (499)160-9371 (Отдел электронных изданий)
Факс: (499)160-9348
>Но на Академик сотни ссылок из википедии
Как это мило что Вы сослались на вики. Тогда прошу любить и жаловать:
1.
Фундаментальная электронная библиотека (https://ru.wikipedia.org/wiki/%D0%A4%D1%83%D0%BD%D0%B4%D0%B0%D0%BC%D0%B5%D0%BD%D1%82%D0%B0%D0%BB%D1%8C%D0%BD%D0%B0%D1%8F_%D1%8D%D0%BB%D0%B5%D0%BA%D1%82%D1%80%D0%BE%D0%BD%D0%BD%D0%B0%D1%8F_%D0%B1%D0%B8%D0%B1%D0%BB%D0%B8%D0%BE%D1%82%D0%B5%D0%BA%D0%B0)
Фонд «Фундаментальная электронная библиотека» (Фонд «ФЭБ») — некоммерческая организация, учрежденная академиком РАН Валентином Лаврентьевичем Яниным, Институтом мировой литературы им. А. М. Горького РАН и Научно-техническим центром «Информрегистр» Мининформсвязи РФ. В структуру Фонда «ФЭБ» входят Попечительский совет, Правление и Генеральный директор Фонда. Председателем Попечительского совета и Президентом Фонда «ФЭБ» избран известный российский историк и археолог, академик РАН Валентин Лаврентьевич Янин.
Генеральным директором Фонда «ФЭБ» назначен Константин Владимирович Вигурский — директор Фундаментальной электронной библиотеки «Русская литература и фольклор», кандидат технических наук.
2.
И обратив внимание на действующие лица, указанные на странице контактов ФЭБ:
например Игорь Алексеевич Пильщиков("по филологическим вопросам и вопросам содержания ФЭБ (структуры и состава библиотеки, информационного наполнения и т.п.) следует обращаться к главному редактору — Игорю Алексеевичу Пильщикову") (https://ru.wikipedia.org/wiki/%CF%E8%EB%FC%F9%E8%EA%EE%E2,_%C8%E3%EE%F0%FC_%C0%EB%E5%EA%F1%E5%E5%E2%E8%F7)
Игорь Алексеевич Пильщиков - российский филолог, в 1994-2013 редактор журнала «Philologica». Доктор филологических наук (2008 г.), ведущий научный сотрудник Института мировой культуры МГУ им. Ломоносова. Главный редактор Фундаментальной электронной библиотеки «Русская литература и фольклор»; научный редактор Русской виртуальной библиотеки. Лауреат премии Европейской академии (1997 г.); стипендиат Таллинского университета (Лотмановская стипендия, 2009 г.).
Продолжим говорит о некомпетентности ФЭБ?
>Конечно. Как в словаре 1999 года могло появиться слово, которое появилось совсем недавно?
Если бы Вы чатились в 90х (я начала пользоваться чатами с 94 года) и играли в компьютерные игры, то знали бы что слова "школоло" (образовано от слово "школьник" и "lol") и "школота" (компиляция от предыдущего) были известны и употреблялись до 1999 года.
no subject
Date: 2014-12-08 02:24 pm (UTC)Я и не говорила о некомпетентности ФЭБ. Я сказала, что он выглядит непрофессионально. Да, я понимаю, что во многих организациях экономят на дизайнерах. Но отношение (доверие) к сайту зависит от того, насколько качественно он сделан.
>я начала пользоваться чатами с 94 года
Точно в 1994? В 1994 интернет-то не везде был и стоил как крыло самолёта. Помню, что только богатые компании могли себе его позволить. На нашем РАФ'е интернет был только у секретаря и директора. Сайтов в зонах .ru и .su на тот момент было крайне мало.
Я с 2000 года и то не припоминаю такого. Интернет тогда был совсем другой, школоте он был не по карману и её как таковой в интернете не было. :)
no subject
Date: 2014-12-08 03:52 pm (UTC)У бюджетных и некоммерческих организаций и энтузиастов своего дела может элементарно не быть достаточного количества денег, чтобы сделать высококлассный дизайн. Но это не делает информацию на сайте некомпетентной или низкого уровня и качества.
Тем более это актуально для действительности РФ, где энтузиасты науки де-факто вынуждены именно выживать. Я прекрасно это знаю по своим родителям-профессионалам в своей области, которые экономили на себе, что бы мы их дети были обеспечены всем необходимым. Так например у моего отца инженера-ядерщика, который половину своей жизни провел на полигонах Семипалатинска, занимался разработкой саркофага для Чернобыля и тп, никогда не было нормального костюма. Но отсутствие костюма не лишает его профессионализма и глубоких знаний в своей области.
Мне крайне жаль, что Вам недоступны такие очевидные истины.
>Точно в 1994? В 1994 интернет-то не везде был и стоил как крыло самолёта.
Абсолютно точно, ноябрь 1994 года. Сначала тот чат работал на сервере компании, в которой работал разработчик чата. Потом чат переехал на портал kulichki.ru с названием Болталка-на-Куличках. В 1999 году пользователи часа скинулись и купили собственный сервер для размещения в датацентре Можордомо и ат получил название Беседка.
Участники чата собирались каждую пятницу в районе Арбата.
Я ещё помню, что домены регистрировались в РосНИИРОС, а whois смотрели на сайте www.ripn.net
Соединение по диалапу. Иногда покупали в складчину, я например, пользовалась диалапом с другом, я пользовалась днём и по вечерам, он пользовался после 1-3 ночи.
Домен своего сайта mermaid.ru я зарегистрировала в РосНИИРОС в 1998 году, и продала в 2003.
Одни из старейших сайтов рунета, которые я сейчас помню:
1994
lib.ru
demos.ru
1995
anekdot.ru
design.ru
rbc.ru
1996
aport.ru
rambler.ru
В 1996 году я начала пользоваться уже индивидуально приобретаемым диалапом МТУ-Информ, покупались карточки и вуаля.
Помню у меня ещё была программка, которая автоматически восстанавливала соединение так как старенькая винда тогда не умела этого делать.
В 1997 году работая в одной компании бизнес-аналитиком я предложила создать интернет-магазин. Ну и я попала - я предложила мне и поручили. Бессонные ночи по освоению html и яваскрипта... Вот тут мне мои чаттеры и пригодились - очень много было полезных знаний и советов получено от них. Сайт я сделала с формой заказа, так как полноценный магазин я тогда не смогла бы сделать в короткие сроки. После чего ушла работать в одну конторку где за 8 мес. сделала 14 сайтов (от дизайна до верстки). Ничего на фреймах никогда не верстала кстати - не любила фреймы.
Потом ушла в компанию Actis Systems (https://www.actis.ru/), но когда мне надоело работать на стороне исполнителя, я ушла работать на стороне клиента.
А в 2005 году с моим эксом открыла собственный бизнес, не связанный с сайтостроением - работая на стороне заказчика я увидела одну очень перспективную отрасль мультимедийных коммуникаций, которая почему-то не продвигалась в холдинге, а именно видеоконференцсвязь - этим и занимается наша компания.
no subject
Date: 2014-12-08 04:29 pm (UTC)Я вот не понимаю, зачем такому крутому человеку со знаменитыми родителями, пытаться "укусить" оппонента побольнее. Кстати это совершенно бесполезно, я толстошкурая. И отвечаю в вашем же стиле.
А мне крайне жаль, что вам недоступна исторически сложившаяся истина "встречают по одёжке", это касается и сайтов.
no subject
Date: 2014-12-08 05:15 pm (UTC)Да ну?
У Вас как-то всё из крайности в крайность и всё из области "не ехать, а шашечки", "сама придумала - сама обиделась".
Такое впечатление начинает складываться, что Вы и БЭС читать не будете, и любую другую справочную или научную литературу только потому, что они не оформлены с изысками от лица крупнейших дизайнеров страны или мира, и потому что там картинок мало...
А да, я кстати не против таких Дам, более того у меня даже есть близкая приятельница, которой тоже важны шашечки и картинки. Милейшая женщина, поболтать с ней о шмотках, сериалах и шоу одно удовольствие, так как экономит море времени (не требуется смотреть), и при этом быть в курсе.
>А мне крайне жаль, что вам недоступна исторически сложившаяся истина "встречают по одёжке", это касается и сайтов.
Судя по тому что продолжение Вы не указываете одежка как была так и осталась для Вас самым главным. По мне так это грустно. А Вам всё равно - это Ваш выбор, Вы вправе жить именно со своим выбором - я Вам не мешаю. Но и других не надо убеждать, что жаргонные слова вполне себе литературные и являются достоянием литературного русского языка.
PS тут в сообществе не так давно были вопросы об одном сервисе и услугах, домен зарегистрирован за сутки до рассылки, сайт по дизайну был впечатляющим, но тот кто решил воспользоваться расставался бы с приличной суммой денег в никуда :)))) такие красивые сайты я тоже "ценю" :))))
no subject
Date: 2014-12-08 05:55 pm (UTC)Опять кусаетесь? :)
Судя по тому, что вы не зная человека и его интересов, уже навесили на него ярлыки, вы недалеко ушли от человека, судящего только по одёжке.
>PS тут в сообществе не так давно были вопросы об одном сервисе и услугах, домен зарегистрирован за сутки до рассылки, сайт по дизайну был впечатляющим, но тот кто решил воспользоваться расставался бы с приличной суммой денег в никуда :)))) такие красивые сайты я тоже "ценю" :))))
Вот чаще бывает наоборот. Вася Пупкин решает по-быстрому заработать денег. Как? Да запросто, организует какой-нибудь sms лохотрон. Таких сайтов сейчас миллионы.
Да, бывает и профессиональный дизайн, но на это идут, когда собираются обманывать по-крупному. Например коучинг за баснословные деньги.
no subject
Date: 2014-12-08 06:20 pm (UTC)Спасибо за дискуссию!
no subject
Date: 2014-12-07 09:18 pm (UTC)Академик хорош тем, что там собраны все словари.
no subject
Date: 2014-12-07 10:52 pm (UTC)