[identity profile] protas-lip.livejournal.com posting in [community profile] useful_faq
Имеется список где тысячи данных допустим фамилий и допустим есть список №2 где тоже фамилии. В ручную сортировкой заниматься довольно долго и неохота)

нужен алгоритм, который найдёт повторяющиеся фамилии в обоих списках и отсеет их оставив только те фамилии которые не повторяются

"фамилии" взяты как пример

Документы в формате ворд,сам программировать ничего не могу

Date: 2009-12-04 08:17 pm (UTC)
From: [identity profile] jivoy-ej.livejournal.com
а где это все хранится?
мускуль?
ексель?
ворд?
бумажка?

Date: 2009-12-05 09:29 pm (UTC)
From: [identity profile] radvi-sasha.livejournal.com
из ворда скопировать в эксель, там отсортировать, результат перекинуть в ворд

Date: 2009-12-04 08:18 pm (UTC)
From: [identity profile] urvin.livejournal.com
SQL запрос

Date: 2009-12-04 08:34 pm (UTC)
From: [identity profile] dudkinisback.livejournal.com
массив повторфамилий (неизвестно)
массив новый (неизвестно)
для списка крутить
___для фамилии(список)
_____для повторфамилий
если фамилия=повторфамилий выйти в ___
_____
___добавить в новый
хватит крутить

Date: 2009-12-04 08:38 pm (UTC)
From: [identity profile] dudkinisback.livejournal.com
может я чото и напутал :)
но идея такая

Re: Вопрос по отсеиванию

Date: 2009-12-05 06:09 am (UTC)
From: [identity profile] mcmalady.livejournal.com
Позиции тождественных значении, фамилии, не обязательно могут соответствовать. Один цикл первичный список, второй цикл - условие соответствия вынос в другой массив. Остается тока правильно перезаписать "фамилии" в стринги))

Date: 2009-12-04 08:35 pm (UTC)
From: [identity profile] lazyreader.livejournal.com
Если вы программист, то вам нужно сменить профессию, а если не программист, то наймите программиста.

Date: 2009-12-04 08:43 pm (UTC)
From: [identity profile] joiede.livejournal.com
Если в экселе, то функция "найти". Главное чтобы одна "фамилия" не была образована от другой. То есть, например, Петров и Петрович она посчитает как тождественные. Но зато Петрович и Петров как разные.

Date: 2009-12-04 09:22 pm (UTC)
From: [identity profile] radvi-sasha.livejournal.com
В экселе:

два столбика с фамилиям выделяем полностью и на панели инструментов находим кнопку "Условное форматирование" -> Правила выделения ячеек -> Повторяющиеся значения.
Если в одном из столбиков какие-то фамилии точно повторяются, то сначала разбираемся с ним тем же условным форматированием. Это если Офис 2007. Если 2003, тоже можно условным форматированием, но в условии надо формулу прописывать.

2 способ. Формула:
В столбик А заливаем первый список фамилий, в столбик D второй.
В ячейке В1 прописываем формулу =ПОИСКПОЗ(A1;D:D;0). Выделяем ячейку и тянем курсором за уголок вниз. В ячейке Е1 формула =ПОИСКПОЗ(D1;A:A;0). Так же протягиваем вниз.



Видим, что в первом списке есть 22222, он же во втором списке на 5 позиции.

Date: 2009-12-05 07:27 am (UTC)
From: [identity profile] nicka-startcev.livejournal.com
cat input_file.txt | sort | uniq > out_file.txt