ANTICHAT — форум по информационной безопасности, OSINT и технологиям
ANTICHAT — русскоязычное сообщество по безопасности, OSINT и программированию.
Форум ранее работал на доменах antichat.ru, antichat.com и antichat.club,
и теперь снова доступен на новом адресе —
forum.antichat.xyz.
Форум восстановлен и продолжает развитие: доступны архивные темы, добавляются новые обсуждения и материалы.
⚠️ Старые аккаунты восстановить невозможно — необходимо зарегистрироваться заново.
 |
|

09.04.2017, 12:15
|
|
New Member
Регистрация: 30.10.2016
Сообщений: 17
Провел на форуме: 6413
Репутация:
0
|
|
Такой вопрос: в суперсловарях (30-100 ГБ) я вижу много паролей типа:
петров
Петров
ПЕТРОВ
petrov
Petrov
PETROV
1petrov
1Petrov
1PETROV
01petrow
123Petrow
1978Petrow
petrov1
petrov01
petrov1956
1петров1
23петров1966
1966петров1978
петров\
petrov#!
#petrov!
?PETROW?
т.е. фамилии с одно-, двух-, трёх- или четырёхзначными цифрами спереди, сзади или с обоих сторон. Мне такие пароли в основном словаре не нужны. У меня есть словарь, сосотояший только из фамилий:
Петров
петров
ПЕТРОВ
petrov
Petrov
PETROV
petrow
Petrow
PETROW
Я просортировал оба словаря с помошью простого "sort". Как мне теперь сравнить оба файла и удалить из первого все строки, включающие фамилии из второго? Сначала я попробовал "comm -23 big.txt names.txt > big_no_names.txt". Но в big.txt остались все строки состояшие не только из фамилии:
1petrov
1Petrov
1PETROV
01petrow
123Petrow
1978Petrow
petrov1
petrov01
petrov1956
1петров1
23петров1966
1966петров1978
петров\
petrov#!
#petrov!
?PETROW?
Вопрос: как удалить и эти строки? Т.е. и те строки где фамилия является лишь частью пароля?
|
|
|

09.04.2017, 14:38
|
|
Постоянный
Регистрация: 30.08.2011
Сообщений: 358
Провел на форуме: 66828
Репутация:
11
|
|
- Как вариант - в SQL базе данных сделать таблицу (t1) из двух столбцов - исходный большой словарь, и он же, но с обрезанными цифрами в начале и конце. И вторую таблицу (t2) - маленький словарь фамилий. Далее sql запросом найти разность м.у. вторым столбцом t1 и соотв. t2 (вроде можно так?) Плюс такого решения - не используется программирование.
- Второй вариант - запомнить словарь фамилий (на самом деле не сами слова, а хеши, но не важно), далее - считывать каждое слово из большого словаря, откусывать цифры в начале и конце и искать это обрезанное слово в маленьком словаре. Если не нашлось, то распечатать.
С кодом я бы мог помочь, если бы не юникодные символы (1петров1).
- Возможно коллеги предложат более оптимальные варианты.
UPD:
- Еще вариант: Вы, когда будете применять ваш словарь фамилий, будете прикручивать к каждому слову цифры. Сделайте по этому алгоритму словарь - фамилии с цифрами, а далее - то, что вы уже делали при помощи comm (разность словарей, большого и 'фамилии с цифрами').
|
|
|

09.04.2017, 15:41
|
|
New Member
Регистрация: 30.10.2016
Сообщений: 17
Провел на форуме: 6413
Репутация:
0
|
|
Сообщение от VasiliyP
-
UPD:
- Еще вариант: Вы, когда будете применять ваш словарь фамилий, будете прикручивать к каждому слову цифры. Сделайте по этому алгоритму словарь - фамилии с цифрами, а далее - то, что вы уже делали при помощи comm (разность словарей, большого и 'фамилии с цифрами').
Предложили такую вещь:
no_names.sh
CDEL=`cat names.txt`
grep -v [$CDEL] big.txt > big_no_names.txt
Но проблема в том, что grep требует много ресурсов и не тянет словарь в 30 ГБ на моём компе. Придётся действительно делать словарь с цифрами (сделал: из 6 МБ и цифрами от 1 до 4 знаков только справа(!) получилось почти 16 ГБ!!!!).
|
|
|

09.04.2017, 16:29
|
|
Постоянный
Регистрация: 30.08.2011
Сообщений: 358
Провел на форуме: 66828
Репутация:
11
|
|
Сообщение от takitano
CDEL=`cat names.txt`
grep -v [$CDEL] big.txt > big_no_names.txt
Но проблема в том, что grep требует много ресурсов и не тянет словарь в 30 ГБ на моём компе.
Да, это далеко не самый быстрый алгоритм. Кроме того, если например в большом словаре будет слово "petrov-vodkin", то он его отбросит, хотя по условию задачи - не должен.
|
|
|

09.04.2017, 18:52
|
|
Elder - Старейшина
Регистрация: 23.05.2012
Сообщений: 3,462
Провел на форуме: 1070390
Репутация:
81
|
|
Попробуйте: comm -13 1.dic 2.dic > sravnenniy.dic
|
|
|

10.04.2017, 15:44
|
|
Флудер
Регистрация: 11.12.2010
Сообщений: 4,688
Провел на форуме: 997379
Репутация:
125
|
|
Сообщение от Kevin Shindel
Нашел полянку с ХуйВеями формата ... "Huawei_HG532e_ХХХХХ"
Так у них же WPS PIN соответствует алгоритму 24-bit PIN, либо статика 48579889.
|
|
|

10.04.2017, 16:34
|
|
Познавший АНТИЧАТ
Регистрация: 24.05.2015
Сообщений: 1,014
Провел на форуме: 350242
Репутация:
62
|
|
Сообщение от binarymaster
Так у них же WPS PIN соответствует алгоритму 24-bit PIN, либо статика 48579889.
WPS отключен был... проверю на всякий случай....
|
|
|

11.04.2017, 09:49
|
|
Member
Регистрация: 08.04.2017
Сообщений: 15
Провел на форуме: 3726
Репутация:
0
|
|
Тут пишут про какие то словари от Кота, где такие находятся, не нашел?
|
|
|

12.04.2017, 13:42
|
|
Постоянный
Регистрация: 12.02.2014
Сообщений: 827
Провел на форуме: 253961
Репутация:
12
|
|
Сообщение от Kakoluk
Условие: цифровая маска слева-справа из 7-ми цифр(но не более).
Я бы сделал реверс этого списка. Обычно ставят слово + пару цыфр.
|
|
|

15.04.2017, 16:14
|
|
Флудер
Регистрация: 24.07.2015
Сообщений: 2,338
Провел на форуме: 474896
Репутация:
31
|
|
Подскажите.Как выпилить из словаря всю кириллицу.
|
|
|
|
 |
|
|
Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)
|
|
|
|