 |
|

01.12.2017, 10:46
|
|
Участник форума
Регистрация: 19.11.2008
Сообщений: 245
Провел на форуме: 987176
Репутация:
107
|
|
Сообщение от igrek
Спасибо всем, кто откликнулся, но пока не получается.
sublime++ открываешь оба файла(строк в каждом должно быть поровну). в одном просто выделяешь все, копируешь в буфер. во втором включаешь поиск, регулярные выражения и знак конца строки($ или начала ^, не важно) и жмешь find all. Затем просто из буфера вставляешь содержимое и все.
|
|
|

01.12.2017, 19:23
|
|
Member
Регистрация: 01.12.2017
Сообщений: 7
Провел на форуме: 1340
Репутация:
0
|
|
(проблема 1)
Доброго дня всем. У меня такой вопрос: имеется текстовый файл (парольный словарик), где слова уже отсортированы по частоте. Как добавлять в него новые слова, не нарушая порядок первичной сортировки? Например:
Словарик:
12345 140
qwert 140
abcdefg 35
abc123 3
095678 1
Новые слова:
Выход:
qwert 141
12345 140
abcdefg 35
abc123 4
095678 1
xyz 1
Цифры справа - частота слов. Дубликаты в первом словаре уже удалены. Во втором (новые слова) могут встречаться. Важна сортировка именно по частоте. Остальные виды сортировки не так важны. Инересует решение для линукса/убунту.
|
|
|

01.12.2017, 20:31
|
|
Member
Регистрация: 20.08.2016
Сообщений: 106
Провел на форуме: 36905
Репутация:
1
|
|
Сообщение от Xtezy
sublime++ открываешь оба файла(строк в каждом должно быть поровну). в одном просто выделяешь все, копируешь в буфер. во втором включаешь поиск, регулярные выражения и знак конца строки($ или начала ^, не важно) и жмешь find all. Затем просто из буфера вставляешь содержимое и все.
Спасибо, но sublime++ оказалась слишком сложная программа.
Тоже самое можно прделать в любом продвинутом редакторе, например -
Notepad++ , EmEditor. (перенос строки = \n ).
Но после всех манипуляций текст превращается в одну сплошную строку и по моему- это естественно. Знак конца строки мы заменяем на обычный текст.
Проблема решилась проще - в текстовом редакторе AkelPad_v4.8.0 есть функция
"вертикальная вставка" , ничего выделять не нужно, главное выставить курсор в конец первой строки и воспользоваться верхней строкой меню:
ПРАВКА-ВЫДЕЛЕНИЕ-ВЕРТИКАЛЬНАЯ ВСТАВКА. в буфере обмена уже должна быть правая половина.
Корректно работает сфайлами до миллиона строк.
https://yadi.sk/d/FE1ZltHZ3QEToP
Проблема решена, всем спасибо.
|
|
|

01.12.2017, 21:01
|
|
Member
Регистрация: 01.12.2017
Сообщений: 7
Провел на форуме: 1340
Репутация:
0
|
|
И ещё засада (проблема 2):
для сортировки по частоте пользуюсь командой:
cat 1.txt | sort -T "$(pwd)/" | uniq -c | sort -nr -T "$(pwd)/" | awk '{print $2 " " $1}' > 2.txt
Но если пароль состоит из нескольких слов, разделённых пробелом, то awk делит этот пароль на отдельные слова. Например: " у меня есть дом".
Получается:
А если без awk, то всё нормально, но впереди остаются 5 пробелов и частота повтора стоит впереди.
Как решитъ данную проблему?
|
|
|

01.12.2017, 21:30
|
|
Member
Регистрация: 01.12.2017
Сообщений: 7
Провел на форуме: 1340
Репутация:
0
|
|
Вторую проблему решил так:
cat 1.txt | sort -T "$(pwd)/" | uniq -c | sort -nr -T "$(pwd)/" | sed 's/^[ \t]*//' > 2.txt
Все пробелы перед номером впреди убиваются. С тем что цифра указывающая частоту стоит в начале, а не в конце - я жить могу.
А вот как решить первую проблему?
|
|
|

01.12.2017, 23:22
|
|
Member
Регистрация: 30.11.2017
Сообщений: 22
Провел на форуме: 6153
Репутация:
1
|
|
Словарик распрастраненных молдо-рум. имен с цифрами в конце.
http://rgho.st/8GrG7zlrM
|
|
|

02.12.2017, 11:41
|
|
Постоянный
Регистрация: 30.08.2011
Сообщений: 358
Провел на форуме: 66828
Репутация:
11
|
|
Сообщение от Klark89
(проблема 1)
Доброго дня всем. У меня такой вопрос: имеется текстовый файл (парольный словарик), где слова уже отсортированы по частоте. Как добавлять в него новые слова, не нарушая порядок первичной сортировки? Например:
Цифры справа - частота слов. Дубликаты в первом словаре уже удалены. Во втором (новые слова) могут встречаться. Важна сортировка именно по частоте. Остальные виды сортировки не так важны. Инересует решение для линукса/убунту.
Логично было бы привести оба словаря к одному формату. Пусть это будет "qwert 141", т.е. строка+пробел+количество_п второв. Сливаете оба в один, сортируете простой сортировкой, чтобы одинаковые слова шли подряд, потом проходите по нему, суммируя частоту повторов слов, если они совпадают. Вот так:
Код:
sort -T. in1.txt in2.txt | perl -ne 'END{print "$txt$cnt\n"} /^(.+?)(\d+)$/; if(defined $txt && ($txt ne $1)){print "$txt$cnt\n"; $txt=$1; $cnt=$2;}else{$txt=$1; $cnt+=$2;}' > out.txt
Здесь in1.txt in2.txt - оба типа "qwert 141".
Ну а потом сортируете это по частоте, я так понял, с этим уже вы разобрались.
|
|
|

02.12.2017, 19:49
|
|
Познавший АНТИЧАТ
Регистрация: 24.03.2012
Сообщений: 1,121
Провел на форуме: 418750
Репутация:
24
|
|
Сообщение от antic555
автор пишет, что там рядовые пароли, может кто знает более детально что там?
Кроме 8 цифр, инсайд про, там еще подмешаны другие словари. Например, даты рождения с буквами.
Вот нагенерил немного словарей. Формат паролей типа a01012001, 01012001a, A01012001, 01012001A и то же самое, только на 2 буквы.
Эффективность словарей против паролей из 3wifi базы и против брут-пакета из 800 хендшейков около 2%, если добавить словари на 3 буквы и микс прописные-строчные, эффективность поднимается до 3%, но такое я предпочитаю брутить масками.
Словари под Windows, сжатый размер 46 МБ, в распаковке 2,5 ГБ
rghost googledisc [COLOR="rgb(0, 255, 0)"]cloud.mailru[/COLOR]
|
|
|

03.12.2017, 01:17
|
|
Member
Регистрация: 29.11.2017
Сообщений: 35
Провел на форуме: 12939
Репутация:
0
|
|
Товарищи, ткните носом в последнюю рабочую ссылку на 3wifi словарь. Пожалуйста!
|
|
|

03.12.2017, 01:20
|
|
Active Member
Регистрация: 25.09.2013
Сообщений: 379
Провел на форуме: 135690
Репутация:
3
|
|
Сообщение от alex2178
Товарищи, ткните носом в последнюю рабочую ссылку на 3wifi словарь. Пожалуйста!
пару страниц назад.
|
|
|
|
 |
|
|
Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)
|
|
|
|