Сообщение от
koler42
Каким архиватором словари ужимаются лучше всего? Времени и RAM не жалко.
Нашлась такая штука, как DAWG. Старый алгоритм, применялся еще в Crack от Alec Muffett.
Работает только на словарях, сортированных по алфавиту.
Налилуший результат дает, если сжать словарь в DAWG, а потом уже архиватором общего назначения.
hhttps://oylenshpeegul.github.io/Compress-DAWG/
https://github.com/oylenshpeegul/Compress-DAWG
(Надо прилжить руки, чтобы получить готовую утилиту.)
Эксперимент. Размер в байтах. Аргументы 7z a -t7z -m0=lzma2 -mx=9 -mfb=64 -md=32m -ms=on
Код:
1644191 american-english-large.txt
740801 american-english-large.dawg
354499 american-english-large.7z
219029 american-english-large.dawg.7z