Сообщение от
vika906091
Ребята,давайте всем миром сделаем словарик ИМЕН (с уменьшительно ласкательными).
https://anonfile.com/ddh0S8n6ob/allnames_csv
1. Перевести в латиницу.
Заменить цифру "3" на "i".
Заменить симфол "º" на "е".
--------------------
2. Поменять заглавную букву в нижний регистр.
-
------------------------
3. Удалить имена меньше 4х знаков и имена с мягким знаком.
-
---------------------------
4. Произвестиу ручную чистку имён от подозрительных-нелепых (проверяйте свои,не шучу).
-
----------------------------
5. Разделить словарик по количеству символов:
а). Сделать отдельный словарик с 8 и больше знаками.
б). Остаток от 6ти и больше дополнить цифрами от 00 до 99 и от 1980 до 2020
в). Остаток от 4х до 8ми дополнить цифрами от 1980 до 2020
-
------------------------------------
6. Соеденить результат воедино.
-
-------------------------------------
7.Сделать 3и словарика с разными регистрами .
-
---------------------------
Ребята помогите сделать по моему плану, у кого есть возможность.
Взят исходный файл allnames.csv, все слова с не кириллическими символами удалены (файл allnames-xz.txt)
Переведен в латиницу и отсортирован по длине, слова меньше 4-х символов удалены (файл allnames-min4.txt)
allnames_1.txt
Взято каждое слово в 3-х регистрах: нижний, верхний, первая буква в верхнем регистре и добавлены цифры от 00 до 99 и от 1970 до 2022 + еще несколько чисел.
allnames_2.txt
Взято каждое слово в 3-х регистрах: нижний, верхний, первая буква в верхнем регистре и добавлены цифры от 0 до 9999. Удалены все совпадения с allnames_1.txt. Т.е. содержимое allnames_2.txt не включает файл allnames_1.txt.
Слова меньше 8ми символов удалены.
Все словари отсортированы по длине.
https://anonfile.com/N8Aaq4t3oa/allnames_rar
https://drive.google.com/open?id=1yM1WrxwzydlFySw4Okt_7V0_W1_xUlau