ANTICHAT — форум по информационной безопасности, OSINT и технологиям
ANTICHAT — русскоязычное сообщество по безопасности, OSINT и программированию.
Форум ранее работал на доменах antichat.ru, antichat.com и antichat.club,
и теперь снова доступен на новом адресе —
forum.antichat.xyz.
Форум восстановлен и продолжает развитие: доступны архивные темы, добавляются новые обсуждения и материалы.
⚠️ Старые аккаунты восстановить невозможно — необходимо зарегистрироваться заново.

01.06.2009, 19:34
|
|
Reservists Of Antichat - Level 6
Регистрация: 25.04.2008
Сообщений: 827
Провел на форуме: 2769640
Репутация:
1304
|
|
iv. Странно, что ваша регулярка вообще работает. Она забирает все, что находится внутри тегов <cite/> если там не содержится слеш
И чем вам моя не нравится? Если забирает много ненужного, тогда так:
Код:
import re
dom = '''<cite>domain3.com</cite>sad ja sad. asda da.das asda. asdasdaswq.
sadas awe.q eqw .eqweqwe .qw eqwesa . <cite>www.domain3.com</cite>
<cite>qwe.domain1.com</cite> Lorem ipsum sit amet
<cite> http://qwe.rty.domain1.com</cite>
<cite>qwe.rty.domain2.com/index.html</cite>'''
out = re.findall(r'''<cite>.*?(\w+\.\w+)[\s/<>"']''',dom)
print set(out)
Все домены второго уровня без повторов
|
|
|

04.06.2009, 20:51
|
|
Участник форума
Регистрация: 14.12.2008
Сообщений: 140
Провел на форуме: 186812
Репутация:
14
|
|
помогите мне сделать регулярку чтобы проверяла чтобы в тексте было или <a href="текст" alt="текст">Текст</a> или <a href="текст" alt="текст"><img scr="текст" alt="Текст" /></a>. Чтобы проверяло или есть что то из этого но ничего кроме
|
|
|

04.06.2009, 20:54
|
|
Познавший АНТИЧАТ
Регистрация: 24.06.2008
Сообщений: 1,996
Провел на форуме: 6075534
Репутация:
2731
|
|
PHP код:
#<a href=".*" alt=".*">.*</a>|<a href=".*" alt=".*"><img scr=".*" alt=".*" \/></a>#
Последний раз редактировалось mailbrush; 04.06.2009 в 22:57..
|
|
|

04.06.2009, 20:55
|
|
Участник форума
Регистрация: 14.12.2008
Сообщений: 140
Провел на форуме: 186812
Репутация:
14
|
|
спс =) ща проверю
|
|
|

04.06.2009, 20:56
|
|
Moderator - Level 7
Регистрация: 21.03.2007
Сообщений: 1,200
Провел на форуме: 7134052
Репутация:
1204
|
|
помогите мне сделать регулярку чтобы проверяла чтобы в тексте было или <a href="текст" alt="текст">Текст</a> или <a href="текст" alt="текст"><img scr="текст" alt="Текст" /></a>. Чтобы проверяло или есть что то из этого но ничего кроме
хм? какой текст?
Код:
"<a href="[-_a-zA-Z\. /]+" alt="[-_a-zA-Z\. /]+">[-_a-zA-Z\. /]+</a>|<a href="[-_a-zA-Z\. /]+" alt="[-_a-zA-Z\. /]+"><img scr="[-_a-zA-Z\. /]+" alt="[-_a-zA-Z\. /]+" /></a>"
либо тупо любые символы:
Код:
"<a href=".+" alt=".+">.+</a>|<a href=".+" alt=".+"><img scr=".+" alt=".+" /></a>
|
|
|

04.06.2009, 21:00
|
|
Участник форума
Регистрация: 14.12.2008
Сообщений: 140
Провел на форуме: 186812
Репутация:
14
|
|
а что / и /si или # # не ставляться начале и в конце ?
|
|
|

04.06.2009, 21:01
|
|
Постоянный
Регистрация: 03.06.2009
Сообщений: 385
Провел на форуме: 3178262
Репутация:
389
|
|
img
PHP код:
"<img[\s]*src[\s]*=[\s]*([^>]*)"
href
PHP код:
"<[\s]*a[\s]*href[\s]*=[\s]*([^>]*)>([^<]*)<[\s]*/[\s]*a[\s]*>"
Писал по памяти, мог ошибится
Долго вспомниал, уже ответили 
Последний раз редактировалось FireFenix; 04.06.2009 в 21:04..
|
|
|

04.06.2009, 21:07
|
|
Постоянный
Регистрация: 03.06.2009
Сообщений: 385
Провел на форуме: 3178262
Репутация:
389
|
|
Сообщение от alwex
а что / и /si или # # не ставляться начале и в конце ?
// - граница регулярного выражения
si - модификаторы
s - метасимвол "точка" в шаблоне соответствует всем символам, включая перевод строк
i - символы в шаблоне соответствуют символам как верхнего, так и нижнего регистра
|
|
|

04.06.2009, 21:08
|
|
Участник форума
Регистрация: 14.12.2008
Сообщений: 140
Провел на форуме: 186812
Репутация:
14
|
|
парни, вы меня выручили, спасибо огромное, я заюзал вариант mailbrush потому-что у него самый подходящий
|
|
|

04.06.2009, 21:16
|
|
Постоянный
Регистрация: 29.09.2007
Сообщений: 617
Провел на форуме: 3250478
Репутация:
999
|
|
Delphi.
Багнутый модуль RegExpr...
Суть бага:
Есть регулярка:
<ucode>(.*)</ucode>
Сам текст:
xml
хрень
<ucode>123</ucode>
хрень2
ещё-что-то...
<ucode>234</ucode>
ляляля
В результате мы получаем вот так:
123</ucode>
хрень2
ещё-что-то...
<ucode>234
Может найдётся верная регулярка для "<td align="left">1</td>" и удастся обойти баг!
Спасибо!
|
|
|
|
|
Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)
|
|
|
|