
21.02.2010, 22:25
|
|
Участник форума
Регистрация: 26.08.2009
Сообщений: 138
С нами:
8794390
Репутация:
18
|
|
Задача: спарсить с любого сайта абсолютно все внутренние ссылки(ведущие на другие страницы этого же сайта), при чём сделать это максимально быстрым способом. Поэтому регулярки не подходят. Склоняюсь к DOM, но точно не знаю как парсить таким способом. То есть без использования различных дополнительных библиотек.. Быть может будут и готовые решения?
|
|
|

21.02.2010, 22:29
|
|
Постоянный
Регистрация: 16.04.2008
Сообщений: 889
С нами:
9510146
Репутация:
1550
|
|
Сообщение от programming
Задача: спарсить с любого сайта абсолютно все внутренние ссылки(ведущие на другие страницы этого же сайта), при чём сделать это максимально быстрым способом. Поэтому регулярки не подходят. Склоняюсь к DOM, но точно не знаю как парсить таким способом. То есть без использования различных дополнительных библиотек.. Быть может будут и готовые решения?
Со всего сайта рекурсивно или 't с одной страницы?
Чем не устраивают регулярки?
|
|
|

21.02.2010, 22:38
|
|
Участник форума
Регистрация: 26.08.2009
Сообщений: 138
С нами:
8794390
Репутация:
18
|
|
Сообщение от wildshaman
Со всего сайта рекурсивно или 't с одной страницы?
Чем не устраивают регулярки?
Регулярки дольше работают..
Со всего сайта. Но мне бы хотя бы с одной страницы решение найти..
|
|
|

21.02.2010, 22:43
|
|
Постоянный
Регистрация: 16.04.2008
Сообщений: 889
С нами:
9510146
Репутация:
1550
|
|
Сообщение от programming
Регулярки дольше работают..
Со всего сайта. Но мне бы хотя бы с одной страницы решение найти..
Быстрее регулярок решения ты не найдешь, я думаю. Тем более, на одной страницы не будет около миллиона ссылок, чтобы регулярки замедлять сильно.
|
|
|

22.02.2010, 15:17
|
|
Участник форума
Регистрация: 26.08.2009
Сообщений: 138
С нами:
8794390
Репутация:
18
|
|
Сообщение от wildshaman
Быстрее регулярок решения ты не найдешь, я думаю. Тем более, на одной страницы не будет около миллиона ссылок, чтобы регулярки замедлять сильно.
Ну тогда можно универсальную регулярку для выдирания всех ссылок?(php).
|
|
|

22.02.2010, 15:38
|
|
Познавший АНТИЧАТ
Регистрация: 24.06.2008
Сообщений: 1,996
С нами:
9410786
Репутация:
2731
|
|
Сообщение от wildshaman
Быстрее регулярок решения ты не найдешь, я думаю. Тем более, на одной страницы не будет около миллиона ссылок, чтобы регулярки замедлять сильно.
Все в точности до наоборот. Регулярки - самый удобный способ выдирания чего-то, но самый медленный.
Сообщение от SeNaP
Всем привет.
Возможно ли как нибудь записать текст из GET переменной, не зная саму GET переменную.
Например есть:
$_GET[cmd]
$_GET[a]
$_GET[test]
и т.д.
Как вот записать или просто определить что хранят переменные, не знаю точное её название, но зная, что она передаётся методом GET

Последний раз редактировалось mailbrush; 22.02.2010 в 15:41..
|
|
|

21.02.2010, 23:56
|
|
Reservists Of Antichat - Level 6
Регистрация: 25.04.2008
Сообщений: 827
С нами:
9497186
Репутация:
1304
|
|
Hofs
PHP код:
$text = 'Привет';
$outtext = urlencode(base64_encode($text));
echo $outtext;
__________________
Любая действущая программа устарела.
Создайте систему, которой сможет пользоваться даже дурак ,и только дурак захочет ею пользоваться.
Как правильно задавать вопросы: _http://www.yakimchuk.ru/questions.htm
|
|
|

21.02.2010, 23:59
|
|
Постоянный
Регистрация: 14.04.2008
Сообщений: 327
С нами:
9512608
Репутация:
69
|
|
Если я тебя правильно понял Hofs то тебе нужно:
base64_encode()
Функция кодирует данные в кодировке MIME base64.
Синтаксис:
string base64_encode(string data)
Функция base64_encode() возвращает строку, переданную в параметре data в кодировке MIME base64.
Кодировка MIME base64 разработана для передачи двоичных данных через транспортные слои, которые не содержат восьмой бит, к примеру, как почтовые тела. Заметим, что данные в кодировке Base64 занимают примерно на 30% больше места, чем оригинал.
|
|
|

22.02.2010, 00:08
|
|
Новичок
Регистрация: 03.08.2009
Сообщений: 23
С нами:
8827135
Репутация:
2
|
|
Спасибо за помощь!=)
код от Gifts - как раз то что мне нужно =)
|
|
|

22.02.2010, 00:15
|
|
Новичок
Регистрация: 29.09.2009
Сообщений: 5
С нами:
8745031
Репутация:
0
|
|
Ребята, подскажите как можно сделать, чтобы php страничка определяла, зашел юзер с прокси или без нее?
|
|
|
|
 |
|
|
Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)
|
|
|
|