HOME FORUMS MEMBERS RECENT POSTS LOG IN  
× Авторизация
Имя пользователя:
Пароль:
Нет аккаунта? Регистрация
Баннер 1   Баннер 2
НОВЫЕ ТОРГОВАЯ НОВОСТИ ЧАТ
loading...
Скрыть
Вернуться   ANTICHAT > ПРОГРАММИРОВАНИЕ > PHP
   
Ответ
 
Опции темы Поиск в этой теме Опции просмотра

  #1  
Старый 21.02.2010, 22:25
programming
Участник форума
Регистрация: 26.08.2009
Сообщений: 138
С нами: 8794390

Репутация: 18
По умолчанию

Задача: спарсить с любого сайта абсолютно все внутренние ссылки(ведущие на другие страницы этого же сайта), при чём сделать это максимально быстрым способом. Поэтому регулярки не подходят. Склоняюсь к DOM, но точно не знаю как парсить таким способом. То есть без использования различных дополнительных библиотек.. Быть может будут и готовые решения?
 
Ответить с цитированием

  #2  
Старый 21.02.2010, 22:29
wildshaman
Постоянный
Регистрация: 16.04.2008
Сообщений: 889
С нами: 9510146

Репутация: 1550


По умолчанию

Цитата:
Сообщение от programming  
Задача: спарсить с любого сайта абсолютно все внутренние ссылки(ведущие на другие страницы этого же сайта), при чём сделать это максимально быстрым способом. Поэтому регулярки не подходят. Склоняюсь к DOM, но точно не знаю как парсить таким способом. То есть без использования различных дополнительных библиотек.. Быть может будут и готовые решения?
Со всего сайта рекурсивно или 't с одной страницы?
Чем не устраивают регулярки?
 
Ответить с цитированием

  #3  
Старый 21.02.2010, 22:38
programming
Участник форума
Регистрация: 26.08.2009
Сообщений: 138
С нами: 8794390

Репутация: 18
По умолчанию

Цитата:
Сообщение от wildshaman  
Со всего сайта рекурсивно или 't с одной страницы?
Чем не устраивают регулярки?
Регулярки дольше работают..
Со всего сайта. Но мне бы хотя бы с одной страницы решение найти..
 
Ответить с цитированием

  #4  
Старый 21.02.2010, 22:43
wildshaman
Постоянный
Регистрация: 16.04.2008
Сообщений: 889
С нами: 9510146

Репутация: 1550


По умолчанию

Цитата:
Сообщение от programming  
Регулярки дольше работают..
Со всего сайта. Но мне бы хотя бы с одной страницы решение найти..
Быстрее регулярок решения ты не найдешь, я думаю. Тем более, на одной страницы не будет около миллиона ссылок, чтобы регулярки замедлять сильно.
 
Ответить с цитированием

  #5  
Старый 22.02.2010, 15:17
programming
Участник форума
Регистрация: 26.08.2009
Сообщений: 138
С нами: 8794390

Репутация: 18
По умолчанию

Цитата:
Сообщение от wildshaman  
Быстрее регулярок решения ты не найдешь, я думаю. Тем более, на одной страницы не будет около миллиона ссылок, чтобы регулярки замедлять сильно.
Ну тогда можно универсальную регулярку для выдирания всех ссылок?(php).
 
Ответить с цитированием

  #6  
Старый 22.02.2010, 15:38
mailbrush
Познавший АНТИЧАТ
Регистрация: 24.06.2008
Сообщений: 1,996
С нами: 9410786

Репутация: 2731


По умолчанию

Цитата:
Сообщение от wildshaman  
Быстрее регулярок решения ты не найдешь, я думаю. Тем более, на одной страницы не будет около миллиона ссылок, чтобы регулярки замедлять сильно.
Все в точности до наоборот. Регулярки - самый удобный способ выдирания чего-то, но самый медленный.
Цитата:
Сообщение от SeNaP  
Всем привет.
Возможно ли как нибудь записать текст из GET переменной, не зная саму GET переменную.
Например есть:
$_GET[cmd]
$_GET[a]
$_GET[test]
и т.д.
Как вот записать или просто определить что хранят переменные, не знаю точное её название, но зная, что она передаётся методом GET


PHP код:
print_r($_GET); 

Последний раз редактировалось mailbrush; 22.02.2010 в 15:41..
 
Ответить с цитированием

  #7  
Старый 21.02.2010, 23:56
Gifts
Reservists Of Antichat - Level 6
Регистрация: 25.04.2008
Сообщений: 827
С нами: 9497186

Репутация: 1304


По умолчанию

Hofs
PHP код:
$text 'Привет';
$outtext urlencode(base64_encode($text));
echo 
$outtext
__________________
Любая действущая программа устарела.
Создайте систему, которой сможет пользоваться даже дурак ,и только дурак захочет ею пользоваться.
Как правильно задавать вопросы: _http://www.yakimchuk.ru/questions.htm
 
Ответить с цитированием

  #8  
Старый 21.02.2010, 23:59
0ldbi4
Постоянный
Регистрация: 14.04.2008
Сообщений: 327
С нами: 9512608

Репутация: 69
По умолчанию

Если я тебя правильно понял Hofs то тебе нужно:

base64_encode()
Функция кодирует данные в кодировке MIME base64.

Синтаксис:
string base64_encode(string data)
Функция base64_encode() возвращает строку, переданную в параметре data в кодировке MIME base64.

Кодировка MIME base64 разработана для передачи двоичных данных через транспортные слои, которые не содержат восьмой бит, к примеру, как почтовые тела. Заметим, что данные в кодировке Base64 занимают примерно на 30% больше места, чем оригинал.
 
Ответить с цитированием

  #9  
Старый 22.02.2010, 00:08
Hofs
Новичок
Регистрация: 03.08.2009
Сообщений: 23
С нами: 8827135

Репутация: 2
По умолчанию

Спасибо за помощь!=)
код от Gifts - как раз то что мне нужно =)
 
Ответить с цитированием

  #10  
Старый 22.02.2010, 00:15
NeoKlon
Новичок
Регистрация: 29.09.2009
Сообщений: 5
С нами: 8745031

Репутация: 0
По умолчанию

Ребята, подскажите как можно сделать, чтобы php страничка определяла, зашел юзер с прокси или без нее?
 
Ответить с цитированием
Ответ



Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
[c/c++] Новичкам: задаем вопросы _Great_ С/С++, C#, Rust, Swift, Go, Java, Perl, Ruby 5421 21.04.2026 07:37
Интернетчики задали российскому президенту очень странные вопросы podkashey Мировые новости. Обсуждения. 4 07.07.2006 16:53
Вопросы по Ipb 2.0 Voodoo_People Уязвимости CMS / форумов 26 15.02.2005 22:57



Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)
 


Быстрый переход




ANTICHAT ™ © 2001- Antichat Kft.