
17.11.2009, 22:04
|
|
Постоянный
Регистрация: 15.06.2007
Сообщений: 527
Провел на форуме: 1734541
Репутация:
214
|
|
Сообщение от Doktor_radosti
Хочу написать парсер выдачи google blog search, столкнулся с проблемой, не получается сделать проверку собранных урлов из google blog search на уникальность.
Логика работы, собираем из фида ссылки, и потом сравниваем с сылками из файла, если совпадение не найдено передаем уникальные урлы дальше. Кривая регулярка для парсинга уролов:
Код:
$url = "http://blogsearch.google.com/blogsearch_feeds?hl=en&q=bla&lr=&ie=utf-8&num=10&output=rss";
$rss = @file_get_contents($url);
$count = 10;
for ($i = 0; $i < $count; $i++) {
preg_match_all("|<link>(.*)</link>|Uis", $rss, $linka);
}
echo var_dump($linka);
а если загнать из фида ссылки в массив
и открыть файл и тоже загнать ссылки в массив, далее сравнить массивы
$result = array_diff ($array1, $array2);
|
|
|