![]() |
Цитата:
|
хотя бы в том, что http://tools.webmasters.sk тупо сканит ресурс, и если нет ссылки на какую-то страницу, то она никогда не появится в результатах, а мой сервис работает с гуглом, который за долгую историю скана собирает много инфы о сайте, к тому же логично что скорасть работы обсалюто отличается, у меня гинерится красивое дерево, а там х3, там не понимает русский язык, к томуж на моем сате тот сервис нашел 20 удаленный страниц, хех у меня всего столько, делаем вывод что криво он работает и т.д. и т.п.
|
Цитата:
Там - робот, который шастая показывает as is. У тебя тулза, которая, используя кэши гугла позволяет построить не только as is по тому что нашастал гугловый робот, но и то что было раньше - это и будет чисто твоя фишка. Нужно будет только научиться отличать старое от нового и получить что-то типа 1 site.net --1 index.html [ver. -1] [ver. -2] ... --2 ... --3 ... Дальше, раз у тебя есть уже механизм запросов можно дёшево и сердито прикрутить форму "Искать в гугле для каждого листа дерева" и показать результаты в этих самых листах. Какие у тебя самого мысли о накручивании фич? |
Упор делаю на поиск дыр, поэтому различать старое и новое особого смысла не вижу, а по поводу фич что-нить, типа поиска раскрытия пути посредством гугла, запрещеных дир пр роботс.тхт и т.п. толком не определился пока.
|
Цитата:
А вот сам роботс.тхт кстати можно было бы распарсить - вдруг там что интересное (отметить на дереве ветки, запрещенные к показу) кстати кроме роботс.тхт в твоем методе выпадают ещё страницы потэженые как запрещенные к индексированию http://www.webmascon.com/topics/adv/8a.asp (см. ближе к концу) |
Цитата:
|
Просто красота :-)
Будем ждать исходников от всего серца и души :d |
Обновил сканнер, подробности в 1м посте.
|
Хорошая штука =) Надо только цвет шрифта поменять, пока приходится ctrl+a нажимать чтоб читабельно было, и в дизайн список не вписывается (размером - но это мелочи ))
Даешь open source ! :D ++ |
sergeich
юзай ie. тогда все будет вписываться. |
| Время: 10:31 |