ANTICHAT

ANTICHAT (https://forum.antichat.xyz/index.php)
-   Избранное (https://forum.antichat.xyz/forumdisplay.php?f=89)
-   -   madSS - madnet site structure | Сканнер структуры сайта. (https://forum.antichat.xyz/showthread.php?t=35340)

Sadman 12.03.2007 19:26

Цитата:

Сообщение от madnet
Это разные сервисы.

а в чем принципиальная разница?

madnet 12.03.2007 19:35

хотя бы в том, что http://tools.webmasters.sk тупо сканит ресурс, и если нет ссылки на какую-то страницу, то она никогда не появится в результатах, а мой сервис работает с гуглом, который за долгую историю скана собирает много инфы о сайте, к тому же логично что скорасть работы обсалюто отличается, у меня гинерится красивое дерево, а там х3, там не понимает русский язык, к томуж на моем сате тот сервис нашел 20 удаленный страниц, хех у меня всего столько, делаем вывод что криво он работает и т.д. и т.п.

Sadman 12.03.2007 19:46

Цитата:

Сообщение от madnet
хотя бы в том, что http://tools.webmasters.sk тупо сканит ресурс, и если нет ссылки на какую-то страницу, то она никогда не появится в результатах, а мой сервис работает с гуглом, который за долгую историю скана собирает много инфы о сайте, к тому же логично что скорасть работы обсалюто отличается, у меня гинерится красивое дерево, а там х3, там не понимает русский язык, к томуж на моем сате тот сервис нашел 20 удаленный страниц, хех у меня всего столько, делаем вывод что криво он работает и т.д. и т.п.

Ок. Значит имеем такое:
Там - робот, который шастая показывает as is.
У тебя тулза, которая, используя кэши гугла позволяет построить не только as is по тому что нашастал гугловый робот, но и то что было раньше - это и будет чисто твоя фишка. Нужно будет только научиться отличать старое от нового и получить что-то типа

1 site.net
--1 index.html [ver. -1] [ver. -2] ...
--2 ...
--3 ...

Дальше, раз у тебя есть уже механизм запросов можно дёшево и сердито прикрутить форму "Искать в гугле для каждого листа дерева" и показать результаты в этих самых листах.

Какие у тебя самого мысли о накручивании фич?

madnet 12.03.2007 20:02

Упор делаю на поиск дыр, поэтому различать старое и новое особого смысла не вижу, а по поводу фич что-нить, типа поиска раскрытия пути посредством гугла, запрещеных дир пр роботс.тхт и т.п. толком не определился пока.

Sadman 12.03.2007 20:25

Цитата:

Сообщение от madnet
Упор делаю на поиск дыр, поэтому различать старое и новое особого смысла не вижу, а по поводу фич что-нить, типа поиска раскрытия пути посредством гугла, запрещеных дир пр роботс.тхт и т.п. толком не определился пока.

IMHO гугл запрещённое роботс.тхт как раз и не покажет (али нет?)

А вот сам роботс.тхт кстати можно было бы распарсить - вдруг там что интересное (отметить на дереве ветки, запрещенные к показу)

кстати кроме роботс.тхт в твоем методе выпадают ещё страницы потэженые как запрещенные к индексированию
http://www.webmascon.com/topics/adv/8a.asp (см. ближе к концу)

madnet 12.03.2007 21:12

Цитата:

Сообщение от Sadman
IMHO гугл запрещённое роботс.тхт как раз и не покажет (али нет?)

google нет, я да.

Dracula4ever 13.03.2007 10:11

Просто красота :-)
Будем ждать исходников от всего серца и души :d

madnet 09.04.2007 12:11

Обновил сканнер, подробности в 1м посте.

sergeich 09.04.2007 23:00

Хорошая штука =) Надо только цвет шрифта поменять, пока приходится ctrl+a нажимать чтоб читабельно было, и в дизайн список не вписывается (размером - но это мелочи ))

Даешь open source ! :D

++

guest3297 09.04.2007 23:52

sergeich
юзай ie. тогда все будет вписываться.


Время: 10:31