Форум АНТИЧАТ

Форум АНТИЧАТ (https://forum.antichat.xyz/index.php)
-   Избранное (https://forum.antichat.xyz/forumdisplay.php?f=89)
-   -   madSS - madnet site structure | Сканнер структуры сайта. (https://forum.antichat.xyz/showthread.php?t=35340)

madnet 12.03.2007 16:43

madSS - madnet site structure | Сканнер структуры сайта.
 
Данный сервис предназначен для определения структуры сайта. Часто приходится пользоваться различными сканнерами для определения структуры сайта, но мы забываем, что в 99% случаев до нас это сделал лучший сервис сети, великий и могучий GOOGLE, причем частенько он запоминает то, до чего смертному просто так не добраться. Моя система пытается вытянуть максимум информации о сайте из гугла и построить на ее основе дерево сайта, утилита так же будет полезна web программистам для анализа индексации сайта гуглом.

http://madnet.name/news/19.html

P/S сразу уточню что это альфа версия.



UPDATED
Логическим продолжением

madSS - madnet site structure
стал переход его в
GmadS – Google madnet Scaner

Обуславливается это новыми возможностями системы, а именно:
1) Поиск доступной для просмотра PHPINFO информации
2) Вывод директорий сайта, запрещенных к индексированию
3) Вывод списка Сайтов на сервере aka (ReverseIP)

линк тот же.

guest3297 12.03.2007 16:51

Спасибо как всегда радуешь нас.
исходники будут?

tclover 12.03.2007 17:20

http://tools.webmasters.sk/sitemap-creator.php

blaga 12.03.2007 17:47

идея конечно ничего... но дорабатывать нужно... вот еще бы помимо гугла еще что нибудь... а то стата маленькая получаеться.

madnet 12.03.2007 18:18

2cash,
доведу до ума, а там наверняка

2tclover,
здесь сервак сам сканит сайт, хотел бы я посмотреть как он просканит скажем 1к страниц + русский чет он никак

tclover 12.03.2007 18:30

Да нормально вроде с русским :)
http://img157.imageshack.us/img157/2343/capture1mu0.jpg

Sadman 12.03.2007 18:30

Хорошо.
Следующий шаг - добавить к каждой вершине дерева (goto)

D=P=CH= MOD= 12.03.2007 18:31

madnet 5 баллов!

Хорошо бы бруттер директорий добавить для полного комплекта)

Sadman 12.03.2007 18:38

Цитата:

Сообщение от tclover
http://tools.webmasters.sk/sitemap-creator.php

всё уже сделано до нас ;)

madnet 12.03.2007 19:09

Цитата:

Сообщение от Sadman
всё уже сделано до нас ;)

Это разные сервисы.

Sadman 12.03.2007 19:26

Цитата:

Сообщение от madnet
Это разные сервисы.

а в чем принципиальная разница?

madnet 12.03.2007 19:35

хотя бы в том, что http://tools.webmasters.sk тупо сканит ресурс, и если нет ссылки на какую-то страницу, то она никогда не появится в результатах, а мой сервис работает с гуглом, который за долгую историю скана собирает много инфы о сайте, к тому же логично что скорасть работы обсалюто отличается, у меня гинерится красивое дерево, а там х3, там не понимает русский язык, к томуж на моем сате тот сервис нашел 20 удаленный страниц, хех у меня всего столько, делаем вывод что криво он работает и т.д. и т.п.

Sadman 12.03.2007 19:46

Цитата:

Сообщение от madnet
хотя бы в том, что http://tools.webmasters.sk тупо сканит ресурс, и если нет ссылки на какую-то страницу, то она никогда не появится в результатах, а мой сервис работает с гуглом, который за долгую историю скана собирает много инфы о сайте, к тому же логично что скорасть работы обсалюто отличается, у меня гинерится красивое дерево, а там х3, там не понимает русский язык, к томуж на моем сате тот сервис нашел 20 удаленный страниц, хех у меня всего столько, делаем вывод что криво он работает и т.д. и т.п.

Ок. Значит имеем такое:
Там - робот, который шастая показывает as is.
У тебя тулза, которая, используя кэши гугла позволяет построить не только as is по тому что нашастал гугловый робот, но и то что было раньше - это и будет чисто твоя фишка. Нужно будет только научиться отличать старое от нового и получить что-то типа

1 site.net
--1 index.html [ver. -1] [ver. -2] ...
--2 ...
--3 ...

Дальше, раз у тебя есть уже механизм запросов можно дёшево и сердито прикрутить форму "Искать в гугле для каждого листа дерева" и показать результаты в этих самых листах.

Какие у тебя самого мысли о накручивании фич?

madnet 12.03.2007 20:02

Упор делаю на поиск дыр, поэтому различать старое и новое особого смысла не вижу, а по поводу фич что-нить, типа поиска раскрытия пути посредством гугла, запрещеных дир пр роботс.тхт и т.п. толком не определился пока.

Sadman 12.03.2007 20:25

Цитата:

Сообщение от madnet
Упор делаю на поиск дыр, поэтому различать старое и новое особого смысла не вижу, а по поводу фич что-нить, типа поиска раскрытия пути посредством гугла, запрещеных дир пр роботс.тхт и т.п. толком не определился пока.

IMHO гугл запрещённое роботс.тхт как раз и не покажет (али нет?)

А вот сам роботс.тхт кстати можно было бы распарсить - вдруг там что интересное (отметить на дереве ветки, запрещенные к показу)

кстати кроме роботс.тхт в твоем методе выпадают ещё страницы потэженые как запрещенные к индексированию
http://www.webmascon.com/topics/adv/8a.asp (см. ближе к концу)

madnet 12.03.2007 21:12

Цитата:

Сообщение от Sadman
IMHO гугл запрещённое роботс.тхт как раз и не покажет (али нет?)

google нет, я да.

Dracula4ever 13.03.2007 10:11

Просто красота :-)
Будем ждать исходников от всего серца и души :d

madnet 09.04.2007 12:11

Обновил сканнер, подробности в 1м посте.

sergeich 09.04.2007 23:00

Хорошая штука =) Надо только цвет шрифта поменять, пока приходится ctrl+a нажимать чтоб читабельно было, и в дизайн список не вписывается (размером - но это мелочи ))

Даешь open source ! :D

++

guest3297 09.04.2007 23:52

sergeich
юзай ie. тогда все будет вписываться.

madnet 10.04.2007 11:19

sergeich, какой браузер?

sergeich 10.04.2007 13:18

madnet
FireFox 2.0.0.3

[ cash ]
К IE доверия нет ;)

guest3297 10.04.2007 14:33

madnet
Та ФФ не корректно отображает страницу (цвет+границы).


madnet 10.04.2007 19:58

Цитата:

Сообщение от sergeich
madnet
FireFox 2.0.0.3

Цитата:

Сообщение от [ cash ]
madnet
Та ФФ не корректно отображает страницу (цвет+границы).


ИСПРАВЛЕНО

Robin_Hood 05.05.2007 10:43

Цитата:

Сообщение от madnet
ИСПРАВЛЕНО

уверен?

http://img149.imageshack.us/img149/449/10921092vz7.png

blackybr 06.05.2007 11:36

глюк в мозилле..

http://img296.imageshack.us/img296/558/madnetmq5.gif

madnet 30.05.2007 16:25

Подправил некоторые мелочи +
Добавил
-вывод основного Ip
-страну
-Версию демона, возвращаемого сервером.

NOmeR1 30.05.2007 19:42

Хех)) Вот чё твоим скриптом нашёл интересненького :)
http://ya.ru/robots.txt
http://google.com/robots.txt

NApoleonchik 06.07.2007 17:49

Сделай форматирование ссылок получше и будет ВО!

bopoh13 06.07.2007 23:27

У не работает на сайтах с низкой посещаемостью и "замороженых"...
_http://bonchbrubonch.ru/

madnet 07.07.2007 12:26

Цитата:

Сообщение от NApoleonchik
Сделай форматирование ссылок получше и будет ВО!

Конкретнее?

madnet 07.07.2007 12:30

Цитата:

Сообщение от bopoh13
У не работает на сайтах с низкой посещаемостью и "замороженых"...
_http://bonchbrubonch.ru/

Это не сайт с низкой посещаемостью, а сайт о котором гугл ничего не слышал.

invlose 07.07.2007 12:32

не знаю что он имел в виду)Но
у тебя там дерево выводится
было удобно чтобы можно было нажать мышкой на и перейти страницу в этом дереве.

dtree
там вроде легко будет
это сделать

halkfild 09.07.2007 00:06

да только все рефферы будут идти с сайта madnet.. я ему такая популярность незачем.

имхо: если сильно надо то сделать рядом текстовое представление ссылки на ресурс

З.Ы. за тузлу респект :)) но есть недочеты.. например пишет иногда что файл это папка.. как на самом деле нет

invlose 09.07.2007 00:18

вообще-то можно сделать и без реферера.

madnet 19.07.2007 13:16

Исправил проблему с отображением в FireFox

madnet 23.07.2007 19:10

Цитата:

Сообщение от invlose
не знаю что он имел в виду)Но
у тебя там дерево выводится
было удобно чтобы можно было нажать мышкой на и перейти страницу в этом дереве.

Сделал переход на страницу по клику.
А так же добавил поддержку буржуйского языка.

vvs777 26.07.2007 06:59

Рульная штука. Из нее я узнал что гугль по моему сайту плохо прошелся.
только несколько папок и то самые редкооткрываемые...

2madnet
округлил репутацию (+) =)

Talisman 26.07.2007 11:50

при сканировании сайта hexxgames.ru невыдает некоторые расширения, например:
faq.
index.
index.php
login.
memberlist.
profile.php
search.
search.php
viewforum.
viewonline.
viewtopic.

neon_fx 24.02.2008 04:38

Кроме всего можно сдеоать потск и по Yandex
он тоже потдерживает дополнительные параметры поиска
такиеже как и гугл


Время: 01:35