Показано с 1 по 6 из 6
Тема: Индексация веб сайтов
Древовидный режим
-
18.01.2010, 14:35 #1
- Регистрация
- 18.01.2010
- Сообщений
- 6
- Сказал(а) спасибо
- 0
- Поблагодарили 0 раз(а) в 0 сообщениях
Индексация веб сайтов
В мире существуют кучи поисковиков. Яндекс Гугл и прочие. Так вот возникла необходимость создать свой небольшой поисковик.
Кто нибудь видел описания алгоритмов индексации? Понятное дело что что-то похожее на яндекс и гугл не сделать, но мне это и не нужно :)
Первое что приходит в голову рекурсивно обойти страницы, выкинуть хтмл, знаки препинания, слишком короткие слова.
Но как выкинуть например элементы дизайна? На каждой странице есть менюшки, счетчики и всякая прочая фигня. Как её вырезать чтобы она не забивала поиск?
Как выбрать из страницы только смысл? Хотябы направление по которому идти где нибудь описано? :)
Похожие темы
-
Программы для посетителей Веб сайтов
от web-soft в разделе Интернет и сетиОтветов: 0Последнее сообщение: 26.12.2009, 20:52 -
скрипт рейтинга сайтов
от DEL в разделе В помощь вебмастеруОтветов: 0Последнее сообщение: 05.07.2009, 23:27
Социальные закладки