.tech | Searching...

Предположим, что есть у меня блог (а они есть у меня) и в одном из них несколько тысячь записей (а они есть у меня) и в одно прекрасное антифригидное утро (а оно есть у меня) что-то в голове замыкает и хочется мне найти один пост из прошлого. Проблема, правда, в том, что точно сказать когда я его написал — я не могу. Так же не припомню ни одного «хитрого» слова чтобы по нему сделать поиск по всем постам. И что же тогда делать, Холмс? Элементарно, Ватсон — распределённый поиск. А как это? А вот так это:

Дано:

  1. Поисковый индекс по каждому отдельному посту с «весом» каждого слова — чем реже оно встречается в текте поста, тем и вес у него больше. Конечно, «обычные» слова в нём не учитываются.
  2. Немножко магии и мозгов

Итак, открываем свою голову и начинаем хоть примерно вспоминать про что был тот пост. Предположим что мы уверены, что там было слово «Вино». Хорошо, пишем в поисковую строку слово «Вино» и, вуаля, если постов со словом «Вино» в индексе больше 20, то вместо (вместе с) этого нам представляется набор из редких слов во всех постах где встречалось слово «Вино» (можно даже графически оформить, где самые редкие — самые большие). Дальше остаётся нажать мышой на какое-то понравившееся слово, которое вызывает необходимые ассоциации (например «Женщины»). Если хитов всё равно больше 20ти, то получаем ещё более узкий список слов. Этот процесс продолжается до тех пор, пока нужный пост не будет найдет.

Технически не так-то и сложно, а автору будет в помощь.

Ну и, конечно, для особо одярённых весь этот процесс в картинках:

[image]
[image]
[image]
Top

Комментарии Отключены

cactusinside

ссылка ] + "облако тегов"

de.icio.us тоже подсказывает дополнительные ключ.слова

или говорили про что то другое?

18.03.2006 // 07:38 [ ссылка ]

Ответ от Автора

В этом направлении, но работа на с ключ словами а именно с текстом записей

18.03.2006 // 12:44 [ ссылка ]