Улучшить возможности поиска

Avatar
  • обновлен
  • Завершен
1. по точному вхождению

2. в различных падежах/временах

3. синонимы

4. Реал-тайм поиск (при задержке в 0,5 сек - запрос по текущему вводу)

5. Suggestions - сократит количество повторов и ошибок в написании

6. В приоритете искать по заголовку, потом по описанию, потом по комментам (комменты наполняют идею кейвордами, что облегчает поиск)
Прикрепленные ответы
Avatar
Vladimir Mullagaliyev co-founder
  • Ответ
  • Завершен
Здравствуйте.
В данный момент поиск выполняется следующим образом:

Индексация:
Индексируются тексты с заголовка и описания фидбэка, слова нормализуются стеммером (набором правил формообразования слов, для каждого языка свой).

Поиск:
Строка поиска разбивается на слова, слова нормализуются стеммером. Выполняется поиск индексов слов по полному совпадению нормализованного слова. Выбираются все фидбаки, где встретилось хотя бы 1 слово (максимум 10 фидбаков) и вверх поднимаются те, где совпадение слов больше.

Что планируем поэкспериментировать:
Попробовать поиск индексов слов по части слова (неполное совпадение).

Остальное давайте обсуждать в комментах.
Avatar
Vladimir Mullagaliyev co-founder
Добавили понятие важности слова. Теперь оно учитывается при выдаче результата. Тестируйте, по нашему мнению стало лучше. Попробуйте "вес танка", "изида лечит".
Avatar
Anton Volkov
Поиск стал в стопицот раз удобнее! Спасибо вам огромное!
Надеюсь, на этом не закончится, т.к. тонкий тюнинг ещё даст свои 20-30% удобства.
Ну и очень ждём внешний вид результатов поиска как обычные фильтры.
Avatar
Vladimir Mullagaliyev co-founder
Сейчас как раз занимаемся подгонкой под вид обычного фильтра, за исключением листания страниц. Т.к. стремимся чтобы нужный результат был в 10. На практике редко кто переходит на вторую страницу поиска :)
Avatar
Anton Volkov
Если всё таки оставите возможность листания, буду очень признателен.
База отзывов растёт и возможно через полгода уже действительно проще будет пролистать первые 20-30 результатов, чем шаманить с ключевыми словами.

Ну и не забывайте про нас - админов. Поиск дубликатов - то ещё развлечение :)
Avatar
Anton Volkov
Есть дополнительное предложение - дополнительно учитывать в формуле релевантности количество голосов за отзыв (мера его популярности), причём именно количество проголосовавших, без учёта "положительности" идеи.
Avatar
Camilo Cienfuegos
ребята, дайте возможность объединять не по одному "юниту" а несколько за один раз. например нашел 5 дублей, было бы гораздо удобнее 5 раз нажать кнопку "объединить"
Avatar
Sergey Stukov co-founder
вынесли ваш запрос в отдельный отзыв
http://feedback.userecho.com/feedback/4108-obedinyat-neskolko-dublikatov-ne-pokidaya-interfejsa-obedineniya/
Голосуйте
Avatar
Sergey Stukov co-founder
Создать список стоп-слов которые игнорировать при поиске
либо список слов с нулевым весом
например слова "Добавить","Сделать",...
Avatar
Anton Volkov
Стоп-слова - отличная идея!
Avatar
Vladimir Mullagaliyev co-founder
  • Ответ
  • Завершен
Здравствуйте.
В данный момент поиск выполняется следующим образом:

Индексация:
Индексируются тексты с заголовка и описания фидбэка, слова нормализуются стеммером (набором правил формообразования слов, для каждого языка свой).

Поиск:
Строка поиска разбивается на слова, слова нормализуются стеммером. Выполняется поиск индексов слов по полному совпадению нормализованного слова. Выбираются все фидбаки, где встретилось хотя бы 1 слово (максимум 10 фидбаков) и вверх поднимаются те, где совпадение слов больше.

Что планируем поэкспериментировать:
Попробовать поиск индексов слов по части слова (неполное совпадение).

Остальное давайте обсуждать в комментах.