Wikia Search: В нашей базе уже пол-миллиарда url
февраля 16, 08 Автор adminВыдержки из интервью с техдиректором Wikia Search Джереми Миллером и сооснователем Wikia.com Анджелой Бизли.
Полностью интервью читайте на
Searchengines.ru: - Wikipedia является одним из самых популярных сайтов в сети Интернет, как и почему появилась идея открыть свой поисковик? Не слишком ли это большой риск – выходить на совершенно новый рынок?
Анджела: Не смотря на то, что и Wikipedia, и были основаны Джимми Уейлзом, - это совершенно независимые компании. Организация, которая занимается развитием Wikipedia никак не участвует в развитии .
Wikia – полностью коммерческая организация, занимающаяся wiki. Кроме развития поисковика Wikia Search, она является хостером более 4000 wiki-сайтов по любым темам, интересным пользователям. Эти темы варьируют от политических до игровых. К примеру, вот ряд русскоязычных wiki, которые размещены у нас.
Более 1000 статей:
- http://ru.science.wikia.com/
- http://absurdopedia.wikia.com/
- http://ru.math.wikia.com/
- http://ru.writers.wikia.com/
- http://ru.starwars.wikia.com
- http://ru.history.wikia.com/
От 100 до 500 статей:
- http://ru.wilderness.wikia.com
- http://ru.lgbt.wikia.com/
- http://chronology.wikia.com/
- http://ru.rpg.wikia.com/
- http://ru.harrypotter.wikia.com/
- http://ru.smalltalk.wikia.com/
- http://anticopyright.wikia.com/
- http://ru.costume.wikia.com/
От 50 до 100 статей:
- http://ru.lanos.wikia.com/
- http://ru.althistory.wikia.com
- http://transhumanism.wikia.com/
- http://ru.google.wikia.com/
- http://ru.archaeology.wikia.com/
- http://ru.fallout.wikia.com/
- http://ru.dnd.wikia.com/
Все эти wiki открыты к редактированию, каждый пользователь может , если не нашел интересующей его темы.
Searchengines.ru: Сколько документов уже проиндексировано Wikia Search?
Джереми Миллер: В нашей базе уже пол-миллиарда url, но в настоящий момент только 10-20% из них помещены в кэш.
Searchengines.ru: Какие технологии лежат в основе Wikia Search?
Джереми: В основе проекта лежат опен-сорс проекты (для поиска) и (для социальных сетей).
Searchengines.ru: Какие принципы ранжирования используются? Используется ли только человеческая оценка или комбинации с машинными алгоритмами?
Джереми: Основу составляет технология Nutch с OPIC с использованием метода мини-статей, который дает возможность моментального “человеческого” управления.
Анджела: Мы собираемся комбинировать оба подхода. Мы будем использовать созданные людьми оценки, кроме того, на результаты, полученные пользователем, будет влиять весь социальный граф. Результаты, увиденные пользователем, будут существенно зависеть от действий его друзей, с которыми он находится в общей социальной сети, которая является частью Wikia.
Searchengines.ru: Планируете ли вы создание чего-то наподобие Google AdSense?
Джереми: Многие составляющие проекта открыты и бесплатны, однако со временем в поисковых результатах Wikia.com определенно появится реклама, похожая на AdSense.
Анджела: Мы нацелены прежде всего на построение поиска Wikia и только после этого мы будем думать о монетизации! Скорее всего, мы будем использовать для этого рекламу, хотя Google AdSense вряд ли будет подходить для этих целей, так как Google Search – наш прямой конкурент.
Searchengines.ru: Управляемый людьми поиск – прекрасная идея, однако не боитесь ли вы спама, который будет осуществлен через него? Какие механизмы против спама вы используете?
Анджела: Как показывает опыт крупных wiki, если за ними стоит хорошее сообщество, верящее в конечные цели проекта, спамеров победить довольно легко. Для решения проблем спама мы применяем как автоматические методы, так и человеческие усилия. С поисковыми результатами, на которые влияют люди, я думаю, проблемы спама будут меньшими, чем это происходит с традиционными поисковиками.
Searchengines.ru: - Когда будут запущены русский, украинский и белорусский интерфейсы? Работаете ли вы в этом направлении?
Анджела: Мы надеемся запустить международные версии Wikia Search позже в этом году.
Поиск в интернете:Поисковый робот
Реклама, маркетинг, web-разработка.