Wikia Search: В нашей базе уже пол-миллиарда url

февраля 16, 08 Автор admin

C возвращением!
Мне важно ваше мнение: оставьте комментарий

Выдержки из интервью с техдиректором Wikia Search Джереми Миллером и сооснователем Wikia.com Анджелой Бизли.

Полностью интервью читайте на Searchengines.ru

Searchengines.ru: - Wikipedia является одним из самых популярных сайтов в сети Интернет, как и почему появилась идея открыть свой поисковик? Не слишком ли это большой риск – выходить на совершенно новый рынок?

Анджела: Не смотря на то, что и Wikipedia, и Wikia были основаны Джимми Уейлзом, - это совершенно независимые компании. Организация, которая занимается развитием Wikipedia никак не участвует в развитии Wikia Search .
Wikia – полностью коммерческая организация, занимающаяся wiki. Кроме развития поисковика Wikia Search, она является хостером более 4000 wiki-сайтов по любым темам, интересным пользователям. Эти темы варьируют от политических до игровых. К примеру, вот ряд русскоязычных wiki, которые размещены у нас.
Более 1000 статей:

  • http://ru.science.wikia.com/
  • http://absurdopedia.wikia.com/
  • http://ru.math.wikia.com/
  • http://ru.writers.wikia.com/
  • http://ru.starwars.wikia.com
  • http://ru.history.wikia.com/

От 100 до 500 статей:

  • http://ru.wilderness.wikia.com
  • http://ru.lgbt.wikia.com/
  • http://chronology.wikia.com/
  • http://ru.rpg.wikia.com/
  • http://ru.harrypotter.wikia.com/
  • http://ru.smalltalk.wikia.com/
  • http://anticopyright.wikia.com/
  • http://ru.costume.wikia.com/

От 50 до 100 статей:

  • http://ru.lanos.wikia.com/
  • http://ru.althistory.wikia.com
  • http://transhumanism.wikia.com/
  • http://ru.google.wikia.com/
  • http://ru.archaeology.wikia.com/
  • http://ru.fallout.wikia.com/
  • http://ru.dnd.wikia.com/

Все эти wiki открыты к редактированию, каждый пользователь может создать свою , если не нашел интересующей его темы.

Searchengines.ru: Сколько документов уже проиндексировано Wikia Search?

Джереми Миллер: В нашей базе уже пол-миллиарда url, но в настоящий момент только 10-20% из них помещены в кэш.

Searchengines.ru: Какие технологии лежат в основе Wikia Search?

Джереми: В основе проекта лежат опен-сорс проекты Nutch (для поиска) и Foowi (для социальных сетей).

Searchengines.ru: Какие принципы ранжирования используются? Используется ли только человеческая оценка или комбинации с машинными алгоритмами?

Джереми: Основу составляет технология Nutch с OPIC с использованием метода мини-статей, который дает возможность моментального “человеческого” управления.
Анджела: Мы собираемся комбинировать оба подхода. Мы будем использовать созданные людьми оценки, кроме того, на результаты, полученные пользователем, будет влиять весь социальный граф. Результаты, увиденные пользователем, будут существенно зависеть от действий его друзей, с которыми он находится в общей социальной сети, которая является частью Wikia.

Searchengines.ru: Планируете ли вы создание чего-то наподобие Google AdSense?

Джереми: Многие составляющие проекта открыты и бесплатны, однако со временем в поисковых результатах Wikia.com определенно появится реклама, похожая на AdSense.
Анджела: Мы нацелены прежде всего на построение поиска Wikia и только после этого мы будем думать о монетизации! Скорее всего, мы будем использовать для этого рекламу, хотя Google AdSense вряд ли будет подходить для этих целей, так как Google Search – наш прямой конкурент.

Searchengines.ru: Управляемый людьми поиск – прекрасная идея, однако не боитесь ли вы спама, который будет осуществлен через него? Какие механизмы против спама вы используете?

Анджела: Как показывает опыт крупных wiki, если за ними стоит хорошее сообщество, верящее в конечные цели проекта, спамеров победить довольно легко. Для решения проблем спама мы применяем как автоматические методы, так и человеческие усилия. С поисковыми результатами, на которые влияют люди, я думаю, проблемы спама будут меньшими, чем это происходит с традиционными поисковиками.

Searchengines.ru: - Когда будут запущены русский, украинский и белорусский интерфейсы? Работаете ли вы в этом направлении?

Анджела: Мы надеемся запустить международные версии Wikia Search позже в этом году.

Поиск в интернете:Поисковый робот

Читателям также нравятся статьи:

Ещё один новый поисковик

января 10, 08 Автор admin

7 января запущена тестовая версия открытого поисковика Wikia Search.

Пока поисковик Wikia обладает базой из 50-100 миллионов проиндексированных интернет-страниц. По запросу "yandex" через буквально пары минут раздумий была показана пустая страница, что показывает его абсолютную сырость в плане выполнения своих прямых задач в настоящее время.Также интересно, что страницы поисковика явно оптимизированы под Firefox, при пользовании IE заметны явные ошибки.

Однако, судя по всему, у поисковика прекрасные перспективы. Во всяком случае, инвесторы верят в него. Около 14 миллионов долларов инвестиций компаний Amazon.com, Bessemer Venture Partners, а также: совладельца Netscape Communications Марка Андрисена, совладельца LinkedIn Рейда Хоффмана и основателя Lotus Development Митча Кэпора, и авторитет создателя сервиса, Джимми Уэльса, который также является автором Википедии, позволяет с энтузиазмом оценивать будущее проекта.

Самое интересное: Wikia Search должен стать поисковым сервисом, который будет более прозрачен, чем Google и другие поисковики, которые традиционно держат в секрете алгоритмы ранжирования результатов поиска. Все желающие программисты получат полный доступ к исходным кодам нового продукта, для того, чтобы они могли усовершенствовать его, использовать для своей работы и помочь авторам создать «дружественный, интересный и альтернативный продукт».

«Результатов Google от Wikia Search пока ожидать не приходится, но, если через год-два он будет обслуживать хотя бы 2-3 процента от общих поисковых запросов, это будет успех» - отметил Джимми Уэльс. Также традиционно планируется размещение рекламы на сервисе.

Wikia search. Alfa

Источник

Upd: «В нашей базе уже пол-миллиарда url»: Выдержки из интервью с техдиректором Wikia Search Джереми Миллером и сооснователем Wikia.com Анджелой Бизли. Полностью интервью - на Searchengines.ru

Читателям также нравятся статьи: