‘ Search engines ’ Архив категории

Яндекс поиск по блогам: как попасть в индекс

февраля 28, 08 Автор admin

C возвращением!
Мне важно ваше мнение: оставьте комментарий

О полезности пребывания в индексе поисковой системы номер один в РФ распространяться не буду, ибо нелепо. И о сложностях попадания в пресловутый индекс тоже говорить не буду, ибо грустно. Это в поисковик номер один в мире легко попасть, об этом даже задумываться не надо: сам придёт, сам все сделает, и в t кратчайшее ваш сайт будет присутствовать в индексе. А у нас далеко не мир, у нас - война, и вновь продолжается бой. С тенью. Вот и отчет о боевых действиях.

Итак, существующий блог запущен в ноябре 2007г. Поскольку дела на основной работе не позволяли уделять достаточно внимания сему детищу, он и до сих пор остается неизвестным Яндексу. Лишь месяц назад я озаботился тем, чтобы известная поисковая машина соизволила узнать о существовании такого блога, как этот. Для этого была посещена следующая страница и заполнены все поля , основными из которых являются адрес блога и RSS адрес (у меня он выглядит так: http://downshifter.in/Novorossiysk/feed/). Если Яндекс не испытывает сложностей с прочтением вашей RSS-ленты, на этом все и заканчивается.
По определению.
Ибо на практике всё оказывается далеко не так просто. В моем случае, например, было так: Яндекс упорно отказывался индексировать содержание блога. Заметил я это только вчера, для интереса вбив в ППБ несколько фраз из последних статей на блоге (в кавычках, разумеется). Что же - ответом было молчание. Яндекс не подозревал о том, что такая информация существует в блоговой природе.

Как же сия ситуация разрешилась? Очень просто. Есть такой сервис: feedburner.com Как правильно пользоваться сервисом, читаем у Дмитрия Донченко, повторяться не буду. Если кратко, то сервис делает следующее:

"Если вы все сделали правильно, этот плагин должен перехватывать обращения к вашей RSS ленте, по адресу http://вашблог.ком/?feed=rss2 и перенаправлять все запросы на ваш фид на сервисе FeedBurner"

Ну а в дополнение он натравит на вашу RSS-ленту все известные боты поисковых систем. Например, я уже в индексе ППБ :) Причем исключительно только благодаря FeedBurner'у.

Кстати, понаблюдать за таинством добавления блогов в индекс в режиме реального времени можно тут.

А тем временем у Артема Майнаса продолжается «Вечный русский эксперимент».

Рейтинг блогов, и это ещё не предел :)
UPD: предел на 7.03.2008.
UPD: предел на 8.03.2008.
UPD: предел на 12.03.2008.
UPD: предел на 14.03.2008.
UPD: предел на 19.03.2008
.

Читателям также нравятся статьи:

Wikia Search: В нашей базе уже пол-миллиарда url

февраля 16, 08 Автор admin

Выдержки из интервью с техдиректором Wikia Search Джереми Миллером и сооснователем Wikia.com Анджелой Бизли.

Полностью интервью читайте на Searchengines.ru

Searchengines.ru: - Wikipedia является одним из самых популярных сайтов в сети Интернет, как и почему появилась идея открыть свой поисковик? Не слишком ли это большой риск – выходить на совершенно новый рынок?

Анджела: Не смотря на то, что и Wikipedia, и Wikia были основаны Джимми Уейлзом, - это совершенно независимые компании. Организация, которая занимается развитием Wikipedia никак не участвует в развитии Wikia Search .
Wikia – полностью коммерческая организация, занимающаяся wiki. Кроме развития поисковика Wikia Search, она является хостером более 4000 wiki-сайтов по любым темам, интересным пользователям. Эти темы варьируют от политических до игровых. К примеру, вот ряд русскоязычных wiki, которые размещены у нас.
Более 1000 статей:

  • http://ru.science.wikia.com/
  • http://absurdopedia.wikia.com/
  • http://ru.math.wikia.com/
  • http://ru.writers.wikia.com/
  • http://ru.starwars.wikia.com
  • http://ru.history.wikia.com/

От 100 до 500 статей:

  • http://ru.wilderness.wikia.com
  • http://ru.lgbt.wikia.com/
  • http://chronology.wikia.com/
  • http://ru.rpg.wikia.com/
  • http://ru.harrypotter.wikia.com/
  • http://ru.smalltalk.wikia.com/
  • http://anticopyright.wikia.com/
  • http://ru.costume.wikia.com/

От 50 до 100 статей:

  • http://ru.lanos.wikia.com/
  • http://ru.althistory.wikia.com
  • http://transhumanism.wikia.com/
  • http://ru.google.wikia.com/
  • http://ru.archaeology.wikia.com/
  • http://ru.fallout.wikia.com/
  • http://ru.dnd.wikia.com/

Все эти wiki открыты к редактированию, каждый пользователь может создать свою , если не нашел интересующей его темы.

Searchengines.ru: Сколько документов уже проиндексировано Wikia Search?

Джереми Миллер: В нашей базе уже пол-миллиарда url, но в настоящий момент только 10-20% из них помещены в кэш.

Searchengines.ru: Какие технологии лежат в основе Wikia Search?

Джереми: В основе проекта лежат опен-сорс проекты Nutch (для поиска) и Foowi (для социальных сетей).

Searchengines.ru: Какие принципы ранжирования используются? Используется ли только человеческая оценка или комбинации с машинными алгоритмами?

Джереми: Основу составляет технология Nutch с OPIC с использованием метода мини-статей, который дает возможность моментального “человеческого” управления.
Анджела: Мы собираемся комбинировать оба подхода. Мы будем использовать созданные людьми оценки, кроме того, на результаты, полученные пользователем, будет влиять весь социальный граф. Результаты, увиденные пользователем, будут существенно зависеть от действий его друзей, с которыми он находится в общей социальной сети, которая является частью Wikia.

Searchengines.ru: Планируете ли вы создание чего-то наподобие Google AdSense?

Джереми: Многие составляющие проекта открыты и бесплатны, однако со временем в поисковых результатах Wikia.com определенно появится реклама, похожая на AdSense.
Анджела: Мы нацелены прежде всего на построение поиска Wikia и только после этого мы будем думать о монетизации! Скорее всего, мы будем использовать для этого рекламу, хотя Google AdSense вряд ли будет подходить для этих целей, так как Google Search – наш прямой конкурент.

Searchengines.ru: Управляемый людьми поиск – прекрасная идея, однако не боитесь ли вы спама, который будет осуществлен через него? Какие механизмы против спама вы используете?

Анджела: Как показывает опыт крупных wiki, если за ними стоит хорошее сообщество, верящее в конечные цели проекта, спамеров победить довольно легко. Для решения проблем спама мы применяем как автоматические методы, так и человеческие усилия. С поисковыми результатами, на которые влияют люди, я думаю, проблемы спама будут меньшими, чем это происходит с традиционными поисковиками.

Searchengines.ru: - Когда будут запущены русский, украинский и белорусский интерфейсы? Работаете ли вы в этом направлении?

Анджела: Мы надеемся запустить международные версии Wikia Search позже в этом году.

Поиск в интернете:Поисковый робот

Читателям также нравятся статьи:

Ещё один новый поисковик

января 10, 08 Автор admin

7 января запущена тестовая версия открытого поисковика Wikia Search.

Пока поисковик Wikia обладает базой из 50-100 миллионов проиндексированных интернет-страниц. По запросу "yandex" через буквально пары минут раздумий была показана пустая страница, что показывает его абсолютную сырость в плане выполнения своих прямых задач в настоящее время.Также интересно, что страницы поисковика явно оптимизированы под Firefox, при пользовании IE заметны явные ошибки.

Однако, судя по всему, у поисковика прекрасные перспективы. Во всяком случае, инвесторы верят в него. Около 14 миллионов долларов инвестиций компаний Amazon.com, Bessemer Venture Partners, а также: совладельца Netscape Communications Марка Андрисена, совладельца LinkedIn Рейда Хоффмана и основателя Lotus Development Митча Кэпора, и авторитет создателя сервиса, Джимми Уэльса, который также является автором Википедии, позволяет с энтузиазмом оценивать будущее проекта.

Самое интересное: Wikia Search должен стать поисковым сервисом, который будет более прозрачен, чем Google и другие поисковики, которые традиционно держат в секрете алгоритмы ранжирования результатов поиска. Все желающие программисты получат полный доступ к исходным кодам нового продукта, для того, чтобы они могли усовершенствовать его, использовать для своей работы и помочь авторам создать «дружественный, интересный и альтернативный продукт».

«Результатов Google от Wikia Search пока ожидать не приходится, но, если через год-два он будет обслуживать хотя бы 2-3 процента от общих поисковых запросов, это будет успех» - отметил Джимми Уэльс. Также традиционно планируется размещение рекламы на сервисе.

Wikia search. Alfa

Источник

Upd: «В нашей базе уже пол-миллиарда url»: Выдержки из интервью с техдиректором Wikia Search Джереми Миллером и сооснователем Wikia.com Анджелой Бизли. Полностью интервью - на Searchengines.ru

Читателям также нравятся статьи: