Блог. Создать и раскрутить Ющук Евгений

На момент написания книги Гугл учитывал в запросе 32 слова, а все последующие слова игнорировал. Это хорошо видно, если ввести запрос, содержащий числительные подряд. Например, числа с 1 до 35. В результатах как релевантные отображаются только первые 32 слова запроса: [+1 +2 +3 +4 +5 +6 +7 +8 +9 +10 +11 +12 +13 +14 +15 +16 +17 +18 +19 +20 +21 +22 +23 +24 +25 +26 +27 +28 +29 +30 +31 +32 +33 +34 +35].

Результат поиска: 1–10 из примерно 381 000 000 для +1 +2 +3 +4 +5 +6 +7 +8 +9 +10 +11 +12 +13 +14 +15 +16 +17 +18 +19 +20 +21 +22 +23 +24 +25 +26 +27 +28 +29 +30 +31 +32 +33 +34 +35. В выдаче: Тематический рубрикатор.

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52… www.amr.ru/topics/index.php?PAGEN_2=8 – 72k -.

В кэше подчеркнуты только 32 слова, и в тексте они также присутствуют.

Стемминг (а также wildcard). Стемминг – возможность усечения слова до его корня. После этого усечения производится поиск релевантных вариантов слов, производных от него. Другими словами, стемминг позволяет искать все однокоренные слова. Техника поиска по маске (wildcard) представляет собой написание базового слова (или его части), после которых идет символ маски – «звездочка» (*), заменяющая собой любое возможное продолжение слова. Таким образом, если поисковая машина поддерживает поиск по маске, то ищутся все слова, которые одинаково начинаются. Эта техника особенно удобна, когда вам неизвестно точное написание конкретного слова либо когда вы хотите включить все возможные варианты слова в свой поиск.

Например, когда по запросу [тарт*] получают как «тарталетку», так и «тартар». Так вот, Гугл эти технологии не поддерживает (как и Яндекс). Зато он поддерживает вариант, когда вместо целого слова вводится звездочка.

Например, по запросу [красная * площадь] будет выдано: «Красная, Манежная площади», с подчеркиванием всех этих слов. В какой-то степени это похоже на поиск с расстоянием между словами, применяемый в Яндексе.

По запросу [красная * * площадь] будет выдано: «Рамблер-Фото > fanphoto > Красная и Манежная площади, Коломенское; Красная и Манежная площади; Воробьевы горы Кошки Цветы Зоопарк 2007 Еще метро Метро Поклонная гора Зоопарк 2006 ВДНХ Царицыно… foto.rambler.ru/users/fanphoto/11/ – 35k –».

По запросу [красная *** площадь] будет выдано: «Афиша: Новосибирск / Места / Магазины / Обувь Любым, Гагаринская, Заельцовская, Красный проспект, Маршала Покрышкина, Площадь Гарина-Михайловского, Площадь Ленина, Площадь Маркса, Речной вокзал… novosibirsk.afisha.ru/places/catalogue/?id=969066 – 31k».

Дополнительные операторы.

1. Оператор cache: – поисковая машина хранит версию текста, которая проиндексирована поисковым пауком, в специальном хранилище в формате, называемом кэшем. Кэшированную версию страницы можно извлечь, если оригинальная недоступна (например, не работает сервер, на котором она хранится). Кэшированная страница показывается в том виде, в котором она хранится в базе данных поисковой машины, и при показе пользователю сопровождается надписью наверху о том, что это страница из кэша. Там же содержится информация о времени создания кэшированной версии. На странице из кэша ключевые слова запроса для удобства пользователя подсвечены, причем каждое из них своим цветом.

Например: «Это сохраненная в кэше Google копия страницы http://ci-razvedka.com/, записанная 20 май 2007 20:10:24 GMT».

Сохраненные в кэше Гугла страницы показываются в том виде, в каком они находились в момент добавления в нашу базу. Можно создать запрос, который сразу будет выдавать кэшированную версию страницы с определенным адресом. Например, запрос [cache:www.ci-razvedka.ru] будет сразу выдавать версию страницы www.ci-razvedka.ru из кэша, а не проверять ее нынешнее состояние.

ВНИМАНИЕ! Пробела между оператором cashe: и URL’ом запрашиваемой страницы быть не должно.

Если вы хотите, чтобы ключевые слова на кэшированной версии страницы были подчеркнуты, их надо через пробел указать после оператора cashe: и адреса страницы. Например: [cache:www.ci-razvedka.ru книга]

2. Оператор info: позволяет увидеть информацию, которая известна Гуглу о данной странице. Например, запрос [info:www.ru-ci.ru] дает следующий результат: Ющук Евгений Леонидович. Конкурентная разведка и Информационная…

Публикации по теме негативных пиар-технологий. Сайт Невидимый Интернет. Материалы по теме информационной войны, размещаемые на этом сайте… ru-ci.ru/». Гугл может показать следующую информацию об этом адресе:

сохраненную в Google версию www.ru-ci.ru;

страницы, похожие на www.ru-ci.ru;

страницы, ссылающиеся на www.ru-ci.ru;

страницы на сайте www.ru-ci.ru;

страницы, упоминающие ссылку www.ru-ci.ru.

Важно, что запрос без «www», например, [info:ru-ci.ru], даст другие результаты – прежде всего потому, что в тексте полученных по такому запросу ссылок, которые ведут на этот сайт, адрес прописан без «www».

ВНИМАНИЕ! Пробела между оператором info: и URL’ом запрашиваемой страницы быть не должно.

3. Оператор site: ограничивает поиск конкретным доменом. То есть если сделать запрос [маркетинг разведка site:ci-razvedka.ru], то результаты будут получены со страниц, содержащих слова «маркетинг» и «разведка» именно в домене «ci-razvedka.ru», а не в других частях Интернета.

Результат поиска: 1–10 из приблизительно 81 из домена ci-razvedka.ru для маркетинг разведка.

Если сделать запрос [scip site:ru] то будут получены документы, содержащие слово «scip» и расположенные в доменной зоне «.ru».

ВНИМАНИЕ! пробела между оператором site: и URL ’ом запрашиваемой страницы быть не должно.

4. Оператор link: позволяет увидеть все страницы, ссылающиеся на страницу, по которой сделан запрос. Например, по запросу [link: www.livejournal.com/community/kubok/45852.html] будут получены известные Гуглу ссылки на статью о поиске через Яндекс, написанную liveuser.

ВНИМАНИЕ! Пробела между оператором link: и URL’ом запрашиваемой страницы быть не должно.

5. Оператор allinh2: (переводится как «все – в заголовке»). Если начать запрос с этого оператора, то Гугл выдаст тексты, в которых все слова запроса содержатся в заголовках (внутри тега Title в HTML). Например, запрос [allinh2: википедия яндекс] даст результаты, где слова «википедия» и «яндекс» содержится внутри тега Title на просмотренных поисковой машиной страницах.

Результат поиска (на момент написания книги): 1–5 из 5 для allinh2: википедия яндекс.

6. Оператор inh2: показывает страницы, в заголовке кoтopыx содержится только то слово, которое стоит непосредственно после оператора inh2: Все остальные слова запроса могут быть в любом месте текста. Если поставить оператор inh2: перед каждым словом запроса, это будет эквивалентно использованию оператора allinh2:

ПРИМЕР

Запрос: [inh2:википедия яндекс]

Результат поиска (на момент написания книги): 1–10 из примерно 21 300 для inh2:википедия яндекс.

ВНИМАНИЕ! Пробела между оператором inh2: и последующим словом быть не должно.

7. Оператор allinur: – если запрос начинается с оператора allinurl:, то поиск ограничен теми документами, в которых все слова запроса содержатся только в адресе страницы, т. е. в URL.

ПРИМЕР

Запрос: [allinurl: narod razvedka]

Результат поиска: 1–10 примерно из 79 для allinurl : narod razvedka

ВНИМАНИЕ! Оператор allinurl: работает только со словами, но не со служебными фрагментами URL. Такие специальные символы, как слэш или точка, не окажут положительного влияния на результат. Зато они окажут отрицательное влияние, так как могут быть восприняты Гуглом как попытка ввести в запрос точную фразу. Например, запрос [allinurl: narod.razvedka], равно как и [allinurl : narod/razvedka] результата не дал вообще.

8. Оператор inurl : – слово, которое расположено непосредственно слитно с оператором inurl :, будет найдено только в адресе страницы Интернета, а остальные слова – в любом месте такой страницы. Например, для того, чтобы найти слово «разведка» на сайтах, содержащих в адресе сочетание букв «tc», можно сделать такой запрос: [inurl :tc razvedka]. Результат поиска (на момент написания книги): 1–1 из 1 для inurl :tc razvedka. Кроме того, Гугл выдал текст: «Otryady-5Razvedka okazalas’ neskol’ko utomitel’noi (obratno shli V lavirovku). Poetomu kpirsu my podoshli sovershenno izmuchennye: no ne stol’ko samoi razvedkoi… www-lat.rusf.ru/tc/tc08/08otr5.htm». Если оператор inurl: поставить перед каждым словом запроса, это будет эквивалентно использованию оператора allinurl :

ВНИМАНИЕ! Пробела между оператором inurl: и последующим словом быть не должно. Оператор inurl : работает только со словами, но не со служебными фрагментами URL Такие специальные символы как слэш или точка, не окажут положительного влияния на результат. Более того, они могут быть восприняты Гуглом как попытка ввести в запрос точную фразу. Например, запрос [inurl :tc/razvedka], равно как и [inurl :tc.razvedka] результата не дал вообще. Результат мог бы быть, если бы в адресе какой-то страницы содержалась точная фраза «tc/razvedka» или «tc.razvedka». В этом можно убедиться.

ПРИМЕР

Запрос 1: [inurl:kubok]

Результат поиска: 1 – 10 из примерно 50 400 для inurl :kubok. И этот

результат начинается с текста: «Кубок по поиску. Recent Entries. Recent

Entries; Archive · Friends · User Info · Открытый Кубок России по поиску

в Интернете… community.livejournal.com/kubok – 39k – ».

Запрос 2: [inurl:kubok/45852]

Результат поиска: 1–1 из 1 для inurl:kubok/45852.

И этот результат начинается с текста: «kubok: Хозяйке на заметку. Поиск через Яндекс для специалистов. Хозяйке на заметку. Поиск через Яндекс для специалистов. Последнее обновление – 18 апреля 2007 г. С тех пор многое могло измениться… www.livejournal.com/community/kubok/45852.html – 124k -».

9. Оператор related: описывает страницы, которые «похожи» на какую-то конкретную страницу.

ПРИМЕР

Запрос: [related:it2b.ru]

Результат поиска: 1–10 приблизительно из 30 подобных it2b.ru.

Мы не считаем, что все страницы действительно подобны странице сайта it2b.ru с точки зрения человека, а не робота. Большинство страниц в результатах по запросу действительно посвящены тематике безопасности бизнеса или конкурентной разведки.

ВНИМАНИЕ! Пробела между оператором related: и последующим словом быть не должно.

10. Оператор define: выполняет роль своего рода толкового словаря, позволяющего быстро получить определение того слова, которое введено после оператора.

ПРИМЕР

Запрос: [define: разведка]

Результат поиска: разведка – опрделения в Интернете: совокупность мер для сбора данных о действительном или возможном противнике. www.examen.ru/db/Examine/catdoc_id/50EFFB02B0ADF8B2C3256A3A003D797D/rootid/9327995FB7A6D40FC3256A02002CE0D5/defacto.html

Интересной особенностью оператора define: является его способность искать определения фразам. В качестве фразы он понимает все слова, написанные после оператора, в том числе и написанные без кавычек, просто через пробел.

ПРИМЕР

Запрос: [define: большой взрыв]

Результат поиска: большой взрыв – определения в Интернете: Большой Взрыв – взрывной процесс в котором, по данным современной науки, наша Вселенная родилась из так называемой космологической сингулярности (ru.wikipedia.org/wiki/Большой_Взрыв).

Правда, иногда define: может и повеселить либо дать материал для проведения КВН с вопросами, на которые мало кто ответит. В принципе он в состоянии составить конкуренцию анекдотам, с его помощью хорошо начать вести каталог «приколов» на блоге. Это может привлечь туда людей, любящих посмеяться. Например, по запросу [define:ложка] получите такой результат: «ложка – определения в Интернете: блесна, основанная на подражании раненой рыбке (http://fisherman.com.ua/files/fishsay.php)». А по запросу [define:осел] результат будет следующим: «Похожие фразы: буриданов осел. Осел – определения в Интернете: строгий, собранный в кучу, материал (astro.rin.ru/htmls/nostradamus/astro1826-5.html)». А вот, что вы получите по запросу [define:карлсон] : «Похожие фразы: честер карлсон карлсон, честер. Карлсон – определения в Интернете: вентилятор для процессора (netlander.org/culture/humor/dictionary)».

Если сделать запрос [define:ламер], то Гугл даст множество вариантов: «Похожие фразы: ламер вонючий; ламер – определения в Интернете:

ламер (от англ. lamer) — жаргонное или сленговое прозвище человека, полностью некомпетентентного в той или иной области, но твердо уверенного в обратном (ru.wikipedia.org/wiki/);

ламер: юзер, регулярно наступающий на грабли, но по-прежнему уверенный что граблей не существует (humour.sysadminday.com.ru/read.phtml);

человек, который плохо разбирается в компьютерах, начинающий пользователь (pc-terms.com.ru/ru3.html);

человек, который думает, что все знает; при этом ламеры очень ярко пытаются это продемонстрировать, принося тем самым

некоторые неудобства окружающим – смотрите эпиграф к слову Dial-up… (zcom.skyfamily.ru/st21.htm);

начинающий юзер, лажбек (www.streetlife.ru/dic/);

«чайник», мнящий себя крутым (compuhumour.narod.ru/scien ce/ jargon.html);

неумелый игрок (www.csfight.net/slovar.php);

полный идиот, не желающий ничему учиться, тупица. Не путать с начинающим пользователем, «чайником». Легко узнать по частому использованию сленга (27194.pbnet.ru/base/view/news/1097887076/9252/full);

начинающий нетлэндер (netlander.org/culture/humor/dictionary); чайник, возомнивший себя хакером, кул зизопом или еще бог знает кем (www.ekzotika.com/pub22);

законченный кретин, убежденный чайник (novo.kuban.ru/ dictionary.htm); презрительное – человек, который делает вид, что что-то понимает в каком-либо предмете (обычно в компьютерах/программах), на самом деле ничего не понимая (kag.sc.ru/teoria/slovar_virtualnogo_pilota.html)».

ВНИМАНИЕ! Наличие или отсутствие пробела между оператором define: и последующим словом на результате не сказывается.

11. Поиск синонимов. В хэлпе Гугла сказано, что если вы хотите найти тексты, содержащие не только ваши ключевые слова, но и их синонимы, то можно воспользоваться оператором «~».

Нам не удалось найти подтверждения этому утверждению. Так, мы сравнили два запроса и не нашли разницы.

ПРИМЕР

Запрос 1: [~опережающий ~разведка]

Результат поиска: 1-10 примерно из 43 600 для ~опережающий ~разведка.

Запрос 2: [опережающий разведка]

Результат поиска: 1-10 примерно из 43 600 для опережающий разведка.

12. Поиск числовых значений – для тех, кому приходится работать с цифрами, Гугл дал возможность искать диапазоны между числами. Для того чтобы найти все страницы, содержащие числа в неком диапазоне от… до, надо между этими крайними значениями поставить две точки.

ПРИМЕР

Запрос 1: [численность населения 1913…1917]

Результат поиска: Народная энциклопедия городов и регионов России. Города. Санкт… Подчиненные поселки городского типа, численность населения на 1.01.2000… Вскоре после начала Первой мировой войны актом от 18 (31) августа 1914 г… rfdata.al.ru/auto/city/18/667.HTM (с выделенным числом «1914»);

а также:

Известия Уральского государственного университета № 9 (1998… За 192 года своего существования с 1723 по 1915 гг. численность населения города увеличилась в 28 раз, достигнув 112 тыс. чел. Следует отметить, что город… proceedings.usu.ru/…/0009(03_05-1998)&xsln=showArticle. xslt&id=a14&doc=../content.jsp (с выделенным числом «1915»).

Подобный пример приведен в хэлпе Гугла на примере цены DVD: [DVD player $50..$100].

13. Кнопка «Мне повезет» (в английском варианте I’m Feeling Lucky) расположена на главной странице Гугла. На наш взгляд, это замечательная идея. По этой кнопке Гугл выдает наиболее релевантный с его точки зрения, результат. Обычно это помогает при быстром поиске какой-то фактической информации, когда не требуется подробного изучения вопроса. После нажатия кнопки «Мне повезет» вы попадаете непосредственно на сайт, который Гугл предлагает в качестве искомого. Например, запрос по кнопке «Мне повезет» [издательство вершина] открывает непосредственно сайт издательства «Вершина»: www.vershinabooks.ru

Поиск в Рамблере

Операторы Рамблера в данном разделе будут рассматриваться в сравнении с операторами Яндекса и Гугла, и на тех из них, что имеют аналоги в двух других поисковых машинах, мы не станем останавливаться слишком подробно. Основные подробности данного раздела касаются именно отличий Рамблера от Яндекса и Гугла.

Еще год назад мы говорили, что Рамблер, на наш взгляд, является третьей по значимости поисковой машиной для работы с русскоязычными текстами. Причем это третье место находилось на очень значительном расстоянии от первых двух. Мы отмечали, что нечасто обращаемся к Рамблеру, поскольку, в зависимости от задачи, обычно начинаем поиск с Яндекса, а затем идем в Гугл, или наоборот – начинаем с Гугла, а затем уточняем результат в Яндексе. На тот момент в большинсте случаев этого было достаточно при работе с каким-то фактическим материалом, когда требовалась не полнота ответа, а правильность.

Сегодня ситуация изменилась. Рамблер, по нашему мнению, ощутимо улучшил свою работу как поисковая машина, а также ввел очень интересный инструмент: стал показывать документы, проиндексированные недавно, т. е. в течение последних нескольких часов. Чтобы воспользоваться этой функцией, надо после получения страницы с результатами поиска по запросу нажать на гиперссылку с данными о найденных страницах, расположенную под поисковой строкой. Она выглядит как число после слова «новых». Вот пример по запросу Спелеолог (число «23» – это гиперссылка, перейдя по которой можно увидеть недавно проиндексированные документы): «Вы искали: Ющук Евгений Леонидович, найдено сайтов: 158, документов: 4436, новых: 23».

Важной особенностью Рамблера является то, что он показывает дату последнего обновления страницы результатов. Например, так: «Обновлено: 26.05.2007 11:25 мск».

Один из ведущих специалистов по автоматизированному поиску информации для целей конкурентной разведки в Интернете Андрей Масалович вообще считает, что наличие перечня последних найденных документов и информации о времени обновления базы – серьезное преимущество, благодаря которому многие специалисты все чаще выбирают Рамблер в качестве поисковика, с которого надо начинать работу по поиску в Интернете (сайт Андрея Масаловича www.tora-centre.ru/).

Кроме того, все, кому приходится заниматься поиском в Интернете профессионально, сходятся во мнении, что только использование нескольких поисковых машин может дать результат, претендующий на полноту ответа на вопрос – одна поисковая машина справиться с подобной задачей не способна. Связано такое положение вещей с тем, что, во-первых, поисковые роботы физически не успевают угнаться за стремительно растущим Интернетом, а во-вторых, с тем, что у разных поисковых машин разные алгоритмы обработки собранной информации, а значит, и разные результаты этой обработки. Наш опыт подтверждает правильность таких выводов.

В результате нет и не может быть полного совпадения результатов поиска в разных поисковых машинах, особенно когда речь идет о редком запросе.

ПРИМЕР

Поиск во всех трех системах точной фразы (фрагмента песни) «Дым, дым в твоих глазах» дал на момент написания статьи такие результаты.

Запрос: [“дым, дым в твоих глазах”]

Результат поиска.

Яндекс: страниц – 0.

Гугл: не найдено ни одного документа, соответствующего запросу “дым, дым в твоих глазах”.

Рамблер: Вы искали: “дым, дым в твоих глазах”, найдено сайтов: 1, документов: 1.

Результат этого поиска можно увидеть здесь: www.ci-razvedka.narod.ru/Rambler_Cash_Examples_Folder/Dym_Dym_v_Glazakh.html

Это не значит, что Рамблер лучше всех. Это значит, что нельзя заранее знать, в какой поисковой системе и что именно удастся найти. В этом смысле показателен пример с поиском фразы, также фрагмента редкой песни: «Аэропорт аэропорт ночное зарево огней».

ПРИМЕР

Запрос: [“аэропорт аэропорт ночное зарево огней”]

Результат.

Яндекс: страниц – 133, сайтов – не менее 4 http://ci-razvedka.narod.ru/Rambler_Cash_Examples_Folder/Aeroport_Yandex.html

Гугл: 1 – 6 из примерно 32 для “аэропорт аэропорт ночное зарево огней”.

http://ci-razvedka.narod.ru/Rambler_Cash_Examples_Folder/Aeroport_Google.html

Рамблер: не найдено ни одного документа, полностью соответствующего запросу “аэропорт аэропорт ночное зарево огней”. http://ci-razvedka.narod.ru/Rambler_Cash_Examples_Folder/Aeroport_Rambler.html

Итак, перейдем к рассмотрению работы с Рамблером. Основой для этого раздела послужили раздел «Помощь» Рамблера (www.rambler.ru/doc/help.shtml) и форма расширенного поиска (www.rambler.ru/cgi-bin/advanced.cgi?set=www).

Ресурсы, которые Рамблер индексирует. По утверждению самого Рамблера, он индексирует сайты, размещенные в следующих доменах первого уровня:

Российская Федерация: .ru, .su;

Украина: .ua;

Белоруссия: .by

Казахстан: .kz;

Киргизия: .kg;

Узбекистан: .uz;

Грузия: .ge.

Сайты, находящиеся в других доменах, Рамблер, как он сам утверждает, игнорирует.

Для тех, кто хочет, чтобы сайт, расположенный в другой доменной зоне, был проиндексирован Рамблером, этот поисковик оставляет небольшую надежду на успех.

Если Ваш сайт находится вне названных доменов (например, в зонах .com, .org, .net), но существенная часть сайта содержит русскоязычные материалы или, по Вашему мнению, он может представлять интерес для русскоязычной аудитории Рамблера, Вы можете отослать письмо на адрес [email protected] с просьбой включить Ваш сайт в число сканируемых, либо заполнить форму обратной связи. Наши сотрудники рассмотрят эту просьбу и примут решение о целесообразности такого включения[25].

Кроме того, Рамблер утверждает, что умеет извлекать гиперссылки из объектов Macromedia Flash, но не индексирует непосредственно сами тексты flash-объектов. Для таких технически продвинутых сайтов специалисты Рамблера советуют создавать HTML-копию.

Поддержка морфологии слов. Рамблер поддерживает морфологию слов по умолчанию. Отключение поддержки морфологии предусмотрено, но требует использования специального оператора – слово должно быть взято в кавычки. Мы сейчас не будем останавливаться на всех особенностях использования кавычек, а поговорим о них ниже. Наш эксперимент подтвердил, что Рамблер морфологию слов действительно поддерживает.

Скобки. Как и Яндекс, Рамблер позволяет использовать скобки для группировки слов и применения ко всем словам, расположенным в скобках, одного оператора, который пишется перед скобкой. Этим он ничем не отличается от Яндекса, поэтому подробнее мы применение скобок рассматривать не будем.

Транслитерация. Люди довольно часто делают опечатки при вводе текста и вместо русских букв печатают их английских «близнецов». Например, часто так происходит с буквой «с». Рамблер говорит, что старается исправлять такие опечатки, но не гарантирует результата. Эксперимент показал, что Рамблер действительно справляется с опечатками транслитерации, если их количество в слове невелико. Приведу часть результатов.

ПРИМЕР

Запрос 1 (все буквы русские): [“глОКлАя кУздРА”]

Результат поиска.

Вы искали: “глОКлАя кУздРА”, найдено сайтов: 9, документов: 37.

Запрос 2 (заглавные буквы – латинские): [“глOKлAя кYздPA”]

Результат поиска.

Не найдено ни одного документа, полностью соответствующего запросу

“”глOKлAя кYздPA””.

Запрос 3 (заглавные буквы – латинские): [“глOклая куздPа”]

Результат поиска.

Вы искали: “глOклая куздPа”, найдено сайтов: 9, документов: 37.

Чтобы не загружать читателя лишними примерами, скажем лишь, что при трехопечатках правильный поиск еще проводился, но после появления четвертой неправильно написанной буквы результат поиска стал нулевым. Рамблер в этом случае просто порекомендовал пользователям внимательнее относиться к вводу текста.

Регистр букв. Как правило, Рамблер не учитывает регистр, причем распространяет это правило не только на слова запроса, но и на операторы.

Действительно, запросы «глоклая куздра» и «ГлоКЛаЯ КУздРа» дали одинаковые результаты.

ПРИМЕР

Запрос 1: [“глоклая куздра”]

Результат поиска.

Вы искали: “глоклая куздра”, найдено сайтов: 12, документов: 44.

Запрос 2: [“ГлоКЛаЯ КУздРа”]

Результат поиска.

Вы искали: “ГлоКЛаЯ КУздРа”, найдено сайтов: 12, документов: 44.

Однако Рамблер сообщает, что он делает исключение из этого правила, если в запросе два и более слова подряд написаны с заглавной буквы. По его утверждению, он старается искать эти слова также с заглавной буквы. Таким образом, Рамблер пытается помочь тем, кто ищет имена собственные или географические названия.

В нашем эксперименте это не подтвердилось. Результаты за про са – как с заглавной, так и с прописной буквы – оказались одинаковыми, и в выдаче присутствовали как релевантные слова, написанные в обоих регистрах.

Стоп-слова и оператор «кавычки». Подобно Яндексу, Рамблер при обработке запроса может проигнорировать стоп-слова. Он утверждает, что для принудительного включения стоп-слова (или какого-то другого) в выдачу, нужное слово надо заключить в кавычки.

Эксперимент расставил акценты иначе. Стоп-слова с кавычками и без кавычек попадают в выдачу одинаково, при условии, что кроме них в запросе есть еще не более одного слова. Если, помимо стоп-слова, в запросе присутствуют хотя бы два слова, то стоп-слово игнорируется – как с кавычками, так и без кавычек. Но его все-таки можно принудительно включить в запрос, если, подобно Гуглу и Яндексу, поставить перед словом знак «плюс».

ПРИМЕР

Поговорим с пингвином, найдено сайтов: 1044, документов: 49 453, новых: 19.

Поговорим “с” пингвином, найдено сайтов: 1044, документов: 49 453, новых: 19.

Поговорим +с пингвином, найдено сайтов: 471, документов: 2772, новых: 1.

Как мы уже говорили, кавычки могут выступать аналогично оператору «восклицательный знак» в Яндексе. Слово, указанное в запросе в кавычках, будет в результатах поиска только в той словоформе, в которой оно написано.

ПРИМЕР

Воспользуемся словом, написанным с ошибкой (в этом примере союз «с» написан слитно со словом «большим», чтобы количество документов в выдаче было невелико и было проще оценивать результат):

с большим уважением отношусь, найдено сайтов 87, документов: 313.

с большим уважением «отношусь», найдено сайтов 31, документов: 99.

В разделе «Помощь» Рамблера приведена еще одна особенность использования кавычек. Процитируем этот фрагмент раздела «Помощь».

Другой пример – использование кавычек с ужесточающим поиск оператором + (подробнее о нем можно прочесть в главе операторы).

Страницы: «« 12345678 »»

Читать бесплатно другие книги:

По Земле прокатилась загадочная эпидемия, в результате которой люди обрели сверхъестественные способ...
Азартный путешественник, посетивший Африку тогда, когда это было смертельно опасно, бесстрашный воин...
Ему, зачатому в мистическую ночь Белтайн, волхвы напророчили великую судьбу. Но далеко не всякому пр...
Если вы уже прочитали первую часть детективно-мистической дилогии Натальи Солнцевой, значит, безнаде...
Герой романа Сергей Горский становится обладателем старинного флорентийского медальона дивной красот...
Молодой удачливый бизнесмен, искусствовед Сергей Горский приезжает на выставку картин друга, известн...