<<
>>

Глава 3. Инструменты поиска

Инструменты поиска и обработки информации могут существовать как отдельно от источников (например, общедоступные по­исковые машины или специальные программы), так и внутри баз данных.

Встроенные инструменты позволяют работать только с содержимым базы, но зато результат этой работы отличается, как правило, высокой четкостью.

Инструменты линейного поиска

Значительная группа поисковых инструментов предназначена для линейного поиска информации, т.е. для обнаружения в текстах (а именно с текстами работают поисковые машины, даже если поиск идет по базе видеосюжетов или фотографий) фрагментов, аналогичных заданному.

К таким инструментам относятся прежде всего общедоступные поисковые машины.

Среди поисковиков наибольшей популярностью в рунете пользуются Яндекс, Google и Рамблер. Мировой лидер Google в среднем дает больше ссылок на запрос, так как у него шире охват индексируемых страниц, но у Яндекса в целом выше релевантность. Рамблер превосходит конкурентов по ценности как рейтинговая система, позволяющая осуществлять не только поиск информации, но и поиск источников с одновременной их оценкой — по тематике и степени их авторитетности, популярности.

Выбор поисковой машины — дело субъективное и определяется по результатам поиска опытным путем. При выборе следует внимательно изучить возможности расширенного поиска, который предлагают глобальные поисковые системы. Именно условия составления поискового запроса определяют степень «зашумленности» результата.

Составление запросов для систем линейного поиска

Работа с линейными поисковыми системами подразумевает определенные навыки в составлении запроса. Традиционные языки запросов подразумевают выбор ключевых слов, указание на их обязательное наличие или отсутствие в текстах, положение ключевых слов относительно структуры текста (например, в заголовке или в самом теле документа) и относительно друг друга (расстояние между словами, последовательность употребления, жесткость словосочетаний, нахождение внутри одного предложения, одного документа и пр.).

В профессиональных системах линейного, или универсального, поиска возможности дополнительных параметров значительно расширены. Например, в системе «Гарант» реализована уникальная технология поиска через «Энциклопедию ситуаций».

Пользователь формулирует запрос, используя привычные ему термины, система «переводит» запрос и в течение нескольких минут предоставляет ответ. В «Интег-руме» реализованы следующие уникальные возможности — поиск с опечатками или вариантами написания, поиск по фамилии, имени, отчеству, когда умная система находит в текстах все формы употребления фамилии, имени, отчества, которые могут соответствовать заданному, даже уменьшительные. Например, если вы ищете человека с фамилией Александров и инициалами А.Ю., то, задав эти параметры при поиске с включением нужной функции, получите документы, где упоминается Шурик Александров, Алексей Юрьевич Александров, Антон Александров, Александров Автандил Юлианович, А. Александров и т.д.

В материалах проекта «Гардарика» поисковикам рекомендуется составлять тезаурусы в зависимости от конкретных интересов и пополнять их постоянно, по мере выявления новых терминов в ходе работы. Более адекватной представляется структура тезауруса в виде семантических срезов, где для каждого основного термина отдельно строится таблица сопутствующих слов и слов шумовых (которые не должны встречаться в источнике). Это весьма актуально для журналистов, работающих по одной теме, но прежде всего этот совет относится к пользователям общедоступных поисковых систем. Профессиональные системы более специализированы и поэтому могут предложить пользователю готовые тезаурусы и типовые запросы.

<< | >>
Источник: Калмыков А. А., Коханова Л. А.. Интернет-журналистика . Первоисточник: М.: ЮНИТИ-ДАНА, 2005. — 383 с. — (Серия «Медиаобразование»).. 2005

Еще по теме Глава 3. Инструменты поиска:

  1. Глава IVОСОБЕННОСТИ ЕДИНСТВА РУССКОЙ КУЛЬТУРЫ( Предварительные замечания)
  2. Глава 3 Социальный капитал онлайнового нетворкинга
  3. Глава 4 Социальные продажи
  4. Поиск ответов и экспертов
  5. Глава 7 Социальный рекрутинг
  6. Глава 2. Мир платной информации
  7. Глава 3. Инструменты поиска
  8. ГЛАВА ДЕСЯТАЯ
  9. ГЛАВА 1. НАУКА: ПРЕДПОЛОЖЕНИЯ И ОПРОВЕРЖЕНИЯ[107]
  10. Глава 6 Модель поиска оптимальных санкций ЗА ПРЕСТУПЛЕНИЯ В УСЛОВИЯХ КОРРУПЦИИ
  11. Глава 15 Проблема излишней криминализации[462]
  12. Глава 5. Государство и рынок: специфика российской диалектики развития
  13. Глава 9. Magnum ignotum1 частной собственности в проекции общего вектора прогресса российского общества
  14. Глава 1. Люди
  15. Глава 6. Предприниматели и лидерство
  16. Глава 4. Польская тематика в литературе 1880-х–1890-х годов
  17. ПОЛИТИЧЕСКАЯ БОРЬБА И ПОИСКИ ПУТЕЙ К ОБЪЕДИНЕНИЮ КИТАЯ