Школа ИТМ «Интернет-разведка для руководителя»

Интернет как источник информации

Интернет является сегодня одним из основных источников поиска информации. Ее можно искать с помощь таких поисковых средств Интернета, как метапоиск, поисковые машины, каталоги, подборки ссылок. Самым распространенным является поиск с помощью поисковых машин, например, таких как Яндекс, Google. Особенность наполнения контента в Интернете состоит в том, что в нем находится много недостоверной и нерелевантной (не относящейся к делу, к смыслу поискового запроса) информации, она неструктурированна, а ее объем увеличивается большими темпами. Как следствие – сложность поиска нужной информации. Все, кто регулярно пользуются Интернетом с 2000 года, знают, насколько сложнее стало сейчас найти нужную информацию.

Механизмы поисковых машин

На взрывной рост информации создатели поисковых машин ответили модернизацией существующих и разработкой новых алгоритмов релевантного поиска. Сегодня современные поисковые машины упорядочивают ссылки полностью автоматически, используя комбинацию факторов, полученных на основе анализа текстов, ссылок, сходств и различий для документов и сайтов. На ранжирование оказывают влияние и факторы, связанные с подавлением «мусорных» документов, которые не отвечают на запрос пользователя, а только стремятся попасть наверх результатов поиска.  Кроме общеизвестных факторов, применяемых при поиске и описанных в научной литературе, поисковые машины используют для ранжирования уникальные алгоритмы, разработанные в результате многолетнего анализа и исследований. В алгоритмах поиска учитывается как социальная природа созданных веб-мастерами и авторами документов, так и психологические особенности поведения пользователей, работающих с поисковой системой, – как любителей, так и профессионалов. В арсенале алгоритмов поисковых машин –  морфологический и синтаксический анализ текстов и запросов, учет разнообразных статистических факторов.