58 подписчиков

В рамках данного курса слушатели смогут познакомиться со всем спектром моделей, применяющихся в информационном поиске, а также оценить достоинства и недостатки различных методов. Наиболее подробно будут рассмотрены статистические лингвистические модели. По результатам данного курса слушатели смогут научиться выбирать модели, адекватные различным задачам, и применять эти знания на практике.

В теории информационного поиска нет одной доминирующей модели, в отличие, например от теории баз данных, где господствует реляционная модель. Для информационного поиска характерно использование различных моделей, наиболее подходящих для конкретной задачи. Например, при наличии хорошей весовой функции векторная модель подходит для задач поиска близких объектов и обратной связи по релевантности, вероятностные модели и наивный Байесовский подход помогают в случаях, когда есть размеченная коллекция релевантных/нерелевантных документов, PageRank моделирует статические отношения между документами, блочные модели используются при поиске по структурированным документам, а языковые модели применяются для оценки языковой схожести и текстовой релевантности документов.