Ученые создали алгоритм для прорыва «информационного пузыря». Вернет ли он пользователям интернета свободу от пропаганды и манипуляций?
На июльской конференции по роевому интеллекту в Шэньчжэне (Китай) группа инженеров из Института математических наук Куранта Нью-Йоркского университета презентовала алгоритм Pyrorank, цель которого, ни много ни мало, совершить революцию в системе поиска информации. Он позволяет вывести пользователей из бесконечного цикла повторяющихся рекомендаций, снизить влияние их профилей на поисковую систему и при этом сохранить важные и разнообразные результаты. Алгоритм работает на основе функции Add-on, которая добавляет новый актуальный контент в систему рекомендаций, что делает выдачу более нейтральной и диверсифицированной. Разработчики протестировали его на трех датасетах — MovieLens, Good Books и Goodreads — и пришли к выводу, что в сравнении с уже известными кодами Pyrorank генерирует более разноплановые предложения, не связанные с прошлыми следами пользователей во Всемирной сети.
О негативном эффекте персонализации инфопотока говорится давно, впервые эту проблему описал в 2011 году американский активист и бизнесмен Илай Парайзер в книге «Пузырь фильтров: что скрывает от вас интернет». Он указывал, что алгоритмы незаметно запирают каждого из нас в «информационном пузыре» и создают иллюзию, что наши интересы и есть все, что происходит в окружающем мире. На один и тот же запрос разные пользователи получают разные результаты, в подборе которых учитываются данные из их соцсетей и прошлых заходов на интернет-страницы. Таким образом, «хвост» здесь крутит «собакой» (то есть алгоритм — контентом). Мы не контролируем, какую информацию получать, — подборку делают хитро настроенные коды. С этой маркетинговой выдачей, собственно, и боролись создатели Pyrorank.
«Традиционный способ работы рекомендательных систем заключается в том, что рекомендации основываются на понятии сходства, — объясняет Анасс Бари, руководитель лаборатории прогнозной аналитики и искусственного интеллекта Института математических наук Куранта и один из разработчиков алгоритма. — Это означает, что вы увидите похожие товары в списках рекомендуемых, основанных либо на похожих на вас пользователях, либо на похожих товарах, которые вы купили».
Pyrorank, считает Анасс Бари, способен преодолеть проклятие «пузырей фильтров». В СМИ о нем уже пишут как о сенсации в мире IT. Начались разговоры о том, что маленькие компании и независимые медиа получают шансы конкурировать с «акулами бизнеса» без огромных вливаний в таргет и контекст, а также о новой степени свободы в интернете. Однако в научных кругах считают, что это, скорее, попытки выдать желаемое за действительное.
«Предлагаемый алгоритм, по терминологии авторов статьи, “выжигает” из выдачи рекомендаций объекты, с которыми пользователь уже взаимодействовал, а исключенные объекты замещаются иными, максимально подходящими по описанию или тегам. То есть это ранжирование поверх ранжирования, — пояснил в комментарии “Эксперту” замдиректора Института проблем передачи информации им. А. А. Харкевича РАН Кирилл Иванов. — Авторы работы явно указывают: алгоритм увеличивает не только разнообразие выдачи, но и вероятность попадания в выдачу результатов, которые совсем не соответствуют интересам пользователя. Если переносить это на работу поисковых систем, можно говорить, что фактически из выдачи выключается все, что попадает на первые три-пять страниц результатов поиска, — это искусственно поднятые проплаченные ссылки, а также те, которые поисковая система считает наиболее релевантными для пользователя схожего профиля, и выдаются результаты, все еще релевантные запросу, а также менее релевантные, но разнообразные».
Сомнение вызывает также возможность взаимодействия нового кода с популярными поисковиками. Pyrorank тестировали на тегированных каталогах, которые позволяют пользователю находить фильмы и книги исходя из ранее сделанных запросов, но не на Google или подобных системах, работающих по своим, более сложным и динамичным алгоритмам.
«Это всего лишь надстройка (далеко не первая), маленький статичный алгоритм из двух десятков строчек, который может изменить структуру поисковой выдачи, а может и не изменить, — говорит Кирилл Иванов. — Он вряд ли способен оказать хоть какое-то влияние на постоянно меняющиеся алгоритмы поисковых гигантов, для которых “пузырь фильтров” — это не проблема, а наоборот, то, к чему они стремятся, их цель, если совсем просто сказать».
В научных работах сам термин «пузырь фильтров» встречается крайне редко, в профессиональной среде описанную проблему считают скорее не технологической, а философской. «Пузыри» окружают нас повсюду, и зачастую создаем мы их сами, отправляя в бан несогласных, подписываясь на определенные каналы, кликая на ссылки, которые заведомо отвечают нашим убеждениям. Умные алгоритмы — это лишь скин, оболочка нашего поведения в инфомире.
Программисты вообще призывают критически относиться к любым алгоритмам, а при поиске информации почаще включать «естественный интеллект» — правильно формулировать и уточнять запросы, искать ответы не на SEO-оптимизированных страницах, а в надежной литературе. Если, конечно, есть потребность иметь свободу выбора и расширить свой «информационный пузырь».