pasata

pasata: Социальные сети





Как формируется новостная лента социальной сети Facebook









14 января, 2016



Корреспондент онлайн-журнала Slate Уилл Оремус отправился в главный офис Фейсбука, чтобы разобраться, как формируется новостная лента социальной сети.




О том, как устроен алгоритм и почему он часто меняется, Оремусу рассказал технический руководитель новостной ленты Том Элисон. «Одним из базовых алгоритмов в компьютерных науках является алгоритм сортировки», — говорит Элисон. Написав на доске ряд целых положительных чисел 4, 1, 3, 2, и 5, он продолжает: «Задача простая: разработать алгоритм, который расставил бы эти числа по возрастанию». В то время как люди способны решить такую задачу без раздумий, компьютеру потребуется набор точных инструкций.
Элисон описал алгоритм «пузырьковой сортировки», состоящий из таких шагов:
1. Каждое число последовательности, начиная с первого, нужно сравнить со следующим числом и проверить, стоят ли они в нужном порядке.
2. Если нет, нужно поменять их местами.
3. Шаги 1 и 2 повторяются до тех пор, пока не исчезнет необходимость перестановки чисел.
Главным преимуществом этого метода является его простота, но при работе с большими массивами данных он существенно теряет в производительности. Поэтому Фейсбук пользуется похожим, но другим алгоритмом упорядочивания постов в ленте. Впрочем, и он является лишь частью общей картины. Самое важное в этом случае — присвоить всем постам числовое значение.
Перед командой Элисона стоит задача разработать систему, способную присвоить постам показатель релевантности, индивидуальный для каждого пользователя.
Сложность в том, что посты, важные для одного пользователя, могут быть неинтересны другому.
Вот почему Фейсбук внедрил прогнозирующий алгоритм, поясняет Элисон: «Представьте, что я попросил вас выбрать победителя баскетбольного матча. Если вам нечего терять, вы скорее всего выберете команду наугад. Но чтобы сделать денежную ставку, вам понадобится системный подход. Вы обратите внимание на данные за прошлые периоды: количество поражений и побед каждой команды, результаты отдельных игроков, кто из них травмирован, кто в хорошей форме.
Возможно, вы учтёте факторы окружающей среды: на чьём стадионе играют, какая из команд хорошо отдохнула, а какая ещё не восстановилась после долгого перелёта. Ваш прогнозирующий алгоритм может включать в себя все эти факторы и многие другие. Если они выбраны правильно, вам удастся не только предсказать исход игры, но и подсчитать вероятность определённого развития событий».
kak formiruetsya novostnaya lenta Facebook 2Фото: Aaron Tam / AFP / East News


Так и алгоритм Фейсбука учитывает сотни факторов-переменных и, основываясь на вашем предыдущем поведении, рассчитывает, лайкнете и прокомментируете ли вы запись, поделитесь ею, скроете или пометите как спам.
Каждому из вариантов он присвоит определённую вероятность и, скомбинировав их, рассчитает показатель релевантности конкретного поста для конкретного пользователя. После этого сортирующий алгоритм расставит выбранные посты в порядке, который вы увидите на экране — те, что идут первыми, обошли тысячи других и с гораздо более высокой вероятностью заставят вас смеяться или плакать, лайкать и комментировать. И хотя расчётами занимаются машины, именно сотрудники отдела качества новостной ленты выбирают исходные данные и ставят задачи для их обработки. Они решают, какой алгоритм должен принимать участие в формировании ленты, а какой — нет.
В 2013 году, когда компания переживала пик роста, интерес людей к Фейсбуку был невероятно высок. Пользователи лайкали записи чаще, чем когда-либо раньше, но продолжал ли нравиться им сам Фейсбук? Поиском ответа на этот вопрос занялся директор департамента ленты новостей Уилл Кэткарт. Он предложил собирать нетипичные данные: не просто статистику кликов и лайков, а время чтения поста и момент, когда ставится лайк.
Лайки, поставленные после прочтения материала, имеют гораздо большее влияние на алгоритм.
В 2014 преемник Кэткарта Адам Моссери пошёл дальше и собрал группу из нескольких сотен человек, ежедневно приходивших в офис компании и анализировавших свои ленты. Они писали отчёты, понравились ли им предложенные посты и чем, что ещё они бы хотели видеть — примерно по абзацу о каждом посте. Они предположили, что время прочтения материала может быть более важным показателем вовлечённости, чем лайк. Но и это не всегда так — шокирующие, страшные материалы могут привлечь ваше внимание, но это не значит, что вы захотите видеть их в ленте. Скорость соединения тоже имеет значение — пользователи с медленным интернетом могут просто долго загружать страницу, но не факт, что будут внимательно её читать.
Летом 2015 года Моссери распустил эту группу и начал собирать данные, опрашивая самих пользователей Фейсбука. Как оказалось, не все читают ленту одинаково. К примеру, 5% пользователей выбирает опцию «Скрыть публикацию» по отношению к 85% увиденных ими постов. Обычно такое действие сигнализирует о том, что пост не понравился, однако эти 5%, скрывая публикацию, отмечали её как просмотренную по аналогии с архивацией писем. Этой группе пользователей алгоритм изменили, чтобы их действия не так сильно влияли на формирование ленты.
Несмотря на то, что новостной лентой по-прежнему управляет алгоритм, на него сильно влияют решения пользователя.
«Мы можем провести и проведём следующие 10 лет, совершенствуя эти машинные алгоритмы, — говорит Моссери. — Но сейчас гораздо больше пользы мы получим, просто спросив наших пользователей, что им нравится».
Фото: Robyn Beck / AFP / East News.
Источник: birdinflight.


[1..1]


Папки