Доверие и безопасность в социальных сетях

Специалист по компьютерным наукам Мануэль Маццара о первых социальных сетях, проблеме недостоверной информации в интернете и удобстве платформы Twitter 7 Май 2015, 10:06

Как развивалась история социальных сетей? Как фильтровать обилие информации в интернете? В чем заключается опасность современных технологий? На эти и другие вопросы отвечает профессор Университета Иннополис Мануэль Маццара.

К изучению социальных сетей я пришел на поздних этапах своей карьеры, так как защитил диссертацию по совершенно другой теме — теории параллелизма, и в те времена социальные сети только начинали появляться. Тогда, 10 лет назад, самой популярной из них была сеть LinkedIn. Но и ею пользовались не широкие массы, а в основном только IT-специалисты. Ничего уровня Facebook, появившегося чуть позже, на тот момент не было.

В Италии Facebook стал заметен только к 2006–2007 году, до этого эта ниша, можно сказать, пустовала. Затем, спустя пару лет, со стартом и успехом Facebook мы с друзьями общались исключительно при помощи него и электронной почты. Каково же было наше удивление, когда мы обнаружили, сколько в социальных сетях недостоверной информации.
Нам понадобилось создать свой узкий круг контактов, внутри которого мы смогли бы делиться актуальной информацией о геополитике и прочих важных темах. У нас не было другого выхода, ибо традиционные СМИ, телевидение и газеты, растратили свой кредит доверия, получив репутацию инструмента пропаганды.

Но в конце 1990-х — начале 2000-х было ощущение, что интернет станет источником достоверной информации, и на Facebook возлагались большие надежды. К сожалению, он тоже оказался полон неверной информации. Пользователи делятся всем чем угодно, начиная от несуществующих цитат, заканчивая ничем не подкрепленными новостями.
Сегодня в интернете много противоречивой информации. Все мы, скажем так, разочаровались в интернете, ибо нашей мечте об идеальной платформе не суждено было сбыться. Нашей первой реакцией было создание замкнутого круга из знакомых адресов, куда мы обращались за нужной информацией. Но спустя какое-то время мы задумались: если удовлетворяющей наши нужды платформы не существует, почему бы ее не создать? Так и родилась эта идея. Мы решили создать собственную платформу. До финала разработки мы еще не дошли, но уже заложили в основу очень сильные элементы. Наша платформа работает на основе Twitter. Она построена не с нуля, а на основе Twitter по ряду причин. Мы назвали ее Polidoxa. Названию мы уделили много внимания, нужно было запоминающееся имя. Оно состоит из двух греческих слов: «поли» и «докса» — много мнений. Мы создали такую платформу, которая не зависит от воли и мнения определенных лиц, чем она и отличается от телевидения, газет, а с недавнего времени и от Facebook. Таким образом, у нас в руках некая утопическая, футуристическая площадка для обмена интересными идеями и правдивой информацией.
Как мы пришли к тому, что нам было необходимо, чего не было у Facebook? Нам был нужен инструмент для измерения доверия. На нашей платформе идет автоматический анализ того, насколько пользователи доверяют друг другу. Этот анализ у нас называется «раскопка». Мы изучаем все пути, по которым пользователи взаимодействуют друг с другом. Становится очевидно, что пользователи отдают предпочтение небольшому числу других пользователей, доверяют им, читают и комментируют чаще. В какой-то степени естественно, что это их близкие друзья, чьи взгляды они разделяют и чьим словам доверяют.
Таким образом, наша платформа умеет сама анализировать поток информации и на ее основе подсчитывать так называемый индекс доверия. Он измеряется в процентах, от 0 до 100, и претерпевает постоянные изменения: может как вырасти, так и упасть. Благодаря ему мы можем судить, насколько пользователи Polidoxa доверяют друг другу.

В этом состоит первый элемент нашей платформы: анализ информации и подсчет индекса доверия.

Специалист по компьютерным наукам Мануэль Маццара
Функция у индекса доверия очень простая. Каждый раз, когда вы проводите поиск по нашей платформе, вместо того, чтобы упорядочивать результаты по дате, в хронологическом, случайном порядке или, как в случае с Google, при помощи алгоритма PageRank, мы упорядочиваем результаты по их индексу доверия. То есть первыми результатами будут те, которым я доверяю больше, поскольку доверяю их источнику больше. Вот такое решение проблемы нашли мы. Начали с прототипа, выложили его в Сеть, и мы находимся на этапе непосредственно создания компании вокруг проекта, то есть сейчас идут переговоры насчет того, откуда взять капитал, и вскоре мы со своей гаражной разработкой уже выйдем на рынок. Таким образом, можно сделать вывод, что, если на рынке нет подходящего решения, приложения, которое бы вас удовлетворяло, всегда можно создать свое. Надеюсь, многие почерпнут эту идею из нашего опыта.


В Twitter очень легко следить за тем, кого читает пользователь, какие записи лайкает, какими твитами делится. Нам остается составить линейную комбинацию из нескольких параметров, довольно простую формулу, в которой администратор системы может назначать параметрам различные коэффициенты, тем самым изменяя то, как подсчитывается индекс доверия по этой комбинации. Можно увеличить вес ретвитов или придать большее значение такому распространенному хештегу, как #FollowFriday, которым в Twitter отмечают людей, чьи записи находят интересными. Все эти элементы: ретвиты, лайки, упоминания в #FollowFriday — подсчитываются, учитывая их коэффициенты, заданные администратором системы, перед каждым поиском. Каждый новый поисковый запрос запускает пересмотр параметров для каждого конкретного пользователя, затем пересчет его индекса доверия, в конце этого процесса запись значения индекса доверия рядом с пользователем в базу данных. Таким образом, при показе результатов поиска упорядочение идет по этому индексу.
Ничего невероятно сложного: база данных с одной стороны и простенький алгоритм элементарнейшего подсчета параметров с другой. С каждым поиском все элементы считаются заново и заносятся в базу данных. Поэтому при будущих поисках вы сможете расставить приоритеты уже на основании обновленных параметров. Теоретически все несложно. Идея сама по себе хорошая, реализация немного затруднена, но не слишком. Twitter мы выбрали исключительно из-за его простоты. Извлечение информации, мнений пользователей из Facebook намного сложнее, поскольку в Facebook очень много способов делиться мыслями: с помощью видео, фото, аудио, — тогда как Twitter в этом смысле элементарен. Штудирование контента в Twitter технически намного легче, чем в Facebook, вот почему мы остановили выбор на нем. Сейчас мы пытаемся обойти некоторые технические проблемы и также выйти на Facebook, так как он более интересен для анализа информации, хоть и сложнее.

Сегодня над нами нависла очень важная с точки зрения истории дилемма. Мы обладаем технологиями, пронизывающими нашу жизнь насквозь: все эти телефоны, социальные сети, которые по большому счету имеют постоянный доступ к нам. Теоретически какая-нибудь система может знать, где мы находимся и чем занимаемся в каждый момент времени.
И мы, будучи всего лишь людьми с небесконечными объемами памяти, рады иметь ассистентов, облегчающих наш ежедневный труд. Лично мне очень помогает мой дневник, куда я пишу разные вещи, и всякие системы, напоминающие мне о том или ином плане. С одной стороны, это хорошо, все эти «умные» города, «умные» здания, домовая электроника типа Domotics. Я работал над такой, и, несомненно, очень удобно иметь дома технологию, помогающую тебе, саму исполняющую какие-то неприятные обязанности по дому или напоминающую о них. Это прекрасно, но, с другой стороны, не стоит забывать, что мы слишком зависимы от технологий.
Вся наша информация хранится где-то удаленно, откуда ее можно в любой момент достать и проанализировать. Собственно, в этом и состоит вопрос: готовы ли мы предоставить машинам, то есть технологиям, так много власти ради удовлетворения повседневных потребностей? В Polidoxa мы пытаемся ответить на этот вопрос. Мы хотим, чтобы технологии работали на людей, были полезными и чтобы в то же время информация о пользователях не использовалась в целях, не требуемых пользователями и опасных для них. Мы намерены пользоваться интернетом лишь во благо, но интернет сам по себе не хороший и не плохой — он лишь инструмент. Именно поэтому все мы — не только специалисты по компьютерам, но и все люди — должны принять решение, стоит ли нам настолько вводить технологии в нашу жизнь, что они станут главенствующими через какие-то 10 лет, и это будет проявляться в ежесекундной слежке за каждым человеком, что даст возможность большим организациям и правительствам смотреть, как мы платим налоги, как выполняем работу и где находимся. Так что в любой технологии заложен двойной потенциал, и мы хотим использовать ее для свободы и против порабощения, но бремя решения этой исторической проблемы лежит на всех нас.

Мануэль Маццара

PhD in Computer Science, профессор, заместитель заведующего лабораторией программной инженерии и верификации программ Университета Иннополис