12.10.2021, 11:28
Итальянские математики проанализировали больше двух миллионов мемов, опубликованных на Reddit в период с 2011 по 2020 годы. Они использовали наработки Ричарда Докинза — сорок лет назад он ввёл термин «мем» как единицу передаваемой идеи и предположил, что законы развития культуры близки к законам генетики.
Warner Bros.
Какой-то сложный мем.
Исследователи применили методы машинного обучения для кластеризации мемов по шаблонам. Смысл работы — определить, как популярность шаблона влияет на время жизни мема. Исследование опирается на концепцию культурной эволюции Докинза , которую научное сообщество в целом не признает, однако отдельные ее элементы помогают хорошо описать распространение мемов — в частности, репликация, вариация и отбор.
Датасет, набранный для исследования, оказался таким крупным, что работы проводились в два этапа — сначала изображения делились два набора с животными, один с людьми и остатки с помощью алгоритма глубокого обучения SCAN, после чего кластеры бились на меньшие подгруппы с помощью алгоритма HDBSCAN. Благодаря этому стало возможно отследить похожие и «родственные» шаблоны.
C.M. Valensise et al / Scientific Reports, 2021
Число шаблонов растет экспоненциально со временем и удваивается каждые полгода. Видите обрыв к 2019 году? Мемов стало слишком много!
Математики также проанализировали скорость мутации мемов — чем популярнее шаблон, тем быстрее он мутирует! Также математики решились оценить сложность мемов — для этого каждому мему сопоставили степень беспорядка в расположении пикселей — перестановочную энтропию. Сложность оценивали , рассматривая пространственные паттерны на изображении, чем менее они тривиальны, тем «сложнее» мем. Выяснилось, что их сложность в среднем за год растет.
Исследование опубликовано в Scientific Reports.