Модель для сборки: ИИ и контент в соцсетях

Эксперты отмечают, что проникновение российских социальных медиа уже практически сравнялось с аудиторией Рунета в целом. Как развиваются социальные платформы сегодня и каковы перспективы? Как искусственный интеллект (ИИ) и машинное обучение ускоряют развитие аналитики соцмедиа? Как использовать в исследованиях данные различной природы? Как наиболее эффективно решать типовые для аналитики бизнес-задачи?

Эти и другие вопросы обсудили эксперты в рамках конференции Brand Analytics, состоявшейся в пресс-центре МИА «Россия сегодня».

ГЛАВНЫЕ ЦИФРЫ

Модель для сборки: ИИ и контент в соцсетях

По данным, представленным директором по стратегическим коммуникациям компании Brand Analytics Василием ЧЁРНЫМ, по состоянию на октябрь 2023 г. в российских соцмедиа публикуются 1,55 млрд сообщений в месяц. По объёму контента (791,1 млн постов в месяц) лидирует Telegram, на втором месте (414 млн) находится соцсеть «ВКонтакте», на третьей позиции — «Одноклассники» (67,8 млн). Instagram¹стабильно на четвёртом месте (41,9 млн). В 2022 г. объём создаваемого контента вырос на 36%.

¹ Здесь и далее: Instagram и Facebook — продукты компании Meta Platforms, признанной в России экстремистской организацией.

— Год назад мы говорили о том, что это следствие общественной реакции на события, которые с нами случились. В 2023-м отката назад не произошло. Число авторов в прошлом году снизилось лишь на 6%, и, несмотря на все блокировки, в нынешнем мы возвращаемся к цифрам 2021 г., — отметил эксперт.

По числу авторов на первом месте «ВКонтакте» (25,6 млн в месяц), однако есть некоторое снижение по отношению к прошлому году. Instagram сократился по этому показателю в прошлом году на 58%, сейчас наблюдается небольшой рост, и в целом этот ресурс на втором месте. На третьей позиции Telegram c 11,7 млн авторов в месяц, и впервые этот мессенджер демонстрирует падение. У YouTube также перелом тренда: по числу авторов сервис стал подрастать. В Facebook данный показатель перестал увеличиваться, а вот TikTok вырос со 100 тыс. авторов в марте 2023 г. до 1 млн — в октябре.

По числу сообщений Telegram занимает долю в 60% в русскоязычном сегменте Интернета, «ВКонтакте» — 27%. По числу авторов доля «ВКонтакте» — 32%, Instagram — 21%, Telegram — 18%.

Соцсеть «ВКонтакте» традиционно более женская (61,6%), при этом преобладают пользователи в возрасте 25–44 лет (51,9%). X (экс-Twitter) и YouTube традиционно более мужские ресурсы (около 60% пользователей — представители сильного пола). Самая женская соцсеть — Instagram (81,5%).

Эксперт обозначил основные тренды развития соцмедиа. В 2023 г. сохраняется выросшая за 2022-й активность авторов. Лидирующей и по авторам, и по контенту платформой остаётся «ВКонтакте». Запрещённый Instagram прочно занимает вторую позицию по авторам и третью — по объёму контента. В русскоязычном медиаполе Telegram остаётся лидером по числу публикуемых сообщений, притом что более 40% контента на этой площадке генерируют боты. Высока доля присутствия авторов на площадках с отзывами (это геосервисы, маркетплейсы, отзовики). В октябре 2022 г. она составила 8% от общего числа авторов.

Модель для сборки: ИИ и контент в соцсетях

К дискуссии подключилась Наталья БОРОЗДИНА, руководитель сектора поддержки диджитал-клиентов Mediascope:

— Наше общество серьёзно диджитализировано, потому что уже более 84% населения старше 12 лет используют Интернет хотя бы раз в месяц. 83% заходят в Сеть ежедневно. При этом мы проводим в Интернете много времени: более четырёх часов в день в среднем, а молодёжь — более шести часов в день. Что мы делаем в Сети? Развлекаемся, общаемся и покупаем что-либо в интернет-магазинах, при этом пишем и читаем отзывы, — отметила выступающая.

Проникновение социальных сетей сравнялось с охватом Интернетом. Если человек выходит в Сеть хотя бы раз в месяц, то он использует и социальные платформы. 75% населения заходят в социальные медиа ежедневно. В младших возрастных группах проникновение социальных медиа достигло 100%. Самый большой прирост сосредоточен в старшей возрастной группе (55+; 18%). Эксклюзивного десктопного потребления почти не осталось, пользователи заходят в соцсети или с мобильных устройств, или в гибридном варианте.

По месячному охвату лидируют YouTube (77,8%), «ВКонтакте» (72,3%) и Telegram (66,9%). Донорами аудитории для других ресурсов стали Instagram и Facebook. Охват Instagram снизился до 5% населения, Facebook — до 0,6%. При этом доля тех, кто проводит в Instagram более пяти минут в день, стабильна. Это может свидетельствовать о том, что у соцсети сформировалось лояльное ядро. Это те, кто не покидает ресурс, несмотря ни на какие блокировки.

Наибольшую долю по времени потребления во всех возрастных группах занимает YouTube (до 58%). Telegram тоже привлекает внимание пользователей, TikTok сохраняет популярность в молодых группах.

КЛЮЧЕВЫЕ ИГРОКИ

Модель для сборки: ИИ и контент в соцсетях

По данным директора по стратегиям и операциям «ВКонтакте» Андрея ГОСТЕВА, ежемесячная аудитория соцсети — около 85 млн россиян, за год она выросла на 12%. Ежедневный охват — 54 млн, рост от года к году — порядка 10%. Как отметил эксперт, пользователи «ВКонтакте» — это весь Рунет с некоторым смещением в молодую аудиторию. Половину аудитории соцсети составляют люди в возрасте 12–34 лет. Контентные сервисы продолжают развиваться. Число просмотров «VK Клипов» достигло 935 млн в сутки, увеличившись за год на 36%. «VK Видео» просматривают 1,9 млрд раз ежедневно. В VK около 2 млн активных авторских пабликов, обеспечивающих до 10 млрд просмотров контента в сутки.

— Сердце нашей социальной сети — лента. Весь этот год мы фокусируемся на развитии рекомендательного сервиса, расширили число неявных сигналов взаимодействия пользователей с контентом, чтобы сделать рекомендации более точными. Лента полностью строится на алгоритмах машинного обучения. Запустили защиту от недружественных комментариев. Буллинг или токсичные высказывания помечаются специальной плашкой, и пользователь сам решает, хочет ли он их читать.

Расширяем наш эксклюзивный контент, в том числе различные музыкальные и ток-шоу. Добавили раздел «Тренды»: в нём можно узнать, какой контент сейчас наиболее популярен. Обновлён видеоредактор: теперь можно извлекать аудиодорожки из видео, делать из них склейки, накладывать визуальные эффекты. В сервисе коротких видео запущен конструктор впечатлений — сервис, позволяющий в три клика получить тот контент, который прямо сейчас вам нужен. Создан сервис автосубтитров: автору видео ничего не придётся писать дополнительно.

В «VK Музыке» стартовал сервис «Подкасты». Музыкальный сниппет — новый вид контента, представляющий собой нарезку из фрагментов треков длиной 35 секунд, выбранных алгоритмом. Пользователь быстро слушает и принимает решение о том, какую музыку он хотел бы видеть в своём плейлисте. Недавний запуск — аудиокниги.

Нашумевший запуск — «VK Знакомства». Сейчас это отдельное приложение с трёхмиллионной месячной аудиторией.

Не забываем про бизнес-сообщество, для которого предназначен сервис «VK Маркет» — маркетплейс товаров от сообществ. Запустили новый кабинет рекламы для более эффективного продвижения. Доступны чат-боты, конструктор мини-приложений, подключение сервисов доставки, оплаты. Работаем над повышением безопасности сделок. Дополнительная поддержка для лояльных пользователей выражается в виде скидок на рекламу и т.д., — обозначил ключевые направления развития эксперт.

Модель для сборки: ИИ и контент в соцсетях

Как отметил руководитель PR-направления «Одноклассников» Сергей ТИХОНОВ, аудитория соцсети насчитывает 36,5 млн пользователей, 58% составляют жители Москвы и городов-миллионников, 89% заходят в сеть с мобильных устройств.

— «Одноклассники» — медиа с большой социальной активностью: открытки, подарки и стикеры отправляют десятками миллиардов. Все эти инструменты используются не только для общения, но и для продвижения бизнеса. Скажем, канал ТНТ продвигал сериал «Ольга» за счёт того, что сделал специальные видеоподарки в виде нарезок из фильма. Благодаря этому канал получил не только широкий охват, но и большую вовлечённость. Музей Банка России увеличил число подписчиков в группе через установку специального стикерпака.

Развиваются контентные сервисы. Для этого мы сменили позиционирование, год назад представив новую концепцию: «Одноклассники» — это сервис про хобби и увлечения. Начали снимать свои шоу, привлекать блогеров. За год создали 11 шоу, посвящённых хобби россиян, их посмотрели более 400 млн раз. На 45% выросло в 2023 г. число групп и медиа. Востребованный контент вполне очевиден: рыбалка у мужчин и кулинария у женщин.

После того как в соцсеть пришли свыше 1 тыс. блогеров, начали появляться новые бренды, в частности «Махеев» и «Пакет». Стартовали рекламные интеграции в видеошоу.

Мы почистили сервис от того, что мешает потреблять контент, улучшили рекомендательный сервис. Люди были готовы смотреть контент и комментировать его, и мы добавили в раздел «Увлечения» социальные механики, сервис вопросов и ответов, запустили базу знаний — это постоянно пополняемая энциклопедия про хобби, в которой собираются термины и контент по различным увлечениям от блогеров, медиа и брендов.

Аудитория «Одноклассников», как правило, активная и платёжеспособная. Мы перенесли это преимущество на увлечения. В сервисе с 22 млн пользователей можно создавать своё комьюнити, запускать корпоративные медиа, получать доступ к глубоко интегрированной в тематику целевой аудитории. По сути, «Одноклассники» стали полноформатной контентной платформой для пользователей, бизнеса и блогеров, — подчеркнул эксперт.

Модель для сборки: ИИ и контент в соцсетях

По словам руководителя группы онбординга и развития бизнеса «Дзена» Ольги СТУКАЛОВОЙ, «Дзен» — скорее контентная платформа: у неё отсутствуют функции, присущие соцсетям, т.е. настройки приватности и встроенный мессенджер.

— Мы идём вслед за зарубежными контентными площадками, наша задача — сделать так, чтобы авторы, которые производят качественный контент, получали внимание аудитории. В «Дзене» много разных целевых аудиторий, работает рекомендательный алгоритм. Платформой пользуются 32 млн человек, мужчины и женщины распределились примерно поровну. Ядро аудитории — 35+.

Как отметила выступающая, «Дзен» начинался как рекомендательный сервис, который агрегировал статьи из медиа. На сегодняшний день по времени потребления текст и видео занимают 50/50. Текстовых форматов два: статьи, в которые можно добавить мультимедиа и где можно разметить ссылки, и посты — небольшие текстовые заметки и галереи изображений. Видео представлены в горизонтальном и вертикальном форматах. В течение полутора лет на платформе были прямые трансляции, но потом оказалось, что этим форматом пользуется менее 1% авторов, поэтому данный сервис сейчас недоступен.

— В России уже не осталось соцсети, которая не запустила бы оригинальный контент от известных блогеров. Площадки уже не борются между собой за авторов, но зато они выбирают стратегию, когда по определённым актуальным тематикам приглашают блогеров, создающих эксклюзивный контент и тем самым привлекающих дополнительную аудиторию, — отметила О. Стукалова.

ИИ В АНАЛИТИКЕ СОЦМЕДИА

Почему ИИ хорош для анализа социальных медиа? Какие задачи научились решать компании с помощью нейросетей? Какие ожидания не оправдались? Какие существуют проблемы для расширения использования машинного обучения в аналитике соцмедиа, как их можно преодолеть? Как будет использоваться ИИ в данной сфере через 5–10 лет? Представляем позиции участников конференции.

Модель для сборки: ИИ и контент в соцсетях

Павел АБРАМОВ, управляющий директор, начальник центра AI-маркетинга «Сбера»:

— У машинного обучения есть ряд преимуществ для работы с данными в соцмедиа. Во-первых, ИИ объективен. Если модель правильно натренировали, а в обучающей выборке не было смещений, то она вполне работоспособна и может различать, спам это или нет, токсичен ли комментарий. Во-вторых, эти модели хорошо масштабируются. Программы при параллельной работе могут обработать за единицу времени миллионы постов. Вообще, соцмедиа серьёзно развили сервисы машинного обучения. На множестве данных, генерируемых соцсетями, рождаются интересные алгоритмы, способные обрабатывать как структурированные массивы, так и неструктурированные: изображения, голос, видео. Важно, что можно находить взаимосвязи, для машинного обучения это золотое дно.

Мы в своей компании с помощью ИИ решаем задачи фильтрации данных: спам или нет, интересно нам или неинтересно их обрабатывать, несут ли они важные для нас сигналы и смыслы либо это просто набор битов и байтов. Довольно серьёзно развита экспертиза в тональности сообщений по отношению к объекту «Сбер». Эти модели учитывают контекст событий, язык, на котором высказываются пользователи. Работает классификация по различным типам контента: оригинальные сообщения, рекламные, сбор средств либо то, что надо сразу отправить в службу безопасности.

Наиболее затратным проектом в машинном обучении в 2022–2023 гг. стало сокращение размерности анализируемых данных, их объёма, для того чтобы из миллионов сообщений выделить важные сигналы, темы, тренды, что позволяет сокращать время, проходящее от анализа до принятия решений. Это сложный комплекс алгоритмов с классификацией и кластеризацией. Помимо анализа есть задача создания контента. Например, перевод коммуникации из одной тональности в другую. Большие языковые модели позволяют исправлять ошибки и синтезировать новые тексты.

Что касается ожиданий, которые не оправдались: это использование одной большой языковой модели, заранее обученной, с минимальной настройкой. Сейчас существует много языковых моделей, в том числе на русском языке, от «Яндекса», «Сбера» и др. Пока то, с чем мы сталкиваемся, каждый раз надо адаптировать под задачу. Также много ручной работы: фильтрации, разметки. Велика скорость появления новых алгоритмов, подходов к работе с данными. Мы стремимся сокращать время от открытия до внедрения. Это одна из ключевых сложностей. Тем не менее продолжаем инвестировать в машинное обучение.

ИИ сегодня в состоянии синтезировать тексты, практически неотличимые от человеческих. По прогнозу Европола, к 2026 г. 90% контента в цифровой среде будет синтетическим. Возможно, придётся обязать крупные компании ставить «водяные метки» на такой контент или подключать в соцмедиа технологию блокчейна, и тогда мы сможем отслеживать, как появилось то или иное сообщение или комментарий. У Open AI есть приложение, позволяющее проанализировать, был ли текст сгенерирован ИИ. Похожая технология есть для изображений. Но что касается контента, который был создан моделью открытого доступа, немного модифицированной на локальном «железе», то это практически невозможно.

Мы в аналитике больших данных с применением ИИ вкладываемся в два больших тренда. Первый направлен на снижение объёма информации, которую после обработки ИИ приходится интерпретировать человеку. Для начала дело касается текстов, но есть ещё стриминг, видеоформаты, тексты на изображениях и другие виды мультимедиа, которые необходимо анализировать.

Второй тренд: мы верим в то, что скоро алгоритмам ИИ можно будет давать более сложные аналитические задачи. На грани совмещения поисковых и генеративных технологий сейчас довольно много прорывов. Машинное обучение можно будет применять для выделения трендов и анализа рассуждений. Это позволит упростить деятельность аналитика и дополнить её алгоритмами ИИ.

Мария САЙКИНА, аналитик Российской ассоциации электронных коммуникаций (РАЭК):

— По некоторым оценкам, в этом году глобальные инвестиции в аналитику соцмедиа с помощью систем ИИ составили 1,64 млрд долларов. По прогнозу, в ближайшие пять лет годовые темпы роста составят около 28%. По результатам опроса бизнес-лидеров, проведённого в США и Великобритании, 80% респондентов уверены, что бюджеты их компаний на аналитику увеличат, при этом 90% считают, что эффективность компаний в большей степени будет зависеть от того, насколько успешно они анализируют социальные медиа.

Интерес к соцсетям очевиден: вся аудитория сейчас там. РАЭК год назад провела большой опрос пользователей Сети и выяснила, что 96% респондентов зарегистрированы в каком-либо социальном медиа. И в России, и во всём мире аудитории Интернета и соцсетей сравнялись. Поэтому анализ данных — задача № 1. Финансовые игроки используют данные соцмедиа для скоринга, оценки платёжеспособности заёмщиков, профилактики финансового мошенничества, другие компании — для рекламных интеграций, для оценки кандидатов при приёме на работу. ИИ позволяет взять из этих данных максимум.

Можно анализировать эмоциональную окраску постов, отношение аудитории к продукту, выявлять контент, получающий наибольший отклик, и оптимизировать контент-стратегию, изучать паттерны поведения. ИИ может анализировать не только текст, но и изображения, видео, музыку, лайки, смайлы, эмодзи — спектр достаточно широк. Если мы научим алгоритмы работать с разными языками, то снимется ещё и этот барьер.

Естественно, в использовании ИИ есть свои подводные камни. Это прежде всего работоспособность алгоритмов, которые опираются на качество данных. Хорошо обученный алгоритм позволяет получать корректные результаты, избегать предвзятости и необъективности. Но надо понимать, что нейросеть учится на данных. Если предложить ей несбалансированный датасет, недостаточно полный, то точно такие же проблемы мы получим на выходе.

Есть большой блок вопросов, связанных с приватностью и защитой персональных данных, особенно если мы обращаемся к внешним партнёрам. Ещё одна проблема — чрезмерное доверие к ИИ. Поскольку он так хорошо справляется с этими задачами, почему бы не отдать ему всё на откуп? Но на данном этапе невозможно обойтись без ручного контроля и настройки. Ещё нет систем, которые бы работали со стопроцентной эффективностью. Естественно, есть проблемы, связанные с кадрами и финансами. Специалисты по машинному обучению самые дефицитные и наиболее дорогие. Пока ИИ — удел крупных компаний, которые могут себе позволить разрабатывать собственные решения.

Reuters назвал 2023-й годом настоящего прорыва использования ИИ в журналистике. Мне кажется, это утверждение можно распространить и на социальные медиа, потому что появились доступные генеративные нейросети, которые стали всё тестировать и выкладывать результаты своего творчества в открытый доступ в соцсетях. Насыщение таким контентом медиапространства — это вызов для аналитики на ближайшую перспективу. Много вопросов: мы анализируем контент, который производят люди, или тот, что делает ИИ, который «думает», что люди так думают? По сути, мы замыкаемся на том, что ИИ анализирует сам себя. Проводятся эксперименты, направленные на выявление продуктов ИИ по разным параметрам. Но генеративные сети не стоят на месте, они развиваются. Вопрос, связанный с аналитикой через пять лет, связан с тем, как вообще будут выглядеть соцсети.

Григорий ОСТРОВСКИЙ, CTO Brand Analytics:

— Машинное обучение ускоряет работу с аналитикой. По опыту нашей компании это подход, позволяющий найти структуру, при которой в дальнейшем можно менять только входные данные. Когда мы говорим про алгоритмическую лингвистику или стандартные формы статанализа, то понимаем, что они, как правило, нацелены на конкретную задачу и на определённые входные данные. ИИ с этим справляется гораздо лучше. Если мы подобрали модель для определения тематики или генерации текстов, то и научить новым данным её намного проще, чем адаптировать классические механизмы. ИИ хорош, потому что он гибок. За счёт этого можно гораздо быстрее внедрять необходимые решения, что, в свою очередь, позволяет быстрее анализировать данные.

Мы собираем много публичных данных, которые надо обрабатывать, научились обогащать их с помощью ИИ. Проблема состоит в том, что большинство разработчиков сегодня знают сферу машинного обучения очень поверхностно. Другая проблема: решения на базе ИИ позволяют делать много полезного, а вот примеров применения крайне мало. Даже в отношении ChatGPT основная масса кейсов — это борьба добра со злом. Одни с его помощью генерируют спам, другие пытаются от него защищаться… Это приводит к тому, что вместо прогресса мы получаем борьбу ИИ самого с собой.

Текущие проблемы заключаются в том, что у нас очень ограниченный набор ресурсов, используемых для развития машинного обучения. Хочется, чтобы прорывов было больше.

Модель для сборки: ИИ и контент в соцсетях

Стас ТУРБИН, руководитель SMM «Яндекса»:

— В «Яндексе» огромное количество данных: каждый день порядка 100 тыс. упоминаний. Мы никогда не смогли бы их обработать вручную. Все крупные компании приходят к посредничеству ИИ. Разметка данных — это уже пройденный этап, у нас работает пять-шесть моделей. Сейчас важнее быстро реагировать на события, а для этого надо понимать, на какое упоминание компании следует обратить внимание. Для этого мы используем ИИ-разработки, позволяющие понять, что станет трендом. Просто выявить упоминание — это одно дело, а вот предугадать его появление — совсем другое.

Что касается аналитики соцмедиа, то для нас важнейшее направление — суммаризация данных. Стремимся полностью автоматизировать составление отчётов, в которых будут обобщены количественные и качественные показатели. Самое главное — тот бизнес-эффект, который PR и маркетинг смогут использовать.

Иногда модели обучаются на небольшом объёме данных и они недостаточно объективны. Для того чтобы получить качественный алгоритм, в него надо загрузить миллионы упоминаний. Ещё одна задача — постоянное дообучение нейросетей, соответственно регулярные затраты.

Самое важное в аналитике соцмедиа — полная автоматизация всего процесса с уже готовыми выводами, которые можно использовать в PR- и маркетинговых кампаниях. Когда вы получаете суммированные и очищенные от спама данные за несколько минут, это позволяет вовремя разместить рекламу на той площадке, где это необходимо. ИИ позволит выявлять тенденции, и трендвотчинг как услуга будет весьма востребованным. Через 5–10 лет, я думаю, мы получим качественный инструмент.

Александр АВИЛОВ, руководитель по развитию машинного обучения и искусственного интеллекта компании «Билайн»:

— В прошлом году мы реализовали интересный проект — построили рейтинговую систему компаний, занимающихся ИИ. В остальном «Билайн» такие данные не использует, это связано прежде всего с приватностью. Главным моментом является природа самих данных. Работа с изображениями, текстом и видео может эффективно проводиться с помощью ИИ-инструментов. По сути, машинное обучение становится обычным инструментом, а вся магия, связанная с ним, развеивается. И самое главное — это качество данных. Субъективное отношение к формированию датасетов обуславливает возможные смещения результатов. Это характерно для ИИ в целом, а не только для соцмедиа. А основная проблема в подготовке кадров — отсутствие фундаментальности. Все курсы, связанные с ИИ, превратились в некий фастфуд. Людям кажется, что они получают знания, но за этим ничего не стоит.

Для того чтобы расширять использование ИИ в соцмедиа, необходимо выстроить систему взаимодействия экспертов по соцсетям и по машинному обучению: часто эти люди говорят на разных языках. Для нас сегодня самая актуальная проблема — фроды, или, по сути, мошенничество. Как её решать, не очень понятно. Вопрос всегда в качестве данных и их разметке. Самый главный вызов связан с этичным использованием ИИ, потому что соцмедиа — это сфера взаимодействия людей.


Рубрика: Выставки и конференции

Год: 2023

Месяц: Декабрь

Теги: Искусственный интеллект (ИИ) Василий Чёрный Наталья Бороздина Андрей Гостев Сергей Тихонов Ольга Стукалова Павел Абрамов Мария Сайкина Григорий Островский Александр Авилов Brand Analytics Социальные медиа