Chatbot Usability Scale (BUS-11) — специализированная валидированная шкала для количественной оценки юзабилити чат-ботов и конверсационных ИИ-систем, состоящая из 11 вопросов, измеряющих пять ключевых аспектов взаимодействия: личность бота, пользовательский опыт, обработку ошибок, адаптацию пользователя и функциональность.
История метода
Метод Chatbot Usability Scale был разработан в 2021 году исследователями под руководством Симоне Борски (Simone Borsci) из Университета Твенте (Нидерланды) в сотрудничестве с коллегами из других институтов, включая Имперский колледж Лондона. Метод был создан в ответ на растущую потребность в стандартизированном инструменте для оценки конверсационных интерфейсов.
Изначально метод был представлен в виде 15-пунктовой шкалы (BUS-15) в статье “The Chatbot Usability Scale: the Design and Pilot of a Usability Scale for Interaction with AI-Based Conversational Agents”, опубликованной в журнале Personal and Ubiquitous Computing. Исследователи провели серию из четырех исследований, включая систематический обзор литературы, чтобы определить ключевые атрибуты для оценки качества взаимодействия с чат-ботами.
В 2022 году Борски и его коллеги провели подтверждающий факторный анализ и валидацию BUS на разных языках, в результате чего была создана оптимизированная 11-пунктовая версия (BUS-11). Эта версия сохранила психометрические свойства оригинала, но стала более компактной и удобной в применении. Результаты мультиязычной валидации были опубликованы в статье “A confirmatory factorial analysis of the Chatbot Usability Scale: a multilanguage validation” в том же журнале.
С момента создания метод получил признание среди исследователей и практиков в сфере UX как эффективный инструмент для оценки и сравнения чат-ботов и ИИ-систем с диалоговым интерфейсом. В отличие от общих шкал юзабилити, таких как System Usability Scale (SUS), BUS-11 учитывает уникальные особенности конверсационных интерфейсов, включая естественность диалога, обработку ошибок и адаптивность.
Описание метода
Chatbot Usability Scale представляет собой стандартизированный опросник, содержащий 11 утверждений, которые оцениваются пользователями по 5-балльной шкале Лайкерта (от “полностью не согласен” до “полностью согласен”). Эти утверждения охватывают пять ключевых аспектов взаимодействия с чат-ботами и ИИ-системами.
Метод позволяет получить как общую количественную оценку юзабилити системы (от 0 до 100 баллов), так и детализированные оценки по отдельным факторам, что помогает выявить конкретные проблемные области и сильные стороны интерфейса. Результаты могут быть использованы для сравнения различных чат-ботов, оценки эффективности внесенных изменений или мониторинга юзабилити в процессе разработки.
BUS-11 оценивает следующие факторы:
-
Личность бота (Bot Personality) — насколько естественным и приятным воспринимается взаимодействие с системой
-
Пользовательский опыт (User Experience) — общее впечатление от использования и эмоциональная реакция
-
Обработка ошибок (Error Handling) — способность системы распознавать ошибки и адекватно на них реагировать
-
Адаптация пользователя (User Adaptation) — насколько легко пользователи приспосабливаются к взаимодействию
-
Функциональность (Functionality) — эффективность выполнения задач и полезность системы
В отличие от общих шкал юзабилити, таких как System Usability Scale (SUS) или UMUX-LITE, BUS-11 специально разработана с учетом уникальных особенностей конверсационных интерфейсов. Шкала продемонстрировала высокую надежность (коэффициент альфа Кронбаха между 0.76 и 0.87) и была успешно валидирована на различных языках, включая английский, испанский, немецкий и голландский.
Типология метода
-
Тип данных: количественный
-
Модерация: немодерируемый (может проводиться без присутствия модератора)
-
Продолжительность: короткая (заполнение опросника занимает 5-10 минут у одного участника)
-
Формат проведения: индивидуальный, может проводиться как очно, так и удаленно с использованием онлайн-форм
Цели и задачи метода
-
Количественная оценка юзабилити чат-ботов и конверсационных ИИ-систем
-
Выявление конкретных проблемных аспектов взаимодействия с чат-ботом
-
Сравнение различных чат-ботов или версий одной системы
-
Мониторинг изменений юзабилити в процессе разработки и итерации
-
Определение приоритетных направлений для улучшения пользовательского опыта
-
Оценка соответствия чат-бота ожиданиям и потребностям пользователей
-
Выявление различий в восприятии системы разными группами пользователей
-
Обоснование решений по дизайну на основе количественных данных
-
Создание бенчмарков для оценки конкурентоспособности продукта
-
Измерение влияния внесенных изменений на пользовательский опыт
Применение в процессе Human-Centered Design
Стадия 1. Понимание и определение контекста использования
Вспомогательное применение
-
Помогает определить ожидания пользователей от конверсационных интерфейсов
-
Выявляет специфические аспекты взаимодействия, важные для целевой аудитории
-
Позволяет понять существующие паттерны взаимодействия с чат-ботами
Стадия 2. Определение требований пользователей
Вспомогательное применение
-
Помогает приоритизировать требования к чат-боту на основе оценок важности различных аспектов
-
Выявляет критические атрибуты, влияющие на удовлетворенность пользователей
-
Позволяет сформулировать количественные критерии успеха для проекта
Стадия 3. Создание проектных решений
Вспомогательное применение
-
Обеспечивает фокус на ключевых аспектах юзабилити при проектировании диалоговых потоков
-
Помогает выбрать оптимальные решения из нескольких альтернатив на основе оценок пользователей
-
Создает основу для итеративного улучшения прототипов
Стадия 4. Оценка проектных решений
Основное применение
-
Обеспечивает количественную оценку юзабилити реализованного чат-бота
-
Позволяет сравнивать различные версии системы и отслеживать прогресс
-
Выявляет конкретные аспекты, требующие доработки
-
Предоставляет данные для принятия решений о готовности продукта к релизу
-
Создает основу для дальнейшей оптимизации пользовательского опыта
Chatbot Usability Scale (BUS-11) наиболее эффективен на стадии оценки проектных решений, когда необходимо получить объективные количественные данные о качестве пользовательского опыта взаимодействия с чат-ботом. Метод позволяет не только измерить общий уровень юзабилити, но и детализировать результаты по конкретным аспектам взаимодействия, что делает его ценным инструментом для итеративного улучшения конверсационных интерфейсов. Регулярное применение BUS-11 на различных этапах разработки помогает отслеживать динамику изменений и обеспечивает основу для принятия обоснованных дизайн-решений.
Преимущества и ограничения
Бизнес-выгоды
-
Снижение затрат на поддержку пользователей за счет улучшения юзабилити чат-бота
-
Повышение конверсии и удержания пользователей благодаря более качественному взаимодействию
-
Сокращение времени разработки через фокусирование на приоритетных аспектах юзабилити
-
Объективное обоснование инвестиций в улучшение пользовательского опыта
-
Возможность количественного сравнения с конкурентами и установления бенчмарков
-
Уменьшение риска провала продукта из-за проблем с юзабилити
-
Оптимизация ресурсов за счет приоритизации критических улучшений
Уникальные особенности
-
Специализированный инструмент, учитывающий специфику диалоговых интерфейсов
-
Научно валидированная методология с проверенной надежностью
-
Позволяет оценивать как общий уровень юзабилити, так и отдельные аспекты взаимодействия
-
Простота применения и интерпретации результатов
-
Возможность сравнения различных чат-ботов и версий одной системы
-
Учитывает уникальные аспекты диалоговых систем, не охватываемые общими шкалами юзабилити
Оптимальные условия применения
-
Оценка готовых чат-ботов или высокоточных прототипов
-
Итеративная разработка с регулярными оценками прогресса
-
Сравнение нескольких вариантов дизайна конверсационного интерфейса
-
Сбор обратной связи после значительных изменений в системе
-
Установление базовых показателей перед началом оптимизации
-
Обоснование необходимости улучшений для заинтересованных лиц
-
Оценка влияния конкретных изменений на общее восприятие системы
Ограничения
-
Субъективный характер оценок, зависящий от индивидуального восприятия пользователей
-
Ограниченная применимость к недиалоговым типам ИИ-систем
-
Возможное влияние эффекта новизны на первые впечатления пользователей
-
Не заменяет качественные методы исследования для выявления конкретных проблем
-
Чувствительность к контексту и сценариям использования
-
Требует достаточного размера выборки для получения статистически значимых результатов
-
Фокусируется на текущем опыте, не учитывая долгосрочные аспекты взаимодействия
Основные компоненты метода
Полный опросник BUS-11
Оцените каждое утверждение по шкале от 1 (полностью не согласен) до 5 (полностью согласен):
-
Взаимодействие с чат-ботом/ИИ-системой было легким и понятным.
-
Я нашел функциональность чат-бота/ИИ-системы полезной.
-
Чат-бот/ИИ-система мог понять, что я имею в виду, даже если я выражался не совсем точно.
-
Чат-бот/ИИ-система быстро отвечал на мои запросы.
-
Взаимодействие с чат-ботом/ИИ-системой казалось естественным.
-
Чат-бот/ИИ-система был способен корректно обрабатывать ошибки.
-
Я легко мог восстановить взаимодействие после ошибок или недопонимания.
-
Чат-бот/ИИ-система проявлял дружелюбность и вежливость.
-
Я получил всю необходимую информацию от чат-бота/ИИ-системы.
-
Я бы предпочел использовать этого чат-бота/ИИ-систему, а не обращаться к человеку-оператору.
-
Я бы рекомендовал этого чат-бота/ИИ-систему другим людям.
Факторная структура BUS-11
В результате конфирматорного факторного анализа были выявлены следующие факторы:
-
Личность бота: пункты 5, 8
-
Пользовательский опыт: пункты 1, 10, 11
-
Обработка ошибок: пункты 3, 6, 7
-
Функциональность: пункты 2, 4, 9
Расчет результатов
-
Общий балл BUS: Суммируйте баллы по всем 11 пунктам (диапазон 11-55 баллов)
-
Нормализованный балл: (Общий балл – 11) × 2.27 = Балл от 0 до 100
-
Факторные оценки: Рассчитывается среднее значение по пунктам, относящимся к каждому фактору
Интерпретация результатов
-
0-50: Неудовлетворительный уровень юзабилити, требуется существенная доработка
-
51-68: Приемлемый уровень юзабилити с пространством для улучшений
-
69-80: Хороший уровень юзабилити
-
81-100: Отличный уровень юзабилити
Результаты BUS-11 показывают сильную положительную корреляцию с другими валидированными инструментами оценки юзабилити, такими как UMUX-LITE, что подтверждает конвергентную валидность метода.
Структура проведения
Подготовка
-
Определите цели исследования и аспекты чат-бота, которые необходимо оценить
-
Выберите формат проведения (очный или удаленный) и подготовьте опросник BUS-11
-
Определите целевую аудиторию и количество участников (рекомендуется минимум 15-20 участников)
-
Подготовьте 2-3 типичных сценария использования чат-бота/ИИ-системы
-
Создайте инструкции для участников и форму для сбора демографических данных
-
Протестируйте настройку исследования с 1-2 пилотными участниками
-
Внесите необходимые корректировки в процедуру на основе пилотного тестирования
Проведение
-
Предоставьте участникам доступ к чат-боту/ИИ-системе и инструкции по выполнению задач
-
Попросите участников выполнить подготовленные сценарии использования
-
После завершения взаимодействия с системой предложите заполнить опросник BUS-11
-
При необходимости соберите дополнительные качественные комментарии о пользовательском опыте
-
Поблагодарите участников и предоставьте им вознаграждение, если это предусмотрено
Анализ
-
Подсчитайте общий балл BUS и нормализованный балл для каждого участника
-
Рассчитайте средние значения и стандартное отклонение для всей выборки
-
Проанализируйте оценки по каждому из пяти факторов для выявления проблемных аспектов
-
Сегментируйте результаты по демографическим или поведенческим характеристикам участников
-
Сравните результаты с предыдущими измерениями или бенчмарками (если имеются)
-
Определите статистическую значимость различий при сравнении версий или групп пользователей
-
Сформулируйте рекомендации по улучшению на основе выявленных проблемных аспектов
-
Подготовьте отчет с визуализацией результатов и конкретными рекомендациями
Связь с другими методами
Предшествующие методы
-
Модерируемое юзабилити-тестирование — выявляет конкретные проблемы для последующей количественной оценки
-
Глубинное интервью — помогает понять ожидания пользователей от чат-бота
-
Прототипирование — создает версию чат-бота для тестирования
-
Customer Journey Map (CJM) — определяет ключевые точки взаимодействия с чат-ботом
-
Персона — формирует понимание потребностей целевых пользователей
Дополняющие методы
-
Обратная связь от клиентов — обогащает количественные данные качественными комментариями
-
System Usability Scale (SUS) — позволяет сравнить с общей оценкой юзабилити
-
Анализ логов взаимодействия — предоставляет объективные данные о фактическом использовании
-
Экспертная оценка удобства — дополняет пользовательскую оценку экспертным мнением
Последующие методы
-
A/B-тестирование — проверяет эффективность внесенных изменений
-
Когнитивный прогон — детально анализирует проблемные аспекты, выявленные в BUS-11
-
GOMS-анализ — моделирует оптимальные пути взаимодействия с чат-ботом
-
Дизайн-спринт — разрабатывает решения для выявленных проблем
-
Карта эмпатии — углубляет понимание эмоциональных реакций пользователей
Заключение
Chatbot Usability Scale (BUS-11) представляет собой ценный инструмент для оценки и улучшения пользовательского опыта взаимодействия с конверсационными ИИ-системами. В условиях стремительного роста популярности чат-ботов и виртуальных ассистентов этот метод приобретает особую значимость, поскольку обеспечивает стандартизированный подход к оценке их юзабилити.
Основная ценность BUS-11 заключается в его специализированном характере — в отличие от общих шкал юзабилити, он учитывает уникальные аспекты диалоговых интерфейсов, такие как естественность взаимодействия, способность системы обрабатывать неоднозначные запросы и адаптироваться к стилю общения пользователя. Это делает его незаменимым инструментом для команд, разрабатывающих чат-боты и конверсационные ИИ-системы.
Международная валидация BUS-11 на различных языках подтверждает его кросс-культурную применимость, что особенно важно в контексте глобального распространения ИИ-технологий. Простота применения и интерпретации результатов делает BUS-11 доступным для широкого круга специалистов, от UX-исследователей до продуктовых менеджеров. При этом научная обоснованность метода обеспечивает достоверность получаемых результатов и возможность их использования для принятия обоснованных решений по улучшению продукта.
В контексте развития ИИ-технологий и увеличения роли конверсационных интерфейсов в цифровых продуктах, Chatbot Usability Scale становится все более востребованным инструментом. Его дальнейшее развитие может включать адаптацию для оценки мультимодальных ИИ-систем, интегрирующих текстовые, голосовые и визуальные модальности, а также создание специализированных версий для конкретных отраслей и типов приложений.