Программисты из Facebook представили базу данных, состоящую из более чем 160 тысяч отрывков диалогов реальных людей, которые беседовали от лица выдуманных "персон". Она получила название Persona-Chat и создана для улучшения возможностей голосовых помощников и любых "говорящих" с пользователем программ. 

Об этом сообщает N+1.

Разработчики также обучили компьютерную модель на примере этих данных. Эта модель может помочь персонифицировать чат-ботов и голосовых помощников.

Несмотря на то, что голосовые помощники и чат-боты с каждым годом становятся все совершеннее, поддержать беседу они все еще могут с трудом. Причиной тому - ограничения обучающей выборки: компьютер можно научить разговаривать и даже отвечать на вопросы, но для поддержания цельной беседы данных может быть недостаточно. Чат-бот, например, не обладает сформированной личностью и интересами - и поэтому не может ответить на сложные открытые вопросы вроде - "Что ты любишь делать в дождливый день?".

Разумеется, есть вариант, в котором чат-бот или голосовой помощник отвечает на неизвестный ему вопрос абстрактной фразой вроде "я не знаю" или поисковым запросом - но беседой считать это нельзя. Кроме того, при общении такой собеседник удерживает в памяти только небольшой отрывок диалога и не может вернуться к информации, предоставленной ему несколько минут назад.

Разработчики из Facebook AI Research под руководством Джейсона Вестона (Jason Weston) собрали базу данных из более чем тысячи "персон": небольших (пять предложений не более 15 слов в каждом) описаний абстрактных личностей, придуманных реальными людьми. Например, описание такой "персоны" может выглядеть так:

Фото: nplus1.ru 

Всего в базе данных 1155 таких "персон". Кроме того, исследователи попросили другую группу людей оценить получившихся "персон" и переписать их на основе схожих, связанных характеристик: например, любовь к Maroon5 могла быть заменена в "персоне" на любовь к песне "She Will Be Loved", а утверждение о том, что отец "персоны" работал на Ford, могло превратиться в утверждение о том, что близкий родственник работал в автомобильной компании. Это необходимо для того, чтобы расширить известные о "персоне" факты для составления возможного диалога. 

После этого двух людей, предоставивших "персоны", просили немного поговорить: каждому из них была назначена случайная "персона". В результате в базе данных диалогов оказалось 164 356 высказываний, и на основе этой базы исследователи обучили несколько компьютерных моделей (генеративную Seq2Seq и ранжирующую Memory Networks). Полученные модели чат-ботов затем оценили, попросив поговорить с ними реальных людей: диалог мог строиться либо вокруг "персоны" компьютера, либо вокруг "персоны" человека, либо вокруг обоих участников диалога. Разработанные модели обошли алгоритм, обученный диалогам на цитатах из фильмов, по беглости, вовлеченности в диалог и полноте беседы.

Фото: nplus1.ru 

Разработчики отмечают, что собранная база данных может быть полезна для создания новых и усовершенствования старых моделей чат-ботов и голосовых помощников. База данных также выложена в открытый доступ. 

Поддержание беседы на абстрактные темы - это скорее дополнение для голосовых помощников и чат-ботов. А их основной функцией кроме управления чем-либо и распознавания голосовых команд может быть даже оказание психологической поддержки: как Woebot, который при общении с пользователями использует методы когнитивно-поведенческой психотерапии. 

Как сообщала "Страна", фитнес-браслеты выдали секретные военные базы США, Франции и Турции. Аналитик Объединенного института анализа конфликтов Нейтен Рузер отметил, что на карте ясно видно положение и структура американских баз.

Отметим, что в Microsoft показали, как нейросеть может рисовать пользуясь текстовым описанием картинки.

Подпишитесь на телеграм-канал Политика Страны, чтобы получать ясную, понятную и быструю аналитику по политическим событиям в Украине.