Microsoft опубликовала огромную базу данных вопросов и ответов на них, которые были написаны живыми людьми. По задумке авторов, благодаря этой базе компьютеры смогут быстрее находить ответ на вопрос и отвечать более естественно на запросы пользователей. Проект Machine Reading Comprehension (Marco) предполагает возможность свободного использования базы данных 100 000 запросов из Bing и 200 000 вопросов и ответов, которые были взяты из открытых документов и веб-сайтов.
"Команда выбрала анонимные вопросы, основанные на наиболее интересных запросах по мнению исследователей. Ответы были написаны людьми, основываясь на реальных веб-страницах, а также проверены на точность", - заявляют в Microsoft.
Конечная цель проекта - формирование цифровыми помощниками правильных ответов на сложные и комплексные вопросы, а не простая отсылка на поисковые сайты, что характерно порой для Cortana и Siri. Базы данных MS Marco доступны для свободного скачивания при использовании в некоммерческих целях. Для компаний и исследователей предлагается коммерческая версия.