Использование твитов для выявления подозрительной еды в ресторане

Или, точнее, жалобы на желудок: nEmesis отслеживает аккаунты посетителей в Twitter на наличие определенных слов, которые могут указывать на потенциальную проблему пищевого отравления. Тесты показали, что его выводы полностью совпадают с данными инспекторов здравоохранения.

Что нового?

Во время учебы в Университете Рочестера Адам Садилек использовал машинное обучение, чтобы ранжировать 3,8 миллиона твитов из Нью-Йорка в зависимости от встречаемости таких слов, как «еда» и «желудок». Затем краудсорсинговые работники выявили 6 000 твитов, которые, скорее всего, свидетельствовали о том, что человек, опубликовавший твит, перенес пищевое отравление. Набор данных сформировал ключевое знание, необходимое для системы Садилек, с умным названием nEmesis, чтобы определить как твиттеров с расстроенными животами, так и рестораны Нью-Йорка, которые могли быть или не быть ответственными. Дальнейшая оценка показала, что оценки здоровья, присвоенные ресторанам nEmesis, почти совпадают с оценками городских пищевых инспекторов.

В чем основная идея?

Возможно, неудивительно, что Садилек сейчас работает в Google, у которой есть собственный сервис, использующий данные поиска для прогнозирования вспышек гриппа. Использование социальных сетей для прогнозирования более крупных тенденций становится все более распространенным явлением, но Садилек с готовностью признает, что nEmesis открыт для злоупотреблений со стороны пользователей Twitter: «Люди начнут писать в Твиттере, что их вырвало, когда они узнают, что находятся рядом с McDonald’s». Он планирует представить свою систему на конференции Human Computing & Crowdsourcing в ноябре.