Или, точнее, жалобы на желудок: nEmesis отслеживает аккаунты посетителей в Twitter на наличие определенных слов, которые могут указывать на потенциальную проблему пищевого отравления. Тесты показали, что его выводы полностью совпадают с данными инспекторов здравоохранения.
Что нового?
Во время учебы в Университете Рочестера Адам Садилек использовал машинное обучение, чтобы ранжировать 3,8 миллиона твитов из Нью-Йорка в зависимости от встречаемости таких слов, как «еда» и «желудок». Затем краудсорсинговые работники выявили 6 000 твитов, которые, скорее всего, свидетельствовали о том, что человек, опубликовавший твит, перенес пищевое отравление. Набор данных сформировал ключевое знание, необходимое для системы Садилек, с умным названием nEmesis, чтобы определить как твиттеров с расстроенными животами, так и рестораны Нью-Йорка, которые могли быть или не быть ответственными. Дальнейшая оценка показала, что оценки здоровья, присвоенные ресторанам nEmesis, почти совпадают с оценками городских пищевых инспекторов.
В чем основная идея?
Возможно, неудивительно, что Садилек сейчас работает в Google, у которой есть собственный сервис, использующий данные поиска для прогнозирования вспышек гриппа. Использование социальных сетей для прогнозирования более крупных тенденций становится все более распространенным явлением, но Садилек с готовностью признает, что nEmesis открыт для злоупотреблений со стороны пользователей Twitter: «Люди начнут писать в Твиттере, что их вырвало, когда они узнают, что находятся рядом с McDonald’s». Он планирует представить свою систему на конференции Human Computing & Crowdsourcing в ноябре.