Интернет способствует исчезновению 95 процентов языков мира. Как это ни парадоксально, у Google может быть решение.
На каких языках вы говорите и отличаются ли они от языков, которые вы используете в Интернете? Согласно недавнему исследованию известного математического лингвиста Андраша Корнаи, менее 5 процентов языков мира перейдут в цифровую сферу, а Интернет способствует исчезновению остальных 95 процентов.
Корнаи в своем исследовании подсчитал, что 2 500 из более чем 7 000 разговорных языков в мире считаются находящимися под угрозой исчезновения и что подавляющее большинство языков (разговорных или других) не способны ни на что. он называет «цифровым восхождением». То есть они не сделают скачок к онлайн-употреблению в письменной форме. Корнаи утверждает, что если письменная форма языка является основным методом общения, то сделать цифровое восхождение проще. Чтобы выжить в ближайшие годы, языки должны функционировать в цифровом формате. К сожалению, многие из них уже мертвы.
Основным реестром данных о языках мира является база данных Ethnologue Летнего института лингвистики (SIL). По оценкам SIL, в настоящее время в мире существует 7 102 языка (декабрь 2015 г.). Из этого числа 916 (или 13 процентов) считаются вымирающими языками, а с 1950 года вымерло 367 языков, то есть скорость утраты пяти языков в год.
С точки зрения наших разговорных языковых способностей дела обстоят одинаково хуже. В Европейском союзе (ЕС) официально признаны 24 языка и более 60 региональных языков или языков меньшинств. По данным Европейской комиссии, немногим более половины европейцев (54 процента) могут поддерживать разговор как минимум на одном дополнительном языке, четверть (25 процентов) могут говорить как минимум на двух дополнительных языках и один из 10 (10 процентов) знакомы как минимум с тремя. В Америке статистика немного более удручающая, где только каждый четвертый человек может поддерживать разговор на втором языке. В целом, по данным лингвиста Стокгольмского университета Микаэля Парквалла, 80 процентов населения мира говорит на 1,69 языках, как родных, так и неродных на человека.
А какие языки правят Интернетом? В отчете ЮНЕСКО за 2009 год, в котором отслеживались языки веб-сайтов с 1996 по 2008 год, исследователи обнаружили, что 45 процентов контента в Интернете было на английском языке (хотя это могло быть вызвано тем, что поисковые системы индексировали только информацию на английском языке). Совсем недавно W3Techs сообщила, что 54 процента контента в Интернете находится на английском языке, что опережает следующий язык (русский) почти в 10 раз.
Согласно последним данным МСЭ, 43 процента населения мира, или 3 миллиарда человек, в настоящее время находятся в сети с тем или иным регулярным доступом к Интернету. И, если верить приведенным выше цифрам, большая часть контента, который они создают и с которым общаются, написана на английском языке. По оценкам Всемирного экономического форума, Google распознает большинство языков в своих службах поиска и перевода, при этом в поиске Google распознается 348 языков. Это 348 языков из более чем 7000, определенных SIL, или чуть более 5 процентов.
Интересно, что это 5-процентное число соответствует оценке выживания языка Корнаи. То есть, говорит Корнаи, около 5 процентов языков мира совершат цифровой скачок, остальные могут исчезнуть. В настоящее время Google позволяет выполнять поиск чуть более чем на 5% всех языков. Может ли увеличение количества языков, индексируемых Google для поиска, увеличить шансы этого языка на выживание? Это, безусловно, привлекательное направление для дальнейших исследований.