Самые распространенные языки мира

Самые распространенные языки мира
Казалось бы, зачем этот пост? Рейтинг самых популярных языков мира — вообще не секрет, гуглится за секунду. Но дело в том, что гуглится сразу несколько рейтингов, которые друг другу противоречат, и все из-за нечеткости двух определений: «владение языком» и собственно сам «язык». Будем разбираться.

Во-первых, сразу нужно отделить носителей языка (нейтивы, другим словом) — те, для кого он родной, с той условностью, что для еще не говорящих детей во младенчестве он номинально определяется по языку родителей — от вообще владеющих языком, включая выучивших его впоследствии. В социолингвистике для первых и вторых используются термины L1 и L2. При этом L2 — понятие крайне неточное, определить уровень владения неродным языком — та еще проблема. И где проходит граница, что этот уровень уже учитывается, а тот еще нет — очень спорный вопрос. К тому же изучают люди в основном литературные языки, а разговаривают — представьте себе — на разговорных. И эти множества в целом сильно не совпадают.

Поэтому рассмотрим только носителей-нейтивов, L1. Причем оставим за скобками билингвизм (когда для человека являются родными два языка) — в целях упрощения в лингвостатистике такого обычно не допускают, кое-как разделяя. И дальше возникает знаменитая проблема «язык или диалект». Понятие языка из чисто научного давно стало социальным, а впоследствии еще и политическим. Сложная история взаимоотношений стран, изменений их государственных границ, формирования наций из этносов, использования языков разными этносами и нациями привела к большой неразберихе. Нередки случаи, когда два языка считаются отдельными в одной стране и диалектами в другой.

И это даже не самое страшное — всюду разная дробность. В одних случаях для самоопределения носителями своего языка как самостоятельного достаточно минимальных отличий, обычно подкрепленных политическим статусом территории его распространения. В других — жители огромной территории идентифицируют себя как носителей одного и того же языка, но разных наречий — при том, что носители этих наречий с очень большим трудом понимают друг друга.

Для отделения мух от котлет в данном вопросе лингвисты используют термины «диалектный континуум» и «языковой кластер». Как для диалектов и наречий, так и для близкородственных языков с определенными условностями можно определить степень их сходства — обычно для этого в компаративистике (сравнительно-исторической лингвистике) берется показатель лексического расстояния (см. список Сводеша) — чем больше понятий обозначаются одинаковыми или хотя бы однокоренными словами, тем ближе. Если сравнить с наиболее знакомой нам генеалогической классификацией языков на примере индоевропейской семьи, то:

1) Диалектам одного языка, иногда имеющим статус разных языков соответствует лексическое расстояние более 95% (например, московские и поморско-архангельские говоры, румынский и молдавско-румынский);

2) Языкам одной подгруппы (иногда считающихся диалектами крупного языка) — более 85% (примерно таково расстояние, допустим, между русским языком Ярославля и украинским Винницы, либо португальским Порту и испано-каталанским «суржиком» Валенсии);

3) Языкам одной группы разных подгрупп — более 70% (русский и польский, английский и немецкий, испанский и французский и т.д.)

Если сравнить родные европейские языки с другими, откроется много интересного, для кого-то неожиданного. Арабский язык в вариациях от Марокко до Ирака — это фактическая подгруппа семитских языков, понимание между отдельными разговорными вариантами несколько затруднено (хотя литературные нормы сближены). Китайский язык — это даже не подгруппа, а группа: коренные жители Пекина, Шанхая и Гуанчжоу поймут друг друга ощутимо плохо, как испанец с французом и итальянцем. Спасает литературный язык (путунхуа) на основе пекинского наречия, который в обязательном порядке изучают в школах Китая, и письменность — они используют одни и те же иероглифы для одинаковых слов, хотя произносят их по-разному. В китайском макроязыке выделяется основной язык — мандарин (или северокитайский), на котором говорят 3/4 от всех китайцев, но и это в наших терминах не язык, а целая подгруппа. Еще можно привести пример хиндустани — общего названия для множества вариаций индоарийских языков, главные из которых — хинди (само по себе неоднородное понятие) и урду. По лексическим отличиям это также подгруппа в европейском понимании.

Воспользовавшись данными Ethnologue на 2019 год, параллельно сравнивая с некоторыми другими, составил три таблицы — соответственно топ-13 и два топ-11 языковых кластеров / диалектных континуумов: 70% (пример — славянский), 85% (восточнославянский), 95% (русский), естественно с округлениями — более точные данные получить затруднительно. Четыре крупнейших группы раскрашены для наглядности:


70%-континуум
Млн

1
Китайский
1300

2
Индоарийский
1250

3
Романский
850

4
Германский
525

5
Банту
400

6
Семитский
350

7
Славянский
275

8
Зондский
200

9
Тюркский
175

10
Ю.-дравидский
150

Иранский
125

Филиппинский
125

Японский
125



85%-континуум
Млн

1
Мандарин
920

2
Иберийский
690

3
Хиндустани
630

4
Английский
380

5
Арабский
320

6
Бенгальский
250

7
В.-славянский
190

8
Пенджабский
150

9
Японский
125

Огузский
110

Ц.-германский
110



95%-континуум
Млн

1
Испанский
460

2
Английский
380

3
Ю.З. мандарин
360

4
Ц. хинди
340

Бенгальский
250

Ц. мандарин
250

7
Португальский
220

8
Русский
150

С. мандарин
125

Японский
125

11
С.В. мандарин
110




Главный неожиданный вывод — на уровне языков в привычном нам понимании крупнейшим оказывается не какой-либо из вариантов китайского, а испанский, на котором говорит 2/5 обеих Америк. Затем — английский и только потом юго-западный вариант м​***аринского, крупнейший среди всех. Арабский, пенджабский, огузский (турецко-азербайджанский), центрально-германский (немецко-нидерландский) 85%-континуумы распадаются на части, к каждой из которых относится менее 100 млн человек. То же касается зондского (малайско-яванского), банту (куча языков южной трети Африки) и некоторых других 70%-континуумов. Вьетский (с основной частью в виде вьетнамского языка) подбирается к этой планке.

UPD. Примечания: южные наречия китайского макроязыка (в частности, юэ/кантонское) и магрибские варианты арабского (северо-запад Африки) по-хорошему соответственно до 70% и до 85% с центральными диалектами не попадают, но все-таки оставлю в таблице как есть, делая поблажку за счет «крыши» в виде литературной нормы, которая с течением времени сближает разрозненные диалекты. Особенно с ростом урбанизации, проникновения СМИ и Интернета, понятно почему.

Русский занимает восьмую строчку, как и в википедийном списке, но отличия в том, что здесь его обгоняют две разновидности китайского, зато без арабского, даже египетская версия которого сильно не дотягивает до попадания в число крупнейших языков мира.

Тема поста может быть интересна acer120, massimoling_ru, nikola_rus, pachem, oleg_lisowski и другим.

Также, если кто не видел, порекомендую материалы по теме языкознания — Смещение языковых полюсов, 15 самых важных языков мира.
13:20
535
Здравствуйте!
Система категоризации Живого Журнала посчитала, что вашу запись можно отнести к категориям: Литература, Общество, Политика.
Если вы считаете, что система ошиблась — напишите об этом в ответе на этот комментарий. Ваша обратная связь поможет сделать систему точнее.
Фрэнк,
команда ЖЖ.
Из перечисленного подходит только «Общество»
С. мандарин — это пекинский диалект?
16:32
По признаку 95% испанский, может быть, и цельный, но известно, что фонетика в разных испаноязычных странах отличается настолько, что субтитры требуются, иначе очень утомительно.