Що таке сучасна лінгвістика. Лекція в Яндексі

У лінгвістиці співіснують дві традиції опису мови: одна з них, до цих пір продовжує традицію шумерів та древніх греків, фрагментарно описує мову — окремо фонетику і фонологию, окремо морфологію, окремо синтаксис і т. д. Інша, йде з четвертого — п'ятого століть до н. е. від індійського ченця Паніні, описує мову як інтегральне ціле — опис фонетики, морфології, синтаксису, семантики будується у вигляді взаємно орієнтованих правил, за допомогою яких з елементарних мовних одиниць будуються тексти.

Саме останній спосіб опису мови використовується в складних інженерно-лінгвістичних моделях, що дозволяють автоматично переводити тексти з однієї мови на іншу. Про них і про їх розвиток і піде мова на лекції.



Лектор Олександр Миколайович Барулін — співробітник Інституту мовознавства РАН. Закінчив відділення структурної та прикладної лінгвістики філологічного факультету МДУ їм. М. В. Ломоносова. Навчався в аспірантурі Інституту сходознавства АН СРСР, захистив дисертацію на тему «Теоретичні проблеми опису турецької іменний словоформи» (1984). Працював в Інституті сходознавства 12 років. У 1991 році спільно з В. К. Фіном і Д. Р. Лахути організував факультет інформатики РДГУ і очолив створене на цьому факультеті відділення теоретичної та прикладної лінгвістики. У 1992 по проекту Барулина був організований факультет теоретичної і прикладної лінгвістики — він став деканом цього факультету, а також завідувачем кафедри теоретичної і прикладної лінгвістики.

Під катом — детальна розшифровка лекції.

Мене звуть Олександр Миколайович Барулін. Я старший науковий співробітник інституту мовознавства Академії Наук, в минулому я був деканом факультету теоретичної прикладної лінгвістики. Я його, власне, і організовував в РДГУ і був завідувачем кафедри з такою ж назвою.

Сьогодні ми з вами поговоримо про сучасній лінгвістиці, про те, що вона вже вміє, і що їй ще належить навчитися робити. Мову вивчають, в принципі, двома способами. Перший спосіб — це вивчення мови для того, щоб потім на ньому говорити. Це всім відомий метод, і дуже часто лінгвістику ототожнюють з наукою, яка займається саме тим, що розробляє методи хорошого викладання різних мов. Другий спосіб вивчення мови потрібен для того, щоб зрозуміти, як він влаштований. Друга мета для лінгвістики є набагато більш важливої і переважно лінгвісти займаються цією проблематикою. Вивчають, як влаштований мову, як влаштована мова і як, власне кажучи, мова з'явився, як він розвивався і так далі. Ось такі найголовніші питання, які хвилюють лінгвістику.

Сучасна лінгвістика влаштована дуже складно. Для чого людині мову? Мова – це звук і сенс. Якщо ми візьмемо просто яку-небудь мова, то можна буде користуватися ось такою схемою: істотно хтось, у якого є певна мета комунікації, є канал комунікації – звук, через звук передається деяка інформація, і є адресат, який це все сприймає і певним чином на це реагує. Є ще умови комунікації, є код – співвідношення, як раз означає означального та означуваного. Якщо розбити мова на якісь одиниці, то вийде, що кінцевою одиницею буде один знак. Морфема – найменша значуща частина слова. Вона і буде найменшим знаком, на якого в розбитті мови можна дійти до самого маленького, і це буде та сама маленька морфема. Але, з іншого боку, якщо я говорю з кимось ще, то мова вплітається ще теж дуже багато різного роду сигналів, з яких можна отримати певну інформацію.

Сигнали влаштовані зовсім не так, як влаштовані мовні знаки. Давайте виявимо перше властивість мови, що відрізняє його від всіх видів комунікації тварин. Перша властивість полягає в тому, що є три базових компоненти мовного знака: звучання, деяка інформація про клас об'єктів, які позначаються, і сам конкретний об'єкт, який позначається. Стародавні греки, які встановили ось це вперше, вони говорили так: знаки – є три складових. Перша складова – це те, що ми чуємо і варвари чують, друга складова – це те, що ми бачимо і варвари бачать, а третя складова – це, що ми розуміємо, а варвари не розуміють. Це три компоненти, які зазвичай входять до мовної знак, і, при цьому, означають мовного знака будуються комбінаторним способом, тобто окремі звуки комбінуються, витягуються в ланцюжок якусь і тільки ця ланцюжок звуків може позначати цілісний зміст. Такий лінійної комбінаториці немає ні в одній мові тварин.

Чим ще мова відрізняється від комунікативних систем тварин? Чому це, власне кажучи, унікальне явище? У людини на мові можна говорити абсолютно про будь-яких ситуаціях, видах людської діяльності. Він обслуговує всі види людської поведінки. Більш того, процес говоріння спирається на спеціальний вид поведінки, якого у тварин немає. Цей тип поведінки називається мовним поведінкою. Мова спирається на мовленнєвий поведінка. Що ще входить у мовну поведінку? По-перше, пози. За позі дуже багато можна зрозуміти, як людина ставиться до співрозмовника, які між ними стосунки і так далі. По-друге, цього немає у тварин, у всякому разі коли вони використовують звукову комунікацію, то цього у них теж немає. Людина, для того, щоб говорити з іншою людиною, до нього підходить, зупиняється на певній відстані від нього, і вони починають говорити. Виявляється, у різних країнах ось це саме відстань трошки різне, тобто у Сполучених Штатах це десь 90 см приблизно, а в Японії – 45. В одній з книжок, де описуються ці компоненти мовної поведінки, зокрема, описується як. Цього у тварин точно немає.

В принципі, ви знаєте, що мова зазвичай супроводжується жестами і мімікою. Причому, що цікаво, це незалежні комунікативні системи у людини, і вони можуть нести рівно протилежну інформацію, тому що людина говорить, якщо він, припустимо, бреше. За очима і жестами, мімікою людині простежити важче. Тепер давайте ще на одну річ звернемо увагу: якщо ми візьмемо шимпанзе і взагалі великих людиноподібних мавп, у них теж є жестикуляція. Жестикуляція – досить молода комунікативна система. Тобто у більш дрібних мавп, нечеловекообразных, у них жестикуляція відсутня, а от у великих мавп вона як раз є і, більше того, є провідною системою комунікації, не звукова, а жестовая. Всі комунікативні системи, які є у тварин і у мавп в тому числі, розподілені якимось чином за видами поведінки, яких у них бувають, тобто, припустимо, якщо маються на увазі агресивні сигнали, то, значить, — це одна система, яка ніяк не пов'язана з іншими системами комунікації. Якщо це, скажімо\. Якісь харчові сигнали, три харчових сигналу, вони протиставлені один одному, але саме в цій вузькій системі знаків. Якщо мається на увазі, скажімо, сигнал небезпеки, то це теж якісь три сигнали, які ніяким чином не пов'язані з іншими видами комунікації і, відповідно, вони теж один одному протиставлені, але з іншими ніяк не пов'язані. Виходить, що у тварин комунікація сильно залежить від поведінки, більш того, вона є частиною тієї поведінкової програми, яку обслуговують ці самі сигнали. Це кардинальна відмінність від мови.

Зауважте, мова універсальний, а комунікативної системи тварин не універсальні, розподілені за видами поведінки і, відповідно, ніякої спільної комунікативної системи, яка могла б дозволити мавпам передавати один одному інформацію на абсолютно будь-які теми, ось такий ось комунікативної системи ні в мавпи, у більш низько розташованих на еволюційних сходах, нічого такого немає.
Крім усього іншого, мова відрізняється ось якого цікаво деталлю. Ми з'ясували, що в мові є дві частини: одна звучить, це означає, інша, семантика, яка охоплює змістову частину якусь і преференційну частина, тобто ті об'єкти, які позначаються за допомогою мовних знаків. Це дві абсолютно різні стихії. Вони повинні якимось чином пов'язані.

У 1959 році вийшла книжка мого вчителя, Миколи Івановича Жилкіна, який вперше визначив, що взагалі-то мова управляється з двох різних центрів. Насправді, кожному, хто знайомий якимось чином з тим, як працює мозок і з тим, як працює мозок під час промови, повинно бути зрозуміло, що мова спирається на дихання. Тобто, перший компонент мовленнєвого апарату – це дихання. До речі, дихання управляється з стовбура мозку, а вся артикуляція, навпаки, управляється з кори. Значить, ось уже два різних центру, які у принципі, повинні бути узгоджені для того, щоб у вас вийшла цілісна мова. Для того, щоб все було там, дійсно, пов'язане, дихання спирається на свої якісь ритми, є ритми дихання, є ритми мислення. Ритми дихання і мислення один від одного не залежать, але в мовленні якимось чином узгоджувалися, потрібна спеціальна система. Ця спеціальна система як раз виходить завдяки тому, що з кори в підкірку так званий ганглій йдуть так звані проекції, є певні зв'язки з кори в підкірку і ось, завдяки цим зв'язкам відбувається координація дихання і мислення, до цього ще потрібно артикуляцію додати. Коли все це узгоджується, тоді виникає мова.

Справа в тому, що у людини, коли він говорить, використовується особливий режим дихання. Є режим дихання, коли ми стоїмо, знаходимося в спокої, є автоматичний режим дихання, коли ми спимо, є режим дихання, коли ми біжимо і узгодимо кількість кисню, що нам потрібно для того, щоб встигати бігти, є ще мовний режим дихання. У чому його особливість? Коли людина говорить, він говорить на видиху на відміну, до речі, від мавпи. Мавпи можуть говорити на вдиху і на вдиху, їм абсолютно все одно, а людина говорить тільки на видиху. Якщо тільки видихати, то настає гіпоксія – це нестача кисню, який повинен надходити в мозок, і тоді мозок починає якось відключатися. Для того, щоб уникнути цього ефекту, людина, виявляється, на видиху робить подвдох. У цьому полягає особливість мовного дихання.

Виходить, є деяка стихія в людині дихальна, є механізм дихання, який працює за якимось своїм принципам, є механізм мислення, який працює за своїми принципами. Є механізм управління м'язами, артикуляції, який працює за своїми принципами. Все це потрібно з'єднати. Це розходження між дихальними і розумовими ритмами, воно добре відображається в мові. Є дві лінії ускладнення одиниць у мові, які вам добре відомі, тобто з одного боку, ось з найменших одиниць, з яких будується означають мовних знаків будуються склади. Склади не мають ніякого значення. Це одиниці, орієнтовані на ритми дихання. За складами зі складів будуються так звані акцентні слова. Наприклад, «в домі» — це одне акцентне слово, а граматичних слів два «в» і «будинок». Між ними можна поставити деяке слово, яке не зруйнує синтаксичних зв'язків між «в» і «будинок». «У великому домі» між «в» і «будинку» зберігається та ж синтаксична зв'язок і тоді, коли було просто «в хаті».

З акцентних слів будуються так звані такти – ланцюжок акцентних слів, розташовані між двома паузами. З тактів будуються вже періоди. Ця одна лінія ускладнення мовних одиниць, а інша лінія ускладнення мовних одиниць з фонем будуються означає морфова, найменших одиниць, з яких будуються одиничні значення, мораль будуються граматичні слова. Тут два граматичних слова «в» і «будинок». Вони вже якраз зобов'язані мати сенс і поєднання граматичних слів, словосполучення, теж повинно мати сенс на відміну від фонетичних слів. Наприклад, «я б» об'єднується в одне фонетичне слово, у нього один акцент, до нього і після нього можна поставити паузу, а всередині не можна. Це акцентне слово, в принципі, складається з двох компонентів, які за змістом пов'язані словами. Або, припустимо, німецька «in dem» об'єднується в артикль, плюс прийменник «in». Тут з'єднуються один з одним два компоненти, які належать до двох абсолютно різних одиниць, і вони абсолютно не пов'язані між собою за змістом.

Таким чином, виходить, одна лінія, яка орієнтована на ритми дихання, я її буду називати ліній метричних одиниць, а друга лінія — знакових одиниць, тобто одиниць, які утворюють певний смисловий єдність, позначають деякий зміст і певний предмет.

Те, що я вам розповів, це предмет занять спеціальної галузі лінгвістики, яка називається філософією мови. В принципі, лінгвістика, як ви розумієте, займається шалено складним об'єктом. Її мета полягає в тому, щоб описати, як влаштований мову, як він працює, яка його історія. Завдання ця шалено складна, і вона розбивається на окремі дрібні завдання, яким присвячені окремі лінгвістиці дисципліни, які займаються своєю частиною якоїсь проблеми. Філософія мови займається тим, що вона визначає, яку роль відіграє мова в людському житті, вона займається тим, що визначає, як я вже сказав, чим відрізняється мову від інших комунікативних систем.

Великий російсько-польський Куртенер лінгвіст запропонував розбити всі дисципліни, які займаються мовою, на дві частини: синтетичну та аналітичну лінгвістику. Синтетична лінгвістика займається правилом побудови штучних мов. Вони бувають двох видів. Бувають апостеріорні мови, які побудовані на базі кого-то вже існуючого мови, або за аналогією з природною мовою, коли винаходяться все деталі, які необхідні для створення такої мови, але за тією схемою, яка вже існує в природі. Крім того, є ще апріорні мови, тобто, коли людина винаходить мову від початку до кінця. Є ще філософські мови, являють собою певний логічний код. Наприклад, одна число відповідає одному компоненту сенсу, потім вони складаються. Слово «мама» розбивається на два компоненти — батько жіночої статі. «Тато» розбивається на два компоненти — батько чоловічої статі. Ці два компоненти позначаються спеціальними числами, які можна з'єднати й одержати целостностей слово «мама» і «тато». Так влаштований приблизно філософський мову.

В принципі, це не дуже вдалий винахід людства, тому що там, в цих філософських мовами, не враховується величезна кількість абсолютно необхідних мовних характеристик. Виходить, враховується тільки сенс, вираження штучно побудовані, як позначаються кордони мовних одиниць незрозуміло. Тобто, може бути вбудовано-поняття досить складне, то воно буде складатися з неозора великої кількості чисел, які відповідають різним ідеям. Сприймати такі багатокомпонентні освіти людина все одно не може.
У 17 столітті було ціле поняття, винахід штучних мов, тоді всі говорили про сприйняття штучних мов. Тема була надзвичайно модною. Нею займалися самі великі уми людства. Лемниц, Ньютон, Уілкінс винаходили штучні мови. Хімік Бойль сам мов не винаходив, але вчив всі штучні мови, які є і винаходили інші. Він скаржився, що на них практично розмовляти неможливо. В них не можна було писати філософських трактатів, але вже, тим більше, писати віршів.

Потім, згодом, філософські мови відіграли важливу роль у винаході першої мови — чистого сенсу. Його винайшов Готовий Фрэген (один із засновників математичної логіки) і назвав його «Бигрюстшрифт» — алфавіт понять. Ідея полягала в тому, що був деякий набір вихідних понять, з допомогою яких можна було побудувати будь-яке вираження логічного мови в деякому роді, з висновком і так далі.
Від цієї штучної мови пішли всі мови програмування. Це чудовий зразок для створення корисних мов, які призначені для вузько спеціальної мети. На філософських мовами говорити було не можна, але, тим не мненее, вони отримали деяке застосування.

Другим напрямком лінгвістичних досліджень синтетичної лінгвістики є реанімація, або ж відродження, стародавніх мов, на яких можна було говорити. Треба відзначити, що один експеримент виявився вдалим — це відродження івриту, що почалося в 1879 році, призвело до того, що в Ізраїлю з'явився державна мова, на якому раніше говорити було не можна. Він відображав стародавні поняття, була мовою культу, тобто, багатьох слів, які потрібні були для відображення сучасних понять, там не було. Давайте перейдемо до самому важливої частини лінгвістики, аналітичної лінгвістики. Насамперед, аналітичну лінгвістику треба розділити на два складних компонента. Перший компонент, диахроническая лінгвістика — методика реконструкції прамов, які не дійшли до нас у письмовому вигляді, не мали писемності зовсім. Лінгвісти вміють за даними мов реконструювати прамови. Наприклад, у нас є російський, український, білоруський, що відбулися з давньоруської. Давньоруський, на щастя, був письмовим, і ми можемо перевірити наші методи реконструкції прамов. Латинською можна перевірити методи реконструкції за праязыкам, з романських мов (іспанської, італійської, французької, ретороманскому, румунській і т. д. На цих мовах методика була відпрацьована і перевірена, з'ясувалося, що вона працює досить добре. Тоді приступили до реконструкції мови, який не дійшов до нас ні в якому вигляді, а саме, прадіда європейського мови, тобто мови спільного для: романських, германських, слов'янських, іранських індійських мов ( не всіх, а деяких). Була розроблена спеціальна методика, яка полягає в тому, що в мовах виявляються регулярні відповідності, тобто, береться два споріднені слова і ми спостерігаємо за тим, чим вони відрізняються. Наприклад, в російському говорять слово «ліс», а в українському «лис». «Е» регулярно відповідає «і», кликав деякими винятками, які пов'язані з тим, що в давньоруській мові був звук, який зник і в російському і в українському, а саме «ять». Така методика дозволяє реконструювати мови досить глибоко.

Найдавнішим з тих мов, який більш-менш реконструйований, є ностратичної реконструйований прамова. Справа в тому, що лінгвісти навчилися визначати час розпаду прамови. Вони вміють визначати, наприклад, коли розпався праіндоєвропейської і праурало-алтайський мови і так далі. Час розпаду ностратичної прамови – 14-15 тис. років тому, тобто, це вже льодовиковий період. Компаративісти, які цим займаються, охоплюють все поступово. Наприклад, корінні мови Африки зараз поки що не охоплені реконструкцією, хоча попередні дані показують, що час розпаду, скажімо, пракойсанского мови де-то вже 20 тис. з гаком років, але це неточні дані. Важливо знати, на які терміни, на який час орієнтуватися тим, хто досліджує проходження мови, коли він виник приблизно. Результати робіт компаративистов говорять про те, що час виникнення мови приблизно відноситься до 50-40 тисяч років тому. При тому, ми знаємо, що людина – розумна з'явився десь 200 тис. років тому. Зараз по Y-хромосомі визначили, що навіть ще раніше – 300 тис років тому. Мовою він опанував набагато пізніше. До цього часу, 40-50 тис. років тому, груп homo sapiens було вже досить багато. Вони розселилися по всій земній кулі. Не було такого, що всі мови Землі відбулися з однієї мови, тобто вони вже були сильно розосереджені і, швидше за все, що незалежно, виникли кілька з різних мов.

Я вам розповів про компаративістики і глоттохронологіі – наука, яка визначає вік розпаду прамови. У диахроническую лінгвістику входить етимологія – наука про походження слів, морфем, ідіом. Існує історична граматика, яка займається письмовим періодом розвитку мови. Наприклад, історична граматика російської мови починає своє дослідження з давньоруської мови і простежує, як змінювалася граматика протягом того часу, коли з давньоруської мови виходив вже сучасний російську мову.
Крім цих дисциплін, у яких досить сувора методика, в діахронічної лінгвістики належить глоттегоника – займається походженням мови, глоттогенезом. Тут можна назвати два періоду, коли займалися глоттогенезом. Це період до 70 — років буквально минулого століття і період після цього. До 70 — х років 20 століття цією темою займалися, грубо кажучи, приклавши палець до лоба, тобто ніяких доказів не вимагалося від людини. Він просто припускав, що «а от мова виникла ось таким чином». Особливо популярні були висловлювання щодо появи першого слова.

Насправді, походження мови являє собою безперервний ланцюг зміни комунікативних систем, починаючи від наших предків, які нічим не відрізнялися від мавп, до homo sapiens і проміжних видів комунікативних систем, яких все-таки не одна тисяча. Тобто треба простежити ланцюжок, для того, щоб зрозуміти, як з звукової системи мавп виник людський мову, треба простежити ланцюжок комунікативних систем, яка поступово наближається за своїми характеристиками до людської мови. Процес цей був тривалим. За моїми дослідженнями, виходить, що перший зсув у бік мови почався після homo habilis. Це, приблизно, два і три десятих мільйонів років тому. Деякі дані говорять, що ще й раніше, — два і п'ять десятих мільйонів років тому. Як я вже сказав, людську мову з'явився десь 50-40 тис. років тому. По величезному проміжку часу йшла поступова трансформація комунікативних систем тварин в людську мову, тобто це дуже тривалий процес, який супроводжувався фізіологічними і нейрофізіологічними змінами, диханні, в артикуляційному апараті.

Досить сказати, що мавпи не володіють мовою, тобто мова у них в комунікації не бере участь. Повинен був пройти певний період, щоб людина опанувала мовою і почав відтворювати звуки не так, як мавпи. Мавпи виробляють звуки так званими вісцеральними м'язами — внутрішніми м'язами, які, зокрема, характеризуються тим, що ними не можна керувати, не можна їх коригувати. Вони відбуваються на повному автоматі, тобто почалася програма, поки вона не закінчиться, ніяк втрутитися і відкоригувати цей процес не можна. Артикуляційний апарат людини повинен був перейти від вісцеральних до скелетних м'язів, управління якими вже можна коригувати. Тільки тоді, коли людина почала управляти мовою з допомогою скелетних м'язів, почався рух вже до сучасного мові.

Зараз це шалено складна область, яка надзвичайно бурхливо розвивається на Заході і майже не як у нас. Тобто, в Росії всього три людей, які займаються цим серйозно, а на Заході вже видають підручники.

Тепер перейдемо до синхронної лінгвістики. Це найважливіший і складний компонент в лінгвістиці. Я розповім про теоретичну лінгвістику. Теоретична лінгвістика як раз розбивається на під-дисципліни. Дисципліни, які займаються метричними одиницями, тобто складом, акцентним словом, тактом і періодом. Треба сказати, що це дуже важливий аспект лінгвістики, яким, в принципі, вона ще не дуже-то почала займатися.

Саме розрізнення цих двох напрямків ускладнення одиниць, як я вже сказав, запропонував Бодуен де Куртене в 1915 році, але після цього ще було кілька таких же точно пропозицій без посилань на нього, зокрема, Реформатський пропонував те ж саме. Був такий чудовий лінгвіст, Пєшковський, який пропонував те ж саме, і ще був американський лінгвіст Хоккет, який теж зробив таку ж пропозицію. Але ніяких послідовників рівного у цьому напрямку у них не було.

При цьому, чудовим чином, виявляється, що в різних мовах ці метричні і сигнификативные одиниці мови збігаються на абсолютно різних рівнях. Скажімо, у старокитайському мовою відразу збігається склад і морф. Оскільки морф збігається зі словом, там є лише один вид морфеми — це коріння. Жодних афіксів, ніяких клитик у старокитайському мові немає. Вся структура давньокитайського мови залежить рівно від цих двох речей: від того, що там збігається склад і морф, і від того, що жодних інших типів морфем, крім як кореневих немає. Відповідно, в цей мові немає ніякої парадигми відміни, дієвідміни. Функція одиниць визначається порядком слів. Є мова, наприклад, брувантъеву, це мовою збігається фонетичне і граматичне слово, а склад і морф вже не збігаються, тобто можуть бути односкладові морфи, двоскладові морфи, але більше, ніж двоскладовій граматичних, фонетичних слів там немає. Ось вони там збігаються.

У багатьох мовах Полінезії вже два типи морфем є, а саме: клітики, це типи наших прийменників або часток типу «ж», «к», «б», коріння, але немає афіксів ніяких. У них теж немає відмін, спряжений, але зате всі функції позначень синтаксичних зв'язків між одиницями позначаються клитиками. У них зовсім інше поняття про слово повинно бути зовсім, повинна бути абсолютно по-іншому влаштована граматика, ніж, скажімо, у старокитайському або російською мовою. Існують мови, у яких є всі, тобто суфікси, клітики і коріння. При цьому, там є мови, в яких є тільки префікси, як наприклад, мови банту. Всі граматичні показники там виражаються префиксальном способом, а не суффиксальном, як у нас, наприклад. Це правоветвящиеся мови. Є мови тюркські, в яких немає ні одного префікса, але зате є суфікси, тобто, те, що стоїть після кореня. Це вже левоветвящиеся мови. Є мови, в яких є префікси і суфікси — це мови, розгалужені у обидві сторони, коли будується слово.

Таким чином, виходить, що ця інформація про те, як співвідноситься одиниця метричного типу з одиницями знакового типу, божевільна важлива. Для побудови граматики, для побудови типології мов, власне кажучи, для того, щоб зрозуміти на які класи мови поділяються, як вони можуть бути влаштовані, і як у них влаштовані причинно-наслідкові зв'язки. Тут лінгвістика знаходиться в самому початку шляху, їй ще потрібно навчитися описувати метричні одиниці, але зате знакова одиниця описується дуже давно. Цій частині лінгвістики більше чотирьох тисяч років.

Справа в тому, що перші граматичні описи були виявлені у посібнику для переписувачів в Шумері. Найдавнішим з них — 2,5 тис. років до нашої ери. Шумерська лінгвістика за своїм типом була успадкована греками, і особливість її полягала в тому, що там відомості про мову задавалися списками. У Шумері була така філософія: світ являє собою номенклатуру предметів (греки успадкували цю філософію, у них теж світ складався так само), а мова — це номенклатура предметів або імен дій. Це перша лінія розвитку лінгвістики.Вона займалася, в основному, тим, що вивчала те, як одиниця співвідноситься у нас в пам'яті. У мові є алгоритми, які організовують весь мовний матеріал в пам'яті і є деякі механізми, які дозволяють будувати з одиниць більш складні одиниці, аж до великих-великих текстів.

Перший тип мовного матеріалу називається парадигматикой, а другий синтагматикой. Все те, як у нас організовано в пам'яті, — це парадигматика. Греки, в основному, займалися парадигматикой. Будь-яка мова, де є схиляння і дієвідміна, граматика такого роду мов являє списки. Перша лінія, що йде від стародавніх греків і римлян — побудова граматичного опису мови. Друга лінія йде від індійського ченця, який живе в п'ятому столітті до нашої ери (приблизно).

У індійців великі проблеми з хронологією, тому що до певного моменту вони ніяк не вимірювали. Припускають, що Палану живий в 4 — 5 столітті до нашої ери. Палану підійшов до вивчення мови абсолютно іншим способом, він вважав, що мова — це не номенклатура предметів, а деякий творчий механізм, який дозволяє будувати тексти. Цей механізм складається з правил і одиниць, який, по-перше, з простих одиниць будує складні, а, по-друге, співвідносить елементи сенсу до елементів означає. Це зовсім інший принцип пристрою опису мови. Паніні випередив європейську лінгвістику на 2 з гаком тисячі років. До методики, опису мови, якою користувався Паніні, європейці прийшли в 50-е роки 20 століття. Прийшли вони до цієї методики абсолютно випадково. З допомогою машини ЕОМ. Стався Джорджтаунський експеримент по перекладу з англійської мови на російську. Це означало нову еру в розвитку лінгвістики теж.

Після цього експерименту, інженери зрозуміли, що без лінгвістів їм не обійтися, і залучили до завдань створення машинного перекладу лінгвістів, але відразу ж виявилося, що той спосіб опису мови, який лінгвісти володіли для машинного перекладу абсолютно не годиться. Стали розробляти загальну схему машинного перекладу: є мова, з якого переводиться щось, спочатку це «щось» перекладається на мову-посередник, який є спільним для мови-джерела і для цільової мови, і потім з мови посередника проводиться переклад вже на цільову мову.Для того, щоб переклад був здійснений, потрібна була нова процедура, старі парадигми ніяк не годилися. Точніше вони не годилися.
Самий великий лінгвіст сучасності, який, до речі, до деякої міри повторив той же науковий подвиг, як і Паніні, це Андрій Анатолійович Залізняк. Він зробив опис російської мови за старими методами (парадигматический метод), який охоплював весь матеріал російської мови. Він зробив російське іменна словоизменение. Ця книга і потім граматичний словник російської мови ліг в основі всіх систем машинного перекладу. Таким чином, була забезпечена перша частина завдання, тобто є одиниця, (відомим чином один з одним співвідноситься) і тепер, за допомогою яких ці одиниці можна було складати речення, словосполучення і перекладати з однієї мови на іншу. Для цього потрібно створити сучасний синтаксис, тому що словоизменение — вчення про граматичні категорії, про зміну слова за відмінками, числами, родами визначає узгодження даного слова з іншими словами. Синтаксису такого Залізняк не описав.

Для того, щоб просунулася ця ідея була використана теорія американського вченого-лінгвіста Хомський, або як американці вимовляють Чемпски, як раз показав, як математично строго побудувати синтаксичну структуру пропозиції, будь-яку, і винайшов математичний апарат, який дозволяв би структуру породжувати, синтезувати. На базі цього вчення Хомського був створений другий компонент машинного перекладу, а саме синтаксичний. Ще потрібно до всього семантичний компонент. Семантичний компонент у системах машинного перекладу зараз практично не розроблений. Самий просунутий варіант зробила компанія ABBYY, в якій я працював, як раз семантика там відображається у вигляді ієрархічного дерева приблизно за прикладом того, як той же самий Уілкінс побудував свій філософський мову. У Уїлкінса було 48 класів, вони побудовані ієрархічним методів.

Таким чином, є дві традиції опису знаковою частини, знакового компонента, мовної системи і тут все розбивається вже на ті компоненти, з яких влаштовано знак, тобто означають, там три дисципліни: фонетика, фонологія і морфологія. При описі знакових одиниць мови, є рівно три проблеми, які треба вирішити в теоретичній лінгвістиці. Перша проблема полягає в тому, що конкретних звуків, за допомогою яких відображається та чи інша думка, нескінченне число. Відразу стає зрозуміло, людина орієнтується не на нескінченну різноманітність звуків, а на якісь класи, яких він повинен запам'ятати, і їх повинно бути обмежене число, але це вже будуть абстрактні одиниці.

На прикладі, ми бачимо, що слово «простирадла» записано в транскрипції. У першому випадку, тут є ударний звук «о» — простирадла. На цьому ж слові «простирадло» виникає інший звук. Цей звук називається редукованим або, використовуючи французький термін, — «шва». У слові «простынка» замість «шва» і «про» йде «а» закрита. Тобто, в конкретних позиціях, в яких, зокрема, залежить від наголосу або від твердості чи м'якості приголосних, звук при проголошенні змінюються, але ми знаємо, як він змінюється, варіантів його зміни не так багато. Завдяки цьому, нам відомі всі варіанти зміни цього самого звуку. Це залізний алгебраїчний закон.

Дисципліна, яка займається означає, називається морфонологія, займається історичними чергуваннями. Кожне дане стан мови — це результат її розвитку в історії. При цьому, кожен раз, у будь-якому абсолютно мовою діє основне правило проголошення в даному мовою. Потім з'являється нове правило, яке починає поступово розширювати свою сферу дії, але ніколи ці два кінчика не з'єднуються, тобто витіснення старих правил не відбувається. Тому, в російській мові величезна кількість чергувань залишилося від колишніх часів. Вони не предсказываются ніяким фонетичним контекстом. Морофонология займається історичними чергуваннями, які прийшли в сучасну мову з іншого часу.

Наступна група дисциплін — це вже науки про цілісних знаки: це морфологія і синтаксис. Морфологія займається тим, як влаштовані найменші значущі частини слів — морфеми, і як з морфем будуються цілісні слова. Перший джерело морфологічного словника — запозичення. Другий джерело — звуконаслідування, або идиофоны, які народжуються на ходу. Третій — скорочення. Від скорочення ВНЗ можна утворити «вузи», «вузівський», «вузовка» і так далі. Деякі скорочення перетворилися в корінь, і ми починаємо цей корінь використовувати так само, як і інші нормальні коріння в структурі «приголосний, голосний, приголосний».

Те ж саме відбувається і зі словом, словник нескінченний. По-перше, існують якісь циклічні конструкції. Візьмемо смішне слово «знущатися» від нього можна утворити «баламучення», від «ерничества» перетворити «ерничествовать» і так далі. Це нескінченний ряд. Конструкцію «сіро-зелено-буро-малиновий» можна розтягувати без кінця. В принципі, кількість слів у мові нескінченно. Є такі мови, в яких основи слів утворюються так само легко, як і словосполучення. Я вам наведу приклад з алюторского мови, де використовується вираз «я годую дитину м'ясом». Те ж саме можна сказати і аналітичним способом, тобто всі слова вимовити окремо. Це буде означати, що я займаюся конкретною дією, годуванням конкретної дитини, конкретним м'ясом. Якщо ви хочете сказати «я займаюся м'ясо, дитини, годівлею, той тут вже використовується другий спосіб передачі слів.

У цьому мові, як ви розумієте, слова також утворюються, як і словосполучення. Обчислити всі слова цієї мови неможливо. Можна тільки скласти граматику, за якими будуються слова. Це завжди було великою проблемою. Що краще: складати списки або винаходити правила, за якими будуються ті чи інші вирази. З'ясовується, що морфеми у слові з'єднані такими ж синтаксичними виразами, як і лексеми, тобто слова в реченні. Тільки стосунки між морфемами в слові на порядок менше, ніж відносин, якщо їх обчислювати. Далі вже йдуть вивчення семантичної частини мови. Семантика займається з одного боку смислами, з іншого досліджує як преференційний компонент. Є ще теорія тексту, яка намагається описати, по яким законам влаштований великий цілісний текст.

Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.