Квантитативна лінгвістика
Квантитативна лінгвістика (англ. quantitative linguistics) — це розділ загальної лінгвістики і, зокрема, математичної лінгвістики. Квантитативна лінгвістика (КЛ) займається дослідженням процесу вивчення мови, її зміни і сфери застосування, а також структури природних мов. КЛ досліджує мову за допомогою статистичних методів; її кінцева мета — сформулювати закони, за якими функціонує мова і, в кінцевому рахунку, побудувати загальну теорію мови у вигляді сукупності взаємопов'язаних законів функціонування мов Спеціально для цієї мети була створена синергетична лінгвістика (Synergetic linguistics). КЛ емпірично ґрунтується на результатах мовної статистики, яка, в свою чергу, може інтерпретуватися як статистика мов або статистика лінгвістичного об'єкта. Ця галузь знань не обов'язково пов'язана з фундаментальними науковими цілями. Корпусна лінгвістика та комп'ютерна лінгвістика також вносять свій внесок у КЛ, поставляючи важливі емпіричні дані.
1. Історія
Найбільш ранні концепції КЛ відносяться до давньогрецької і давньоіндійської культури. Один з історичних джерел включає додатки комбінаторики до лінгвістичних реалій, інший ґрунтується на елементарних статистичних дослідженнях, які можна знайти під заголовками колометрія і стихометрія.
2. Мовні закони в квантитативній лінгвістиці
У КЛ під законом розуміється клас гіпотез, виведених з теоретичних припущень, математично сформульованих, взаємопов'язаних з іншими законами в цій області і в достатньому обсязі та успішно перевірених на емпіричних даних, тобто таких, які не можна було спростувати незважаючи на численні спроби. Khler пише про закони КЛ: "Більш того, можна показати, що ці властивості лінгвістичних елементів і відносин між ними підкоряються універсальним законам, які можуть бути сформульовані суворо математично також як і закони природничих наук. Потрібно мати на увазі в даному контексті, що ці закони стохастичної природи; вони не дотримуються в кожному окремому випадку (в цьому не було б необхідності і можливості); вони скоріше визначають вірогідність подій або кількісні відношення досліджуваних явищ. Легко знайти протилежні приклади кожного з перелічених вище прикладів; тим не менше, ці випадки не порушують відповідних законів, оскільки варіації навколо статистичного середнього не тільки допустимі, але і навіть необхідні; самі вони квантитативно точно визначаються відповідними законами. Ситуація така ж, як і в природничих науках, які вже давно відмовилися від старих детермінистських і каузальних (причинно-наслідкових) поглядів на світ і замінили їх на статистичні / імовірнісні моделі. "
3. Деякі мовні (лінгвістичні) закони
Існує цілий ряд мовних законів, серед яких:
- Закон диверсифікації: Якщо лінгвістичні категорії (такі, наприклад, як частини мови або граматичні закінчення) з'являються в різних формах, то можна сказати, що частоти їх появи в текстах контролюються певними законами.
- Розподіл довжин (або, в більш загальному вигляді, багатокомпонентності). Дослідження частот різних мовних одиниць з точки зору їх довжин в текстах і словниках регулярно призводить до виявлення цілого ряду розподілів, залежно від досліджуваної одиниці. На даний момент були вивчені наступні одиниці:
- Закон розподілу довжин морфів;
- Закон розподілу довжин ритмічних одиниць;
- Закон розподілу довжин пропозицій;
- Закон розподілу довжин складів;
- Закон розподілу довжин слів;[1]
Інші мовні одиниці, які також підкоряються цьому закону, — це, наприклад, букви (символи) різної складності, довжини так званих hrebs і мовних актів. Це ж справедливо і для розподілів звуків (фонів) різної тривалості (довготи).
- Закон Мартіна: Цей закон стосується лексичних ланцюжків, які утворюються при пошуку дефініцій (визначень) слів у словнику, потім дефініцій тільки що знайдених дефініцій і т. д. Зрештою всі ці дефініції утворюють ієрархію все більш і більш загальних значень, при цьому дефініцій стає тим менше, чим більш загальне значення виходить. Серед рівнів цієї ієрархії існує цілий ряд підкоряються закону відносин.
- Закон Менцерата (також, в особливості в лінгвістиці, відомий як закон Менцерата-Альтмана): Даний закон говорить, що розміри складових конструкції зменшуються зі збільшенням самої досліджуваної конструкції. Чим довший, наприклад, пропозиція (виміряний кількістю вхідних в його склад підрядних речень), тим коротше входять до його складу придаткові пропозиції (виміряні кількістю слів), або: чим довше слово (в складах або морфем), тим коротше слови або слова в звуках .
- Закони частотно-рангового розподілу: Практично будь-яка мовна одиниця підпорядковується цим закономірностям. Наведемо лише кілька прикладів:
- Слова в тексті організовані відповідно з частотою їх появи в тексті, і кожному з них присвоєно номер рангу і відповідна частота. З часів Джорджа Кінгслі Ципфа (широковідомий закон Ципфа), пропонувалося велика кількість математичних моделей, що описують відносини між рангом і частотою.
- Можна спостерігати схоже розподіл між рангом і частотою звуків, фонем і букв.
- Словесні асоціації: Ранг і частота асоціацій реагують на (словесний) стимул.
- Закон зміни мови: Процеси росту в мові (як, наприклад, зростання словника), поширення іноземних та запозичених слів, зміни в флективні системі і т. д. підкоряються закону, відомому в КЛ як закон Піотровського, і відповідають моделям зростання в інших наукових дисциплінах . Закон Піотровського — це окремий випадок так званої логістичної моделі (СР з логістичним рівнянням). Було показано, що він зачіпає і процеси засвоєння мови (СР закон засвоєння мови).
- Закон текстового блоку: Лінгвістичні одиниці (напр: слова, літери, синтаксичні функції і конструкції) демонструють певний розподіл частоти в однаково великих блоках текстів.
- Закон Ципфа: Частота слова назад пропорційна їх рангу в списках частотності.
4. Стилістика
- Вивчення поетичних і непоетичних стилів може рунтуватися на статистичних методах, більше того, можливо проводити відповідні дослідження на основі особливих форм (параметрів), які мовні закони приймають у текстах різних стилів. У таких випадках КЛ проводить дослідження в стилістиці: одна з підсумкових цілей — довести настільки об'єктивно, наскільки це можливо, принаймні в одній області дій існування стилістичного феномена, посилаючись на дію мовного закону. Одне з головних припущень КЛ полягає в тому, що деякі закони (наприклад, закон розподілу довжин слів) вимагають різних моделей, по украй мірі різних значень параметрів закону (розподілів або функцій), залежно від типу тексту, до якого належить цей текст. Якщо вивчаються поетичні тексти, то методи КЛ утворюють піддисципліну, яка називається «квантитативних вивчення літератури» (Стилеметрія).
Література
- Karl-Heinz Best[2]: Quantitative Linguistik. Eine Annäherung. 3., Stark berarbeitete und ergänzte Auflage. Peust & Gutschmidt, Göttingen 2006, ISBN 3-933043-17-4.
- Karl-Heinz Best, Otto Rottmann: Quantitative Linguistics, an Invitation. RAM-Verlag, Lüdenscheid 2017. ISBN 978-3-942303-51-4.
- Emmerich Kelih[3]: Geschichte der Anwendung quantitativer Verfahren in der russischen Sprach-und Literaturwissenschaft. Kovač, Hamburg 2008. ISBN 978-3-8300-3575-6.
- Reinhard Köhler, Gabriel Altmann, Rajmund G. Piotrowski (Hrsg.): Quantitative Linguistik – Quantitative Linguistics. Ein internationales Handbuch - An International Handbook. de Gruyter, Berlin/ New York 2005, ISBN 3-11-015578-8.
- В. В. Левицький: квантитативні методи в лінгвістиці. Нова книга, Вінниця 2007. ISBN 978-966-382-046-0.
Примітки
- Karl-Heinz Best, Svetlana Zinenko: Wortkomplexität im Ukrainischen und ihre linguistische Bedeutung. In: Zeitschrift für Slavische Philologie 58, 1999, 107-123; Karl-Heinz Best, Svetlana Zinenko: Wortlängen in Gedichten des ukrainischen Autors Ivan Franko. In: Jozef Genzor, & Slavomir Ondrejovic (eds.): Pange Lingua. Zbornik na Pocest' Viktora Krupu, 201-213. Bratislava: Veda, Vydavatel'stvo SAV 1999. (=Festschrift f. Viktor Krupa)
- Best, Karl-Heinz; Best, Karl-Heinz (2013-01). Silbenlängen im Deutschen. Glottotheory 4 (1). ISSN 1337-7892. doi:10.1524/glot.2013.0003. Процитовано 9 грудня 2019.
- Kelih, Emmerich (1 січня 2014). Book review. Glottotheory 5 (2). ISSN 2196-6907. doi:10.1515/glot-2014-0022. Процитовано 9 грудня 2019.