26 Липня 2012
768
Лингвисты проследили за эволюцией самых часто употребляемых фраз в книгах на английском языке и установили, что на рубеже между восемнадцатым и девятнадцатым столетием список таких фраз стабилизировался, и печатный язык, по словам ученых, "достиг совершеннолетия".
Лингвисты проследили за эволюцией самых часто употребляемых фраз в книгах на английском языке и установили, что на рубеже между восемнадцатым и девятнадцатым столетием список таких фраз стабилизировался, и печатный язык, по словам ученых, "достиг совершеннолетия".
Лингвисты проследили за эволюцией самых часто употребляемых фраз в книгах на английском языке и установили, что на рубеже между восемнадцатым и девятнадцатым столетием список таких фраз стабилизировался, и печатный язык, по словам ученых, "достиг совершеннолетия". Исследование опубликовано в журнале Journal of the Royal Society Interface.Работа основана на корпусе текстов, полученном компанией Google в процессе оцифровки книг. Он охватывает около пяти миллионов произведений, написанных начиная с 1520 года по настоящее время.
Ученые анализировали, как список самых часто встречающихся в текстах фраз меняется от года к году. Оказалось, что наиболее древние тексты сильнее всего отличаются друг от друга. Например, десятка самых часто встречающихся фраз в книгах, изданных в 1600 году, могла совершенно не совпадать с такой же десяткой из книг 1610 года.
Однако, на рубеже восемнадцатого и девятнадцатого столетий в употреблении фраз произошла достаточно резкая стабилизация. Ученые объясняют это процессами самоорганизации, которые выражаются в возрастании предпочтительного связывания лексем друг с другом. Условно говоря, слова, которые часто употребляются вместе, со временем образуют устойчивое словосочетание (что можно наблюдать и для других явлений - рreferential attachment).
Самыми часто употребляемыми фразами в английском языке за последние 50 лет стали такие словосочетания как "the end of the" (в конце), "at the same time" (в то же время; вместе с тем), и "the United States of America" (Соединенные Штаты Америки).
Ранее другая группа ученых при помощи того же проекта Google обнаружила словарное сокращение языков. Авторы работали с текстами не только на английском, но и на испанском языке и иврите. Они установили, что большое количество появляющихся в последнее время новых слов не способно компенсировать исчезающие лексемы и в целом все три исследованных языка становятся беднее.