Скорость речи и информация в разных языках

Speech velocity and information in different languages

скорость речи в различных языках

It's an almost universal truth that any language you don't understand sounds like it's being spoken at 200 m.p.h. That, we tell ourselves, is simply because the words make no sense to us. Surely our spoken English sounds just as fast to a native speaker of Urdu. And yet it's equally true that some languages seem to zip by faster than others. Spanish blows the doors off French; Japanese leaves German in the dust — or at least that's how they sound.

Почти всегда справедливо, что речь на непонятном нам языке кажется очень быстрой, будто несётся со скоростью 200 миль в час. Мы объясняем это себе тем, что слова просто не имеют для нас смысла. Несомненно, что и наш разговор на английском языке кажется таким же быстрым для говорящих на языке урду. И всё же справедливо и то, что речь на некоторых языках действительно быстрее, чем на других. Испанская речь намного быстрее французской, а японская - немецкой. По крайней мере в смысле быстроты произношения.

But how could that be? The dialogue in movies translated from English to Spanish doesn't whiz by in half the original time after all, which is what it should if the same lines were being spoken at double time. Similarly, Spanish films don't take four hours to unspool when they're translated into French. Somewhere among all the languages must be a great equalizer that keeps us conveying information at the same rate even if the speed limits vary from tongue to tongue.

Но как такое возможно? Ведь если диалог из фильма перевести с английского на испанский, то время его произнесения не станет в два раза короче из-за того, что на испанском говорят в два раза быстрее. Аналогично и испанские фильмы, переведённые на французский, не становятся 4-часовыми оттого, что французы говорят медленнее. Наверное, есть общий для всех языков "усредняющий фактор": каждый язык передаёт информацию с одинаковой скоростью, несмотря на различие темпов речи от языка к языку.

To investigate this puzzle, researchers from the Université de Lyon recruited 59 male and female volunteers who were native speakers of one of seven common languages — English, French, German, Italian, Japanese, Mandarin and Spanish — and one not so common one: Vietnamese. All of them were instructed to read 20 different texts, including the one about the house cat and the locked door, into a recorder. All of the volunteers read all 20 passages in their native languages. Any silences that lasted longer than 150 milliseconds were edited out, but the recordings were left otherwise untouched.

Чтобы разобраться в этой загадке, исследователи из Лионского университета взяли 59 добровольцев (мужчин и женщин), говорящих на семи распространённых языках: английском, французском, немецком, итальянском, японском, китайском (мандарин) и испанском. Также в эксперименте участвовал  ещё один, более редкий язык - вьетнамский (его роль мы объясним позднее). Всем было сказано прочитать под звукозапись 20 различных текстов, в том числе про домашнюю кошку, про закрытую дверь и т.д. Все добровольцы читали эти 20 текстов на своём родном языке. Все паузы длиной более 150 миллисекунд затем были вырезаны, в остальном записи не редактировались.

The investigators next counted all of the syllables in each of the recordings and further analyzed how much meaning was packed into each of those syllables. A single-syllable word like bliss, for example, is rich with meaning — signifying not ordinary happiness but a particularly serene and rapturous kind. The single-syllable word to is less information-dense. And a single syllable like the short i sound, as in the word jubilee, has no independent meaning at all.

Затем исследователи подсчитали в каждой записи количество слогов и проанализировали "смысловую насыщенность" каждого слога. Например, однослоговое слово bliss богато смыслом (это законченное слово, означает не просто счастье, но ещё и покой/восторг). Односложное слово to - предлог, в нём плотность информации меньше. А однозвуковый слог i в слове jubilee вообще отдельного смысла не имеет.

With this raw data in hand, the investigators crunched the numbers together to arrive at two critical values for each language: the average information density for each of its syllables and the average number of syllables spoken per second in ordinary speech. Vietnamese was used as a reference language for the other seven, with its syllables (which are considered by linguists to be very information-dense) given an arbitrary value of 1.

Исходя их этих данных, учёные с помощью математики вывели для каждого языка два важных значения: средняя плотность информации на каждый слог и среднее количество слогов, произносимых за 1 сек обычной речи. Вьетнамский язык использовался как эталон для остальных семи: его слогам (которые, по мнению лингвистов, очень плотно насыщены информацией) была произвольно приписана средняя плотность информации, равная 1.

For all of the other languages, the researchers discovered, the more data-dense the average syllable was, the fewer of those syllables had to be spoken per second — and thus the slower the speech. English, with a high information density of .91, was spoken at an average rate of 6.19 syllables per second. Mandarin, which topped the density list at .94, was the spoken slowpoke at 5.18 syllables per second. Spanish, with a low-density .63, ripped along at a syllable-per-second velocity of 7.82. The true speed demon of the group, however, was Japanese, which edged past Spanish at 7.84, thanks to its low density of .49. Despite those differences, at the end of, say, a minute of speech, all of the languages would have conveyed more or less identical amounts of information.

Для всех остальных языков учёные обнаружили, что чем выше средняя информационная насыщенность слога в языке, тем меньше слогов произносится на 1 секунду. В английском, у которого высокая насыщенность слога, равная 0,91, произносится в секунду 6,19 слогов. В китайском (мандарин) с максимальной среди других языков насыщенностью слога 0,94 произносится 5,18 слогов в секунду. В испанском низкая насыщенность слога - 0,63 и произносится в секунду 7,82 слогов (много!). Но настоящим "демоном" по скорости в этой группе языков стал японский с низкой насыщенностью слога 0,49 и скоростью 7,84 слогов в секунду. Несмотря на эти различия, во всех языках за, скажем, 1 минуту речи передаётся более или менее равное количество информации.

"A tradeoff is operating between a syllable-based average information density and the rate of transmission of syllables," the researchers wrote. "A dense language will make use of fewer speech chunks than a sparser language for a given amount of semantic information." In other words, your ears aren't deceiving you: Spaniards really do sprint and Chinese really do stroll, but they will tell you the same story in the same span of time.

"Есть зависимость между средней информационной насыщенностью слога в языке и скоростью произнесения слогов", - написали исследователи. "Язык с высокой насыщенностью слога и меньшим количеством слогов (кусков речи) передаёт данное количество семантической информации". Другими словами, ваши уши вас не обманывают: испанцы действительно говорят, как бегуны-спринтеры, а китайцы говорят "прогулочным шагом", но один и тот же рассказ они расскажут вам за одно и то же время.

 

Комментарии 

 
-1 #2 nick 15.12.2015 17:34
"Несмотря на эти различия, во всех языках за, скажем, 1 минуту речи передаётся более или менее равное количество информации", а как с усвоением (осмысленным) этой информации. когда диктор, перекрикивая самого себя, "захлебываясь" от собственной значимости "изливает" поток слов ....? Кто ему может "помочь"?
Цитировать
 
 
0 #1 Alex 19.10.2011 23:05
Хорошее исследование.
Связали плотность речи со скоростью передачи.
Наконец-то всё стало на свои места.
Неожиданно для японского, оказывается по скорости обогнал испанский.
Цитировать
 

Добавить комментарий

Защитный код
Обновить

Поделиться: