American telephone voice: Socio-phonetic features of identity in professional and non-professional discourse

The study is concerned with the role of socio-phonetic characteristics of American speakers’ voices in identifying gender and age identity in professional and non-professional communication. We have to develop and test the methodology previously applied in such specific areas as corpus analysis, forensic phonetics, multi-modal research, and intraspeaker variability to address the problem of identifying personality by voice. The aim of the research is to view variations in the prosodic forms of American English speakers and examine age-related and gender-specific prosodic features in telephone communication. The study intends to address the following research questions: How do the following prosodic features contribute to distinguishing age- and gender-related changes in the human voice: mean pitch, maximum pitch, minimum pitch, pitch range, mean intensity, jitter, shimmer and harmonics-to-noise ratio? Which combinations of features are associated with young, middle-aged, and senior voices of men and how much are they different from or similar to women’s voices? The auditory and acoustic computer analyses were conducted on American English dialogues with 30 speakers, equally balanced for gender (5 men and 5 women in each age group) and three age groups (young, middle-aged, senior), taken from the American telephone speech corpus to measure the prosodic parameters of pitch, pitch range, intensity, jitter, shimmer, and harmonics-to-noise ratio supported by statistical data processing in Minitab programme. The apparent-time technique of data presentation and the comparative analysis allow discovery of the dynamics of voice changes over time which could be later applied to personality identification. Comparing the data based on eight parameters’ values in three age groups balanced for gender we have found that although all the selected measurements proved to be relevant for either gender group, the age-related trajectory of voice dynamics may be different in male and female voices regarding their specific prosodic characteristics. Prosodic features of mean pitch, maximum pitch and minimum pitch have been confirmed to define both individuals and groups of people of a certain age and gender and could be considered as both speaker-identifying and group-identifying characteristics. Voice quality features, apart from being previously found to signify the emotional states of speakers, may also be observed to characterise certain age and gender groups; hence, they may also serve as speaker-identifying characteristics.

    KEYWORDS:
  • telephone voice
  • prosody
  • age
  • gender
  • American English
  • socio-phonetic features
  • Голоса американцев по телефону: Социо-фонетические признаки идентичности в профессиональном и непрофессиональном дискурсе

    Исследование посвящено роли социо-фонетических характеристик голосов носителей американского варианта английского языка в идентификации гендера и возраста в профессиональной и непрофессиональной коммуникации. Для этого необходимо разработать и протестировать методологию, ранее использованную в таких специальных областях, как корпусный анализ, фоноскопический анализ в криминологии, полимодальный анализ и изучение внутриличностной вариативности, чтобы обратиться к проблеме идентификации личности по голосу. Цель исследования состоит в том, чтобы рассмотреть вариативность просодических форм в голосах американских носителей английского языка и выделить возрастные и гендерные черты голосов в телефонных переговорах. Исследование направлено на решение ряда вопросов. Как следующие просодические характеристики способствуют дифференциации возрастных и гендерных изменений в человеческом голосе: средняя частота основного тона (далее ЧОТ), максимальная ЧОТ, минимальная ЧОТ, диапазон ЧОТ, средняя интенсивность, джиттер, шиммер, соотношение гармоник к шуму? Какие сочетания характеристик ассоциируются с молодым, средним и пожилым возрастом мужчин и в какой степени они отличаются или уподобляются аналогичным показателям у женщин? Аудиторский и акустический компьютерный анализы были выполнены на материале диалогов 30 носителей американского варианта английского языка, сбалансированных по гендеру участников (5 мужчин и 5 женщин в каждой из трех возрастных групп молодого, среднего и пожилого возраста), подобранных из американского корпуса телефонных переговоров для измерения просодических параметров высоты основного тона, диапазона, интенсивности, джиттера, шиммера и соотношения гармоник к шуму, за которым последовал статистический анализ данных по программе Minitab. Техника представления данных «в видимом времени» и сравнительный анализ позволяют обнаружить динамику голосовых изменений во времени, что можно в дальнейшем применить для идентификации личности. Путем сравнения показателей восьми параметров в трех группах голосов, сбалансированных по гендеру, мы обнаружили, что, несмотря на значимость всех избранных измерений для каждой гендерной группы, возрастная траектория голосовой динамики может различаться в мужских и женских голосах относительно их специфических просодических характеристик. Подтвердилось, что просодические данные средней ЧОТ, максимальной ЧОТ и минимальной ЧОТ могут относиться как к индивидуальности, так и к группе людей определенного возраста и гендера, и потому могут рассматриваться для идентификации личности и идентификации группы говорящих. Характеристики качества голоса, наряду с ранее установленными функциями выражения эмоционального состояния говорящего, могут также относиться к описанию определенных возрастных и гендерных групп; отсюда проистекает их способность идентифицировать личность.