Upload
doandat
View
215
Download
0
Embed Size (px)
Citation preview
Universidade de Lisboa
Faculdade de Letras
Departamento de Linguística Geral e Românica
O Disfarce da Voz em Fonética Forense
Raïssa Gillier
Mestrado em Linguística
Área de Especialização – Linguística Portuguesa
Ano de 2011
Universidade de Lisboa
Faculdade de Letras
Departamento de Linguística Geral e Românica
O Disfarce da Voz em Fonética Forense
Raïssa Gillier
Mestrado em Linguística
Área de Especialização – Linguística Portuguesa
Dissertação orientada por:
Professor Doutor Fernando Martins
Ano de 2011
AGRADECIMENTOS
É uma árdua tarefa agradecer o que muitas vezes não pode ser agradecido apenas com
palavras… Contudo, não posso deixar de mencionar algumas pessoas que se
destacaram ao longo desta ‘viagem’.
Em primeiro lugar, agradeço aos meus pais, a quem dedico este trabalho, por fazerem
de mim quem hoje sou e, ainda, pelo apoio incondicional que sempre me prestaram!
Agradeço ao meu orientador, Professor Doutor Fernando Martins, a disponibilidade e
prontidão que sempre demonstrou para resolução de problemas e esclarecimento de
dúvidas.
Um especial agradecimento vai para os vários Informantes que se disponibilizaram a
participar no estudo e pacientemente aceitaram a repetitiva, e por vezes aborrecida,
tarefa de leitura. Este trabalho não seria possível sem a vossa colaboração.
Quero agradecer muito à Gabriela e ao João, com quem tanto tenho aprendido, o
enorme apoio que me deram, a compreensão demonstrada e o bom humor. É
gratificante trabalhar convosco! A todos os outros membros do CLUL com quem me
relaciono diariamente e que me proporcionam momentos de partilha de
conhecimento e de boa disposição.
À Carla, Catarina e Filipa, um obrigado muito especial por terem estado sempre
presentes nesta etapa, por saberem respeitar o meu espaço e ausências e por me
aturarem nos momentos de maior tensão. Mas toda a alegria vivida, as gargalhadas
soltadas e disparates feitos são o maior motivo de agradecimento. Enfim, por todo o
tempo que passámos juntas!
Por fim, a todos aqueles que não foram mencionados e que, de alguma forma,
contribuiram para este trabalho.
i
RESUMO
O presente trabalho tem por objectivo estudar quatro tipos de disfarce da voz, de
forma a averiguar as consequências, que deles advêm, em dois parâmetros acústicos
utilizados na Identificação de Falantes – F0 e formantes. Com este propósito, foram
gravados oito indivíduos que leram um conjunto de frases em cinco condições de
produção: voz normal, subida de F0, descida de F0, máscara à frente da boca e
palhinha entre os incisivos.
A análise dos dados relativos à Voz Normal serve, por um lado, para verificar a eficácia
dos parâmetros na distinção de falantes e, por outro, como ponto de comparação para
observar a influência dos disfarces nos vários parâmetros acústicos.
Os resultados obtidos demonstram que (i) estes parâmetros (F0 e formantes) são
eficientes para a discriminação de indivíduos; (ii) os disfarces não actuam de forma
idêntica; (iii) nem todos os disfarces são eficazes, pois alguns não alteram as
frequências dos parâmetros; (iv) a robustez de cada parâmetro está directamente
relacionada com o tipo de disfarce; (v) o factor falante desempenha um papel
importante na performance do disfarce; (vi) o efeito do disfarce não é homogéneo
entre as várias vogais; (vii) mesmo no disfarce mais intrusivo, é possível recuperar
marcas específicas de cada falante através dos triângulos vocálicos.
Em suma, pretende-se (i) aprofundar conhecimentos sobre a robustez dos parâmetros
de identificação de falantes face ao disfarce; (ii) contribuir para o desenvolvimento dos
estudos na área da Fonética Forense e da Acústica Forense; (iii) colmatar a inexistência
de trabalhos neste âmbito para o Português Europeu.
Palavras-chave:
disfarce, F0, formantes, Fonética Forense, Acústica Forense
ii
ABSTRACT
The present research aims to study four types of voice disguise in order to investigate
its influence on two acoustic parameters, often employed in Speaker Identification –
F0 and formants. To reach this goal, eight individuals were recorder and each of them
read a set of sentences in five different ways: normal voice, raising fundamental
frequency, lowering fundamental frequency, mask on mouth, use of bite block (straw).
Normal Voice data was analyzed to investigate, on the one hand, the efficiency of the
acoustic parameters to discriminate individuals and, on the other hand, to be the term
of comparison of each disguise in order to verify the influence of disguises on the
parameters.
The results reveal that (i) these acoustic parameters (F0 and formants) are efficient to
differentiate different speakers; (ii) disguises do not act in the same way; (iii) disguises
are not all efficient seeing that some of them do not affect the parameter’s values; (iv)
the strength of each acoustic parameter is directly related with the type of disguise; (v)
speaker factor perform an important role on disguise performance; (vi) disguise’s
effect is not homogeneous between vowels; (vii) it is possible to check speaker
specifics on vowel chart even in the stronger disguise.
The present research is expected to (i) expand knowledge about the robustness of
speaker identification parameters’ in presence of voice disguise; (ii) contribute to the
development of work in Forensic Phonetics and Acoustic Phonetics; (iii) end up the
inexistence of studies for European Portuguese in this field.
Key words:
disguise, F0, formants, Forensic Phonetics, Acoustic Phonetics
iii
ÍNDICE
RESUMO .................................................................................................................................... i
ABSTRACT ................................................................................................................................. ii
LISTA DE FIGURAS ..................................................................................................................... v
LISTA DE TABELAS ................................................................................................................... vii
1. INTRODUÇÃO ....................................................................................................................... 1
2. ENQUADRAMENTO TEÓRICO ............................................................................................... 4
2.0. Introdução ..................................................................................................................... 4
2.1. Teoria acústica da produção de fala ................................................................................ 4
2.1.1. Fonte ....................................................................................................................... 5
2.1.2. Filtro ........................................................................................................................ 5
2.2. Caracterização acustico-articulatória das vogais ............................................................. 6
2.2.1. Classificação articulatória ........................................................................................ 6
2.2.2. Classificação acústica ............................................................................................... 7
2.3. Fonética forense ............................................................................................................. 9
2.3.1. Caracterização ......................................................................................................... 9
2.3.2. Fonética Acústica ................................................................................................... 12
2.3.3. Factores condicionantes ........................................................................................ 13
2.4. Identificação de falantes............................................................................................... 14
2.4.1. Parâmetros perceptivos ......................................................................................... 16
2.4.2. Parâmetros acústicos ............................................................................................. 18
2.5. Disfarce ........................................................................................................................ 20
3. METODOLOGIA ............................................................................................................... 25
3.0. Introdução ................................................................................................................ 25
3.1. Desenho Experimental .............................................................................................. 25
3.2. Informantes .............................................................................................................. 27
3.3. Materiais – Corpus .................................................................................................... 28
3.4. Recolha dos Dados ....................................................................................................... 29
3.4.1. Requisitos éticos .................................................................................................... 29
3.4.2. Gravações .............................................................................................................. 29
3.5. Tratamento dos Dados ................................................................................................. 30
3.5.1. Análise Espectrográfica .......................................................................................... 30
iv
3.5.2. Análise Estatística .................................................................................................. 32
4. ANÁLISE E DISCUSSÃO DOS DADOS .................................................................................... 33
4.0. Introdução ................................................................................................................... 33
4.1. Voz normal ................................................................................................................... 33
4.1.1. Triângulos vocálicos: variação intra e inter-falante ................................................. 33
4.1.2. Frequência fundamental (F0) ................................................................................. 39
4.1.3. Formantes ............................................................................................................. 41
4.1.4. Eficácia dos parâmetros acústicos na distinção de falantes .................................... 42
4.1.5. Informante versus Vogais ....................................................................................... 44
4.2. Disfarce – variação dos parâmetros acústicos ............................................................... 47
4.2.1. Voz Normal versus Disfarce(s) ................................................................................ 47
4.2.2. Disfarce versus Informante .................................................................................... 54
4.2.3. Disfarce versus Vogais............................................................................................ 61
4.2.4. Triângulos vocálicos – Comparação de VN com o(s) Disfarce(s) .............................. 64
4.2.4.1. VN versus D1 ................................................................................................... 64
4.2.4.2. VN versus D2 ................................................................................................... 68
4.2.4.3. VN versus D3 ................................................................................................... 71
4.2.4.4.VN versus D4.................................................................................................... 74
4.2.4.5. Considerações finais ....................................................................................... 77
5. CONCLUSÃO ....................................................................................................................... 80
5.1. Conclusões ................................................................................................................... 80
5.2. Limitações do estudo.................................................................................................... 84
5.3. Perspectivas futuras ..................................................................................................... 85
BIBLIOGRAFIA ......................................................................................................................... 86
ANEXO 1 ................................................................................................................................. 91
ANEXO 2 ................................................................................................................................. 93
ANEXO 3 ................................................................................................................................. 95
ANEXO 4 ................................................................................................................................. 97
ANEXO 5 ................................................................................................................................. 99
ANEXO 6 ............................................................................................................................... 101
ANEXO 7 ............................................................................................................................... 102
ANEXO 8 ............................................................................................................................... 103
v
LISTA DE FIGURAS
Figura 1 – Espectrograma do enunciado Minha querida, eu tentei informar que não esqueço ainda dos documentos que levaste, portanto eu agradecia que os devolvesses (gravação X). .. 11 Figura 2 – Espectrograma do enunciado Minha querida, eu tentei informar que não esqueço ainda dos documentos que levaste, portanto eu agradecia que depois (que) os devolvesses (gravação K). ........................................................................................................................... 11
Figura 3 - Localização da medição de F2 da vogal [ɛ] em VN, na frase Eu digo cadela, Paulo. ... 31
Figura 4 - Triângulo vocálico do Informante 1. ........................................................................ 34 Figura 5 - Triângulo vocálico do Informante 2. ........................................................................ 34 Figura 6 - Triângulo vocálico do Informante 3. ........................................................................ 34 Figura 7 - Triângulo vocálico do Informante 4. ........................................................................ 34 Figura 8 - Triângulo vocálico do Informante 5. ........................................................................ 34 Figura 9 - Triângulo vocálico do Informante 6. ........................................................................ 34 Figura 10 - Triângulo vocálico do Informante 7........................................................................ 35 Figura 11 - Triângulo vocálico do Informante 8. ...................................................................... 35 Figura 12 - Valores médios da frequência fundamental de cada Informante............................ 39 Figura 13 - Valores médios de F1, F2, F3 e F4 de cada Informante. .......................................... 41 Figura 14 – Média de F1 por vogal, para cada Informante. ...................................................... 45 Figura 15 - Média de F2 por vogal, para cada Informante. ....................................................... 45 Figura 16 - Média de F3 por vogal, para cada Informante. ....................................................... 46 Figura 17 - Média de F4 por vogal, para cada Informante. ....................................................... 46 Figura 18 - Comparação de VN com D1 ................................................................................... 49 Figura 19 - Comparação de VN com D2. .................................................................................. 49 Figura 20 - Comparação de VN com D3. .................................................................................. 49 Figura 21 - Comparação de VN com D4. .................................................................................. 50 Figura 22 – Distribuição de F0 segundo o Informante em VN, D1, D2, D3 e D4. ....................... 54 Figura 23 – Distribuição de F1 segundo o Informante em VN, D1, D2, D3 e D4. ....................... 54 Figura 24 - Distribuição de F2 segundo o Informante em VN, D1, D2, D3 e D4. ........................ 55 Figura 25 - Distribuição de F3 segundo o Informante em VN, D1, D3 e D4. .............................. 55 Figura 26 - Distribuição de F4 segundo Informante em VN, D1, D2, D3 e D4. ........................... 55 Figura 27 – Valores médios de F0 de cada Informante em VN e D2. ........................................ 59 Figura 28 – Distribuição dos valores de F1 e F2 de cada vogal em VN e D1. ............................. 61 Figura 29 - Distribuição dos valores de F1 e F2 de cada vogal em VN e D2. .............................. 61 Figura 30 - Distribuição dos valores de F1 e F2 de cada vogal em VN e D3. .............................. 62 Figura 31 - Distribuição dos valores de F1 e F2 de cada vogal em VN e D4. .............................. 62 Figura 32 - Triângulo vocálico VN-D1, Informante 1 ................................................................ 64 Figura 33 - Triângulo vocálico VN-D1, Informante 2 ................................................................ 64 Figura 34 - Triângulo vocálico VN-D1, Informante 3 ................................................................ 65 Figura 35 - Triângulo vocálico VN-D1, Informante 4 ................................................................ 65 Figura 36 - Triângulo vocálico VN-D1, Informante 5 ................................................................ 65 Figura 37 - Triângulo vocálico VN-D1, Informante 6 ................................................................ 65 Figura 38 - Triângulo vocálico VN-D1, Informante 7 ................................................................ 65 Figura 39 - Triângulo vocálico VN-D1, Informante 8 ................................................................ 65
vi
Figura 40 - Triângulo vocálico VN-D2, Informante 1 ................................................................ 68 Figura 41 - Triângulo vocálico VN-D2, Informante 2 ................................................................ 68 Figura 42 - Triângulo vocálico VN-D2, Informante 3 ................................................................ 68 Figura 43 - Triângulo vocálico VN-D2, Informante 4 ................................................................ 68 Figura 44 - Triângulo vocálico VN-D2, Informante 5 ................................................................ 68 Figura 45 - Triângulo vocálico VN-D2, Informante 6 ................................................................ 68 Figura 46 - Triângulo vocálico VN-D2, Informante 7 ................................................................ 69 Figura 47 - Triângulo vocálico VN-D2, Informante 8 ................................................................ 69 Figura 48 - Triângulo vocálico VN-D3, Informante 1 ................................................................ 71 Figura 49 - Triângulo vocálico VN-D3, Informante 2 ................................................................ 71 Figura 50 - Triângulo vocálico VN-D3, Informante 3 ................................................................ 71 Figura 51 - Triângulo vocálico VN-D3, Informante 4 ................................................................ 71 Figura 52 - Triângulo vocálico VN-D3, Informante 5 ................................................................ 71 Figura 53 - Triângulo vocálico VN-D3, Informante 6 ................................................................ 71 Figura 54 - Triângulo vocálico VN-D3, Informante 7 ................................................................ 72 Figura 55 - Triângulo vocálico VN-D3, Informante 8 ................................................................ 72 Figura 56 - Triângulo vocálico VN-D4, Informante 1 ................................................................ 74 Figura 57 - Triângulo vocálico VN-D4, Informante 2 ................................................................ 74 Figura 58 - Triângulo vocálico VN-D4, Informante 3 ................................................................ 74 Figura 59 - Triângulo vocálico VN-D4, Informante 4 ................................................................ 74 Figura 60 - Triângulo vocálico VN-D4, Informante 5 ................................................................ 74 Figura 61 - Triângulo vocálico VN-D4, Informante 6 ................................................................ 74 Figura 62 - Triângulo vocálico VN-D4, Informante 7 ................................................................ 75 Figura 63 - Triângulo vocálico VN-D4, Informante 8 ................................................................ 75
vii
LISTA DE TABELAS
Tabela 1 - Valores médios de F1 e F2 das vogais (Delgado-Martins, 1973) ................................. 8 Tabela 2 - Resultados do teste t-student na comparação dos valores de F0 entre os Informantes. ........................................................................................................................... 40 Tabela 3 - Resultados do teste de análise de variância (ANOVA).............................................. 43 Tabela 4 - Resultado do teste da análise de variância (ANOVA) para cada género. .................. 44 Tabela 5 – Resultado do teste ANOVA..................................................................................... 48 Tabela 6 - Resultado do teste t-student na comparação entre VN e Disfarce(s). ...................... 57
1
1. INTRODUÇÃO
O presente trabalho pretende contribuir para o desenvolvimento do conhecimento
sobre o disfarce da voz no âmbito da Fonética Forense. Trata-se, portanto, do estudo
do disfarce numa perspectiva linguística com aplicações para o Reconhecimento de
Falantes.
A Fonética Forense é uma área recente que tem vindo a expandir-se,
progressivamente, face às necessidades actuais. O aumento de casos que envolvem
escutas ou gravações telefónicas, nos últimos anos, destacam a importância da
Fonética para a identificação de indivíduos em ambiente forense.
A tarefa do reconhecimento de vozes é realizada nas mais diversas situações do
quotidiano, o que demonstra que um trecho de fala contém informação não linguística
relacionada com características pessoais dos falantes. O objectivo da Fonética Forense
consiste em procurar esses traços individuais da voz de cada falante que permitam
distingui-lo dos restantes indivíduos. Neste sentido, procuram-se correlatos acústicos
das características anatómicas do aparelho fonador dos indivíduos, uma vez que as
diferentes fisionomias do tracto vocálico deixam marcas específicas do falante no sinal
acústico. Assim, parâmetros relacionados com a fonte (F0) da produção sonora e os
filtros (formantes) que moldam essa fonte de energia são relevantes para a distinção
de falantes.
Contudo, os estudos fonéticos sobre a voz e a fala como ‘ferramenta’ discriminadora
de identidade são recentes, pelo que há, ainda, um longo percurso a explorar sobre as
potencialidades da voz, apesar dos grandes avanços que têm sido feitos nos últimos
anos. Para o Português Europeu, até ao momento, não é conhecido nenhum trabalho
neste sentido. Por outro lado, em casos forenses, é comum o infractor disfarçar a sua
voz para não ser reconhecido. Embora a investigação exploratória no domínio do
disfarce não seja muito abrangente, alguns trabalhos (Reich et al., 1976; Rose &
Simmons, 1996; Künzel, 2000; Zhan e Tan, 2007) demonstraram que parâmetros
2
acústicos como a frequência fundamental, a banda formântica ou a duração dos
segmentos são alterados na presença do disfarce.
A necessidade de aprofundar conhecimentos sobre os vários tipos de disfarce e quais
as consequências, que deles advêm, na análise para a identificação do falante são o
ponto basilar que motiva este estudo. O desenvolvimento da investigação no domínio
da Fonética Forense e da Acústica Forense, bem como o contributo do presente
estudo para as instituições judiciais são, também, aspectos pertinentes que justificam
este trabalho. Por último, o presente trabalho visa colmatar a inexistência de estudos
no campo da Fonética Forense para o Português Europeu, servindo como ponto de
partida para trabalhos futuros.
Deste modo, destacam-se os seguintes objectivos: (i) verificar a eficiência de cada
parâmetro na distinção entre falantes, na voz normal; (ii) averiguar se os disfarces
causam alterações nos vários parâmetros acústicos; (iii) verificar se os diferentes
disfarces produzem todos o mesmo efeito nos parâmetros acústicos; (iv) aferir se
todos os parâmetros são, igualmente, afectados por cada disfarce; (v) apurar se
existem parâmetros resistentes ao disfarce; (vi) observar se o efeito do disfarce é
homogéneo entre as vogais; e (vii) constatar se o factor falante tem alguma influência
na performance do disfarce.
Tendo em vista os objectivos mencionados, no segundo capítulo, descreve-se a teoria
acústica da produção de fala (2.1.); caracterizam-se as vogais do Português Europeu do
ponto de vista articulatório e acústico (2.2.); faz-se a descrição das principais questões
formais relacionadas com a Fonética Forense (2.3.); abordam-se alguns parâmetros
perceptivos relevantes para a Identificação de Falantes e descrevem-se estudos sobre
pistas perceptivas no reconhecimento de indivíduos (2.4.); finalmente, o último ponto
diz respeito ao disfarce da voz (2.5).
No terceiro capítulo, faz-se a descrição detalhada das questões metodológicas. Traça-
se a elaboração do desenho experimental, no que diz respeito às questões de partida e
hipóteses subjacentes ao presente trabalho (3.1.), a selecção dos Informantes (3.2.) e
3
dos materiais (3.3.); e explicitam-se os detalhes da recolha e tratamento dos dados
(secções 3.4. e 3.5.).
No quarto capítulo, são analisados e discutidos os resultados deste trabalho. Num
primeiro momento, descrevem-se os dados relativos à voz normal (secção 4.1.),
através da análise dos triângulos vocálicos (4.1.1.), F0 (4.1.2.) e formantes (4.1.3.), de
forma a testar a eficiência dos parâmetros acústicos na distinção de falantes (4.1.4) e a
relação entre falantes e vogais (4.1.5.). Na segunda parte deste capítulo (4.2.), faz-se a
comparação dos parâmetros acústicos entre a voz normal e os disfarces (4.2.1);
analisa-se a interacção entre o disfarce e o falante (4.2.2.), bem como a relação entre o
disfarce e as vogais (4.2.3.); por último, verificam-se as consequências produzidas por
cada disfarce nos triângulos vocálicos (4.2.4.).
Finalmente, no quinto capítulo, apresentam-se as conclusões deste trabalho e
confirmam-se ou infirmam-se as hipóteses delineadas (5.1.); listam-se as limitações do
estudo (5.2.) e sugerem-se linhas a desenvolver em trabalhos futuros (5.3.).
4
2. ENQUADRAMENTO TEÓRICO
2.0. Introdução
Neste capítulo, abordam-se, do ponto de vista teórico, algumas questões relevantes
para a Fonética Forense e são referidos vários trabalhos que servem de suporte para a
fundamentação teórica. Em primeiro lugar, apresenta-se a teoria acústica da produção
de fala (2.1) e faz-se a caracterização acustico-articulatória das vogais (2.2.); de
seguida, tratam-se os tópicos mais pertinentes da Fonética Forense, no que diz
respeito à área do Reconhecimento de Falantes (2.3.); posteriormente, descrevem-se
algumas características perceptivas e acústicas da voz que permitem identificar
falantes (2.4.); por fim, o último ponto é inteiramente dedicado à questão do disfarce
da voz (2.5.).
2.1. Teoria acústica da produção de fala
A teoria acústica da produção de fala estabelece uma relação entre a articulação dos
sons e as suas propriedades acústicas. Esta teoria foi desenvolvida por Fant em 1960
na obra Acoustic theory of speech production e é, geralmente, conhecida como teoria
fonte-filtro. Segundo esta, os sons de fala são o resultado da combinação de uma fonte
de energia sonora e de filtros que moldam o som produzido pela fonte. A fonte sonora
pode ser de dois tipos distintos: periódica ou aperiódica. Na primeira, a fonte sonora
corresponde às cordas vocais, ao passo que na segunda, a fonte sonora é o tracto
vocal. O filtro corresponde às várias configurações das cavidades supraglotais. Os sons
resultam, portanto, da relação entre um sistema de fontes sonoras e de filtros, mas o
mecanismo da fonte geradora é independente do processo de filtragem (Stevens,
2000). Isto é, as propriedades acústicas dos filtros não influenciam as propriedades da
fonte. Desta forma, é possível tratar separadamente cada uma das ‘fases’ responsáveis
pela produção da fala. No âmbito deste trabalho, as seguintes considerações serão
5
feitas apenas para as cordas vocais como fonte e a cavidade supraglotal oral como
filtro.
2.1.1. Fonte
A fonte de energia acústica é produzida pela vibração das cordas vocais, situadas na
laringe. Devido à pressão do fluxo do ar vindo dos pulmões, as cordas vocais fazem
movimentos sucessivos de abertura e fechamento (vibração). Este sistema mecânico
tem frequências naturais de vibração, aproximadamente entre os 100Hz e 300Hz para
um adulto (Stevens, 2000). É, portanto, a velocidade a que as cordas vocais abrem e
fecham durante a fonação que determina a frequência fundamental do fluxo de ar
glotal (Lieberman & Blumstein, 1988). A frequência de vibração das cordas vocais é
determinada, essencialmente, pela forma e pela massa das mesmas. Assim, quanto
maiores forem as cordas vocais de um adulto, menor será a faixa da frequência
fundamental. Adicionalmente, qualquer falante pode alterar a frequência natural de
vibração das cordas vocais – por exemplo, um aumento da rigidez das cordas vocais
traduz-se no aumento da frequência fundamental (Stevens, 2000). Na verdade, as
mudanças na frequência fundamental têm também uma finalidade linguística e são
usadas na comunicação entre falantes para diferenciar uma frase declarativa de uma
interrogativa ou para estabelecer diferenças de significado nas línguas tonais, por
exemplo.
2.1.2. Filtro
As cavidades supraglotais actuam como um sistema de filtragem, suprimindo a energia
de algumas frequências e amplificando outras. As frequências nas quais há um máximo
de concentração de energia, que são ressonâncias do tracto vocálico, chamam-se
formantes. Durante a produção de uma vogal, as partículas do ar expelido dos
pulmões vibram no tracto vocálico. As frequências de vibração das partículas de ar são
determinadas pela configuração do tracto vocálico que, por sua vez, está dependente
dos movimentos e posições dos vários articuladores (língua, lábios, maxilar, etc.).
6
Assim, a forma e tamanho do tracto vocálico determinam as frequências dos
formantes (Lieberman & Blumstein, 1988). Na literatura, é comum recorrer à vogal
schwa para exemplificar o efeito do filtro no som produzido pela fonte. O recurso a
esta vogal prende-se com o facto de esta ser relativamente simples do ponto de vista
da sua caracterização articulatória, isto é, não há protrusão dos lábios, a língua está
em posição de repouso e o véu palatino não permite a passagem do ar para a cavidade
nasal. Num tracto vocal de posição neutra com um comprimento de 17,5cm, a sua
área acústica seria equivalente a um tubo fechado num lado (glote) e aberto no outro
(lábios) o que resultaria num primeiro formante de 500Hz, o segundo de 1500Hz e o
terceiro de 2500Hz. Desta forma, são as alterações na forma do tubo que originam
diferentes configurações do tracto vocálico, e consequentemente diferentes
frequências de ressonância, que dão origem aos vários sons vocálicos.
2.2. Caracterização acústico-articulatória das vogais
2.2.1. Classificação articulatória
Os sons vocálicos são produzidos com vibração das cordas vocais e sem constrições à
passagem do ar no tracto vocálico. A posição dos vários articuladores, como os lábios e
a língua, determinam a produção das diferentes vogais. A identidade das vogais é,
essencialmente, caracterizada segundo três parâmetros: a altura do dorso da língua, o
movimento da raiz e dorso da língua e a posição dos lábios. A descrição dos diferentes
movimentos e posições que os articuladores executam é feita em função da posição
neutra dos mesmos que corresponde à vogal schwa. Relativamente à altura do dorso
da língua, a vogal pode ser alta ( [i], [ɨ] e [u] ), média ( [e], [ɐ] e [o] ) ou baixa ( [ɛ], [a]
e [ɔ] ). Nas vogais altas, o dorso da língua eleva-se em relação à sua posição neutra,
nas vogais médias, o dorso da língua mantém-se na sua posição neutra e, nas vogais
baixas, o dorso da língua baixa em relação à sua posição neutra (Mateus et al., 2005).
O movimento de elevação ou abaixamento do dorso da língua tem uma relação directa
com a abertura da cavidade oral, pelo que as vogais podem, também, ser
caracterizadas através deste critério. Assim, podem ser classificadas em vogais
7
fechadas ( [i], [ɨ] e [u] ), médias ( [e], [ɐ] e [o] ) ou abertas ( [ɛ], [a] e [ɔ] ). No que diz
respeito ao movimento de avanço ou recuo da língua, as vogais dividem-se em
anteriores ( [i], [e] e [ɛ] ), centrais ( [ɨ], [ɐ] e [a] ) ou posteriores ( [u], [o] e [ɔ] ). Nas
vogais anteriores, o dorso da língua avança em relação à sua posição neutra, nas
vogais centrais o dorso da língua mantém-se na sua posição neutra e nas vogais
posteriores o dorso da língua recua em relação à sua posição neutra (Mateus et al.,
2005). Por último, a posição dos lábios estabelece um traço distintivo relativo ao
arredondamento dos lábios que permite dividir as vogais em arredondadas ( [u], [o] e
[ɔ] ) e não arredondadas ( [i], [ɨ], [e], [ɐ], [ɛ] e [a] ).
Existem, também, as vogais nasais ( [ĩ], [õ], [ũ], [ẽ] e [ɐ̃] ) que se distinguem das vogais
orais pelo facto de o fluxo de ar proveniente dos pulmões passar não só na cavidade
oral, mas também na cavidade nasal, provocando ressonância nasal. Restam, ainda, as
semivogais ( [w] e [j] ) que são idênticas, do ponto de vista articulatório, às vogais [u] e
[i], respectivamente. No entanto, as semivogais diferenciam-se das vogais, pois são
produzidas com menor intensidade.
2.2.2. Classificação acústica
As características acústicas das vogais estão directamente relacionadas com as suas
propriedades articulatórias. Quer isto dizer que, tal como os vários articuladores se
movem e posicionam de forma a produzir sons diferentes, as características acústicas
de um segmento modificam-se de acordo com as diferentes configurações do tracto
vocálico. O sinal acústico produzido na fonte passa nas cavidades supraglotais que
adoptam diferentes formas e volumes segundo a posição dos articuladores. Se se
pensar na classificação articulatória das vogais [u] e [i], por exemplo, verifica-se que a
posição da língua e dos lábios é diferente em cada vogal, o que origina diferentes áreas
no tracto vocálico. Cada uma destas áreas actua como uma caixa de ressonância com
frequências naturais próprias (formantes). Retomando a posição dos articuladores na
vogal ‘neutra’ schwa, cujos valores dos formantes são 500hz, 1500hz e 2500hz para F1,
8
F2 e F3, respectivamente, facilmente se verifica que a passagem para outra vogal cria
novas áreas de ressonância, devido à nova configuração do tracto vocálico e,
consequentemente, novos valores dos formantes. As frequências destes formantes são
a identidade acústica das vogais, ou seja, cada vogal tem uma configuração formântica
específica que permite distinguí-las entre si. O primeiro e segundo formantes (F1 e F2)
são os responsáveis pela determinação da qualidade da vogal, pois F1 está relacionado
com o movimento articulatório de elevação e abaixamento da língua e F2 relaciona-se
com o movimento de avanço e recuo da língua. A relação entre o movimento da língua
e estes formantes permite estabelecer a ligação entre os traços articulatórios e
acústicos das vogais. A relação de F1 com a elevação/abaixamento da língua é
proporcionalmente inversa, isto é, as vogais baixas caracterizam-se por terem um F1
alto e as vogais altas por terem um F1 baixo. Em relação a F2, as vogais anteriores
caracterizam-se por terem valores elevados de F2 e as vogais posteriores por terem
valores baixos de F2.
Os vários trabalhos de Delgado-Martins foram o salto impulsionador na investigação
da fonética acústica do Português Europeu (PE). Em Delgado-Martins (1973), são
analisadas e estudadas as características formânticas das vogais orais tónicas do
Português Europeu. Neste artigo, a autora descreve os valores médios de frequência
do primeiro e segundo formantes de cada vogal (Tabela 1) e, simultaneamente,
estabelece o triângulo vocálico do PE.
Tabela 1 - Valores médios de F1 e F2 das vogais (Delgado-Martins, 1973)
F1 F2
[i] 293,58 2343,53
[e] 403,19 2083,94
[ɛ] 501,10 1893,21
[ɐ] 511,30 1602,07
[a] 626,04 1325,77
[ɔ] 530,70 993,91
[o] 425,53 863,59
[u] 315,00 677,80
9
A disposição dos valores de F1 e F2 em ordenada e absissa, respectivamente,
determinam o triângulo vocálico de uma língua em geral ou de um falante em
particular. Este é de grande relevo porque permite observar, através da sua
configuração, marcas específicas de cada indivíduo. Contudo, importa realçar que não
existem valores fixos para os formantes das vogais. Na verdade, os valores dos
formantes de um segmento são influenciados pelo contexto fonético em que se insere.
O fenómeno da coarticulação, isto é, a influência que um segmento exerce nos
segmentos adjacentes, altera os valores dos formantes de um mesmo segmento em
contextos fonéticos diferentes. Por outro lado, os formantes estão directamente
relacionados com as características fisiológicas do tracto vocal, pelo que as diferentes
fisionomias do tracto de cada indivíduo potenciam diferenças nos valores dos
formantes (variação inter-falante).
Existem, ainda, outros parâmetros que contribuem para a definição acústica das vogais
como a duração, a intensidade, a energia ou o F0 intrínseco da vogal que não cabe
abordar neste trabalho, já que não foram objecto de estudo.
2.3. Fonética forense
2.3.1. Caracterização
A Fonética Forense é uma ciência que corresponde à utilização de conhecimentos,
teorias e métodos fonéticos com finalidades judiciais. O carácter forense pode, na
verdade, ser aplicado a qualquer área da Linguística, mas o crescente aumento de
casos judiciais que envolvem escutas ou gravações telefónicas sublinham a relevância
da Fonética na identificação de falantes em ambiente forense. O caso Augustynek1
(Kredens & Góralewska-Lach, 1998) é um exemplo da resolução de um caso com base
em provas linguísticas que demonstra a importância da Fonética e do contributo de
outras áreas da linguística na resolução do mesmo. A utilização de pistas fonéticas 1 Em 1994, o centro de Cracóvia, Polónia, foi alvo de várias ameaças de bomba. Durante dez dias, telefonemas anónimos ameaçavam explodir bombas deixadas no centro da cidade, caso não fosse paga uma elevada quantia de dinheiro.
10
como a média da frequência fundamental, os traços articulatórios, a duração dos
segmentos, as marcas de hesitação, as frequências dos formantes das vogais ou a
qualidade da voz e o recurso a pistas morfológicas, dialectais e sintácticas permitiram
concluir que o autor das gravações e o suspeito eram o mesmo indivíduo.
O principal objecto de estudo da Fonética Forense relaciona-se com o reconhecimento
de falantes, embora outras áreas como a autenticação de gravações ou a identificação
do conteúdo de uma gravação (Rose, 2002) estejam também incluídas nas linhas de
investigação da Fonética Forense. Aparentemente, a noção de reconhecimento de
falantes através da voz parece simples, mas diferentes situações, como ser
reconhecido por alguém pelo telefone ou aceder à conta bancária através do
reconhecimento automático de voz, demonstram que existem vários tipos de
reconhecimento de falantes.
A tarefa do reconhecimento de falantes pode ser definida como qualquer processo de
decisão que usa algumas características do sinal de fala para determinar se uma
pessoa em particular é o falante de determinado enunciado (Atal, 1976; apud Rose,
2002). Existem duas tarefas dentro do reconhecimento de falantes – a verificação e a
identificação – que se relacionam com problemas e pressupostos específicos. Segundo
Nolan (1983), a verificação consiste na comparação de uma amostra de fala de um
indivíduo com amostras de referência do mesmo sujeito, de forma a verificar se existe
correspondência. A tarefa de verificação pode ter aplicações em bancos ou sistemas de
segurança, por exemplo, em que é necessário confirmar a identidade de determinado
falante. A identificação consiste, ainda segundo Nolan (1983), na atribuição (ou não)
do enunciado de um sujeito desconhecido a um indivíduo de uma população de que
estão disponíveis amostras de referência. Geralmente, é na identificação que recai o
tipo de reconhecimento que o contexto forense envolve. A verificação e identificação
têm em comum a comparação de duas amostras de fala com o objectivo de averiguar
se pertencem ou não ao mesmo indivíduo.
Observem-se, a título exemplificativo, os espectrogramas seguintes (Figuras 1 e 2)
provenientes de um caso forense real com disfarce de voz (nasalidade). O primeiro
espectrograma pertence ao infractor, cuja identidade se desconhece (gravação X) e o
11
segundo diz respeito ao suspeito (gravação K). Este é um caso que exemplifica a tarefa
de identificação, uma vez que se pretendia confirmar se o suspeito era o mesmo
sujeito que o autor da gravação X.
Figura 1 – Espectrograma do enunciado Minha querida, eu tentei informar que não esqueço ainda dos
documentos que levaste, portanto eu agradecia que os devolvesses (gravação X).
Figura 2 – Espectrograma do enunciado Minha querida, eu tentei informar que não esqueço ainda dos
documentos que levaste, portanto eu agradecia que depois (que) os devolvesses (gravação K).
Para além das diferentes aplicações de cada tarefa, existem outras diferenças entre a
identificação e verificação de falantes que as distingue. Rose (2002) aponta como
principais distinções as propriedades de referência do conjunto de falantes envolvidos
que assenta na distinção entre conjuntos abertos versus fechados e conjuntos
conhecidos versus desconhecidos. Num conjunto fechado, sabe-se que o falante a ser
identificado está entre a população de referência de falantes, enquanto que num
conjunto aberto, o falante pode ou não estar incluído nessa população. Esta distinção
entre conjuntos abertos e fechados não é relevante para a verificação já que se
assume que o indivíduo, cuja identidade é reclamada, está inserido no conjunto de
12
referência dos falantes. Por outro lado, na verificação o conjunto é conhecido, ao
passo que na identificação o conjunto pode ser conhecido ou desconhecido.
Dentro do reconhecimento de falantes distinguem-se três tipos de reconhecimento:
naïve – reconhecimento perceptivo; semiautomático – utilização da tecnologia, como
os espectrogramas, por peritos treinados; automático – utilização de sistemas
computadorizados na associação de vozes e falantes. O reconhecimento
semiautomático e automático envolve a aplicação de técnicas analíticas, quer
humanas quer automáticas, ao contrário do reconhecimento naïve que é
desempenhado por pessoas comuns sem treino específico. Baseado nesta distinção, o
reconhecimento de falantes pode categorizar-se em duas classes distintas:
reconhecimento técnico e reconhecimento naïve (Nolan, 1983). Esta categorização,
proposta por Nolan, permite diferenciar o reconhecimento de falantes baseado na
habilidade humana inata de reconhecer vozes de técnicas especializadas, quer sejam
perceptivas, visuais ou electrónicas.
2.3.2. Fonética Acústica
Foi já referido, anteriormente, que a Fonética Forense utiliza os recursos e métodos
fonéticos tradicionais para o reconhecimento de falantes. Como tal, vários parâmetros
são analisados para obter o máximo de informação individual sobre determinada voz,
de forma a poder relacioná-la com um indivíduo em particular. Na verdade, não existe
um conjunto de parâmetros definido e a escolha dos mesmos é, na generalidade,
ditada pela especificidade de cada caso. Ao longo dos anos, várias foram as tendências
para manter a análise perceptiva separada da análise acústica, mas a actual
abordagem centra-se na conjugação dos dois tipos de análise. De facto, o recurso
tanto à análise perceptiva como à acústica é indispensável uma vez que cada uma, por
si só, revela-se em muitos casos insuficiente. A utilização de parâmetros acústicos na
fonética forense é extremamente importante, pois a Fonética Acústica permite fazer
uma análise quantitativa e precisa dos traços perceptivos que caracterizam uma voz.
13
Desta forma, a análise forense deve contemplar a análise de parâmetros perceptivos e
acústicos que, em conjunto, permitem fazer uma descrição mais rigorosa da voz.
2.3.3. Factores condicionantes
Como tem vindo a ser dito, a principal tarefa da Fonética Forense assenta na extracção
das principais características de uma voz que permitam relacioná-la e atribuí-la a
determinado falante. No entanto, esta tarefa está longe de ser uma tarefa simples,
pois existem vários factores condicionantes que dificultam a análise e tornam a
identificação de falantes numa tarefa bastante complexa. Em primeiro lugar, a
principal dificuldade do reconhecimento de falantes relaciona-se com o facto de não
existirem traços no sinal de fala que veiculem, exclusivamente, a informação
discriminadora do falante (Figueiredo, 1994), ao contrário do que sugere o termo
voiceprint introduzido por Kersta (1962; apud Nolan 1983) na década de sessenta. No
início dos estudos forenses da voz, alguns investigadores interpretaram o termo
voiceprint como sendo uma forma gráfica de representação da voz com um valor de
identidade individual e exclusivo semelhante ao termo fingerprint. Porém, o sinal de
fala é, principalmente, determinado pela mensagem linguística, pelo que as
informações inerentes ao falante veiculam-se indirectamente no sinal acústico
produzido por cada indivíduo. Esta é uma das principais diferenças que distingue a
identificação de falantes de outras técnicas, como a análise de impressões digitais ou o
ADN, que assentam na identificação de pessoas a partir de características intrínsecas a
cada indivíduo. O carácter variável das emissões de fala demonstra bem que, ao
contrário de outros traços individuais anteriormente referidos, a voz não é um
‘instrumento’ com propriedades fixas e inalteráveis. De facto, a variação intra-falante é
muitas vezes um dos factores que mais dificultam a identificação de falantes. São
várias as circunstâncias que contribuem para a impossibilidade de produzir dois
enunciados idênticos. Factores como o contexto social (formal versus informal), o
contexto situacional (presença de stress psicológico ou estado emocional), entre
outros, contribuem para a variabilidade dos parâmetros de identificação. Apesar da
variação intra-falante ser constante e dificultar a tarefa de comparação entre duas
14
amostras de fala, essa variação não impossibilita a identificação, já que o pressuposto
de base é o de que a variação inter-falante é superior à variação intra-falante. A
variação intra-falante é uma limitação relacionada com a produção de fala, mas
existem outros problemas e limitações de ordem técnica. Uma das limitações técnicas
mais frequentes no contexto forense diz respeito à banda telefónica. A banda
telefónica tem um limite de frequências entre os 300Hz e os 3400Hz, pelo que todos os
parâmetros inerentes ao falante que se situem fora dessas frequências não são
captados, apesar de poderem ser reconstituídos pelos ouvintes. Assim, o espectro das
consoantes fricativas ou os formantes mais altos das vogais não podem ser usados
como parâmetros de identificação (Jessen, 2008). Por outro lado, a má qualidade das
gravações, a presença de eco ou barulho de fundo dificultam em muito a tarefa do
perito. Outra agravante está relacionada com a reduzida duração das amostras. Por
um lado, quanto mais reduzida for a gravação menos representativa é do padrão de
fala de um indivíduo e, por outro lado, se a amostra for muito reduzida pode não
conter os segmentos que são mais ricos em características dependentes do falante
(Jessen, 2008).
2.4. Identificação de falantes
Todos os seres humanos são dotados de capacidades para reconhecer indivíduos
apenas através da voz nas mais variadas situações do dia-a-dia. Um telefonema
anónimo ou uma personalidade famosa a discursar na rádio são apenas exemplos que
demonstram a capacidade humana de reconhecer vozes. Quando ouvem uma frase, os
indivíduos percebem o seu conteúdo linguístico e, ao mesmo tempo, reconhecem a
identidade do falante, mesmo sob várias condições adversas como a presença de ruído
de fundo ou várias pessoas a falar em simultâneo. A capacidade dos indivíduos para
reconhecer vozes sugere que estes armazenam informação detalhada sobre as vozes
das pessoas que conhecem ao longo da vida (Hollien & Schwartz, 2001), da mesma
forma que armazenam informação sobre particularidades físicas das pessoas, como
traços faciais ou a cor do cabelo. Neste sentido, o tempo de contacto com uma voz, a
15
familiaridade do ouvinte com a voz (Amino & Arai, 2008) ou a própria habilidade do
ouvinte são preponderantes na tarefa do reconhecimento de vozes. Por outro lado,
mesmo sem conhecer o enunciador de uma frase, o ser humano possui a capacidade
de lhe atribuir algumas características gerais como o sexo, a idade ou o estado
emocional. Assim, quando se ouve alguém falar, e não se tem informação visual sobre
o falante, os indivíduos podem reconstruir algumas características físicas ou
emocionais a partir de pistas acústicas.
A identificação do sexo de um falante é relativamente acessível, pois a separação entre
o sexo feminino e o masculino assenta na diferença da frequência fundamental (F0)
que, geralmente, é mais elevada nas mulheres (200Hz, em média (Stevens, 2000)) do
que nos homens (120Hz, em média (Stevens, 2000)). Ainda assim, a distinção entre o
sexo feminino e o masculino não é sempre evidente, já que valores de F0 que se
aproximem muito dos limites da gama de frequências associadas a cada sexo podem
ser difíceis de discriminar. Vários estudos demonstram que existem outras pistas para
identificar o sexo do falante para além de F0. Schwartz (1968, apud Figueiredo, 1994)
observou que é possível determinar o sexo do falante sem utilizar pistas com fonte
glotal. A partir de consoantes fricativas não vozeadas, Schwartz verificou que o ponto
de concentração de energia é mais elevado nas mulheres, consequência do menor
tamanho do tracto vocálico feminino. As diferenças entre os dois sexos estão,
também, associadas a questões ritmico-temporais (Kaiser, 1940; apud Figueiredo,
1994). Khuen e Moll (1976) sugerem que o facto de as mulheres falarem mais rápido
do que os homens deve-se, uma vez mais, ao menor tamanho do tracto vocálico
feminino que provoca movimentos mais rápidos entre os articuladores. Lasse et al.
(1979) realizaram um estudo sobre a relação entre pistas acústicas e a identificação do
peso e altura dos falantes e verificaram que existem pistas perceptivas que reflectem
características físicas como o peso e altura dos indivíduos. Neste estudo, verificou-se
também que o tamanho do enunciado não tem influência na avaliação de peso/altura.
Estes resultados sugerem a existência de uma relação entre F0 e altura/peso; no
entanto, Künzel (1989) realizou um estudo para averiguar esta associação e não
encontrou nenhuma correlação entre estes factores. Shipp & Hollien (1969) revelam
que, no seu estudo, houve um elevado acerto entre a idade dos participantes, que
16
abrangia uma gama de 70 anos, e a idade estimada pelos informantes. Todos estes
estudos demonstram que a voz é um ‘instrumento’ extremamente rico, transportador
de pistas perceptivas que podem revelar muitas informações sobre o falante.
2.4.1. Parâmetros perceptivos
O facto de os seres humanos serem capazes de associar vozes a indivíduos significa
que cada voz tem marcas individuais que os permite reconhecer falantes. Dito de
outro modo, para além do conteúdo linguístico de um continuum sonoro existe,
também, informação linguística e extra-linguística relacionada com aspectos
individuais do falante que se veiculam simultaneamente no sinal acústico. A
informação linguística está relacionada com o contexto linguístico do falante e a
informação extra-linguística relaciona-se com as características anatómicas do tracto
vocálico do falante. Neste sentido, o sinal de fala deve ser entendido como uma função
complexa que envolve não apenas traços anatómicos mas também factores sócio-
culturais (Figueiredo, 1994).
A produção linguística dos falantes é reflectora de marcas sócio-culturais, na medida
em que cada falante se expressa através de uma língua particular, exibindo traços
dialectais e sociolectais que o caracterizam. As variáveis sociológicas como o contexto
social ou a educação e a localização geográfica contribuem, portanto, para a
caracterização de um falante. O factor social e dialectal não constitui, por si só, um
parâmetro de identificação, já que as marcas dialectais e sociolectais são partilhadas
por comunidades linguísticas e não exclusivamente por um só falante. A este nível, a
noção de idiolecto é bastante interessante, pois Baldwin (1979; apud Nolan, 1983)
sugere que, mesmo numa comunidade dialectal, cada indivíduo continua a ter a sua
forma preferida de pronunciar as palavras. Segundo o mesmo autor, a combinação das
inúmeras alternativas de pronunciação das palavras dá origem a uma forma particular
de falar, isto é, um idiolecto. Mas, ainda que os traços dialectais e sociolectais não
sejam, em exclusivo, determinantes para a identificação de um falante, estes são
17
relevantes para o modelo forense, pois contribuem para a descrição do perfil da voz do
falante.
Outro domínio que fornece pistas para a identificação do falante é a qualidade da voz.
À qualidade da voz atribuem-se duas componentes: a componente orgânica e a
componente de setting articulatório (Laver, 1980). Estas duas componentes
distinguem-se, essencialmente, pelo facto de a primeira não poder ser controlada pelo
falante, ao passo que a segunda é deliberadamente controlada por cada indivíduo.
Segundo Laver, a primeira componente está relacionada com a fisiologia e anatomia
do tracto vocálico de cada falante em particular. A anatomia do falante condiciona a
sua qualidade da voz através da dimensão, massa e geometria dos órgãos vocálicos,
pelo que o tamanho do tracto vocálico ou o volume da cavidade nasal, por exemplo,
contribuem para a qualidade da voz de um falante. A segunda componente diz
respeito a configurações articulatórias habituais que cada indivíduo adopta quando
fala, pois, de acordo com Laver, cada falante tende a usar configurações específicas do
seu tracto vocálico na sua forma natural de falar. Na obra The phonetic description of
voice quality, Laver (1980) faz a descrição da qualidade da voz distinguindo dois tipos
de settings - os supralaríngeos e os fonatórios – sendo que estes são descritos como
‘desvios’ da configuração neutra do tracto vocálico. Assim, segundo Laver, alterações
na configuração neutra do tracto vocálico supralaríngeo resultam em mudanças
longitudinais, latitudinais ou velofaríngeas do tracto vocálico. As alterações do eixo
longitudinal resultam em quatro tipos de deslocamento dos órgãos da sua posição
neutra. Os dois primeiros implicam movimentos verticais da laringe, ou seja, o
levantamento e abaixamento da laringe. O terceiro tipo de modificação envolve a
protrusão dos lábios e o quarto implica a retracção e levantamento do lábio inferior.
Os settings latitudinais envolvem tendências quase permanentes para manter um
efeito constritivo ou expansivo na área de secção transversal nalgumas posições ao
longo do comprimento do tracto vocálico. Essas tendências podem ser originadas pela
acção de vários órgãos nomeadamente os lábios, a língua, a faringe e o queixo. As
mudanças velofaríngeas do tracto vocálico dizem respeito à nasalidade, pelo que o
autor distingue dois settings que dão origem à voz nasal e voz não-nasal. Por último, os
settings fonatórios estão relacionados com o comportamento da laringe que permite
18
categorizá-los em cinco modos de vibração da laringe (falsete, sussurro, creak,
harshness e breathiness) para além da voz modal.
2.4.2. Parâmetros acústicos
Os parâmetros de identificação de falantes descritos no ponto anterior (contexto
social/dialectal e qualidade da voz) são, geralmente, obtidos através de uma análise
perceptiva. Porém, alguns eventos são melhor captados acusticamente. A frequência
fundamental (F0) é considerada por muitos autores um dos parâmetros mais
importantes em fonética forense, sobretudo porque é considerado um parâmetro
robusto, uma vez que pode ser extraído mesmo em gravações de má qualidade (Rose,
2002). Tal como se demonstrou através da teoria fonte-filtro (2.1.), a produção de sons
vocálicos envolve a vibração das cordas vocais que actuam como fonte. A frequência
fundamental é o correlato acústico da frequência de vibração das cordas vocais que é
determinada pelo tamanho das mesmas - massa e comprimento. Quanto maiores
forem as cordas vocais mais baixos são os valores de F0. As diferenças da frequência
fundamental, relacionadas com o tamanho das cordas vocais, permitem distinguir (na
maioria dos casos) a voz masculina da voz feminina pois, geralmente, as mulheres têm
as cordas vocais mais pequenas do que os homens. A frequência fundamental revela,
portanto, características específicas do falante uma vez que as dimensões das cordas
vocais variam de indivíduo para indivíduo. No entanto, os valores de F0 de um falante
não são invariáveis. São, aliás, vários factores que contribuem para as mudanças da
frequência fundamental. Vários estudos demonstram que alterações do estado
emocional provocam variações em F0. Ghiurcau et al. (2010) realizaram um estudo,
testando cinco tipos de emoções (alegria, aborrecimento, medo, raiva e neutro) e
verificaram que, à excepção do ‘aborrecimento’, todas as outras emoções se afastam
do padrão de frequência fundamental do estado neutro, manifestando um aumento
nos valores de F0. Neste sentido, sabe-se, também, que a presença de stress
psicológico influencia os valores da frequência fundamental. Apesar das dificuldades
para simular o stress psicológico em laboratório, alguns autores conseguiram induzir o
19
stress através da execução de tarefas em tempo limitado. Hecker et al. (1968; apud
Figueiredo 1994) observaram que os valores médios de F0 sobem sob a presença de
stress, embora nalguns participantes do estudo se tenha observado o efeito contrário.
Outras alterações das frequências de F0 estão relacionadas com diferenças temporais
entre duas amostras que implicam sempre variações neste parâmetro. Garrett &
Healey (1987; apud Romero, 2001) observaram que o valor médio de F0 varia ao longo
do dia (manhã, início de tarde e fim de tarde). Outros autores estudaram as variações
de F0 em intervalos de tempo maiores e os resultados convergem todos no mesmo
sentido, demonstrando que a frequência fundamental sofre alterações entre dois
pontos temporais. Segundo Romero (2001), o índice de variabilidade de F0 será tanto
maior quanto maior for a duração do intervalo temporal. Por último, factores
relacionados com a ingestão de álcool, consumo de substâncias psicotrópicas ou
estado de saúde (gripes ou depressões) podem ter um efeito considerável nas medidas
de F0. Todos estes factores, que podem, potencialmente, influenciar a frequência
fundamental, demonstram que deve haver um controlo destas variáveis quando se
comparam duas gravações. Outros parâmetros relacionados com F0 são o jitter e o
shimmer que correspondem às microperturbações da frequência (jitter) e da
amplitude (shimmer) (Figueiredo, 1994). A utilização destes parâmetros pode ser
relevante para o contexto forense, porque estas perturbações estão associadas à
qualidade de voz.
Outro parâmetro acústico frequentemente analisado no contexto forense é o padrão
formântico das vogais. Como foi descrito na teoria acústica de produção de fala (2.1.),
os formantes são o resultado de diferentes áreas de ressonância do tracto vocálico.
Teoricamente, o número de formantes é infinito (Rose, 2002) mas apenas os primeiros
são tidos em conta devido às condições em que é obtida a gravação no contexto
forense (má qualidade ou limitação da banda telefónica, por exemplo). F1 e F2 têm
uma relação directa com os movimentos da língua (avanço/recuo e
elevação/abaixamento) e são os principais responsáveis pela qualidade da vogal, como
foi já referido no ponto 2.2. A relação de F1 e F2 com a identidade da vogal restringe,
em parte, a variação inter-falante, já que as variações de F1 e F2 só podem existir
dentro dos limites impostos pelo sistema vocálico de cada língua. Contudo, as
20
frequências de F1 e F2 das vogais fornecem informação relevante para a identificação
de falantes na medida em que os valores destes formantes denotam as tendências
articulatórias de cada indivíduo, como a retracção permanente da língua. Por outro
lado, as frequências dos formantes são determinadas pelo tamanho e pelas diferenças
nas várias secções do tracto vocálico do falante (Jessen, 2008). Para além de F1 e F2,
existem outros formantes superiores, como F3 e F4, que não têm uma acção directa na
identidade da vogal, mas estão relacionados com as características anatómicas do
tracto vocálico de cada falante. Acredita-se que os formantes superiores reflectem as
ressonâncias de cavidades relativamente fixas, como a laringe, que geralmente são
pouco afectadas pelas mudanças na configuração do tracto vocálico, aquando da
produção dos diferentes sons (Rose, 2002). O facto de os formantes superiores serem
reflectores das características específicas de cada indivíduo torna-os um parâmetro
robusto para a identificação de falantes, no entanto, como foi referido, as
circunstâncias em que são obtidas as gravações inviabilizam, muitas vezes, a sua
utilização.
2.5. Disfarce
A presença do disfarce é, sem dúvida, um dos factores que mais dificulta a tarefa do
perito forense, dado que o disfarce pode distorcer a voz e produzir uma enorme
variação dos parâmetros tais como F0, frequência dos formantes, banda formântica e
duração dos segmentos, o que afecta significativamente a identificação do falante
através dos espectrogramas. A problemática do disfarce de voz começa na sua própria
definição. Em contraste com o processo normal de produção de fala, vários factores
como estados patológicos específicos (gripes ou estado psicológico, por exemplo)
podem modificar as características gerais do tracto vocálico e as suas propriedades
acústicas e, de alguma forma, camuflar a identidade do falante. Estas situações,
embora actuem como um disfarce, não são controladas pelo indivíduo. Por disfarce
entende-se a acção deliberada de um falante que altera a sua voz, discurso ou língua
com o propósito de esconder a sua identidade. Note-se que a detecção de muitas
formas de disfarce pressupõe o conhecimento do comportamento vocal do falante
21
sem disfarce, que muitas vezes é inexistente em situações forenses (Künzel, 2000). A
título exemplificativo, Künzel (2000) imagina uma gravação desconhecida que contém
a voz de um indivíduo, cuja qualidade é extremamente nasal. Sem referências da
forma normal de fala do mesmo indivíduo, a voz da gravação pode ser entendida como
um disfarce, mas pode ser, efectivamente, a qualidade de voz do falante.
O disfarce de voz pode ser classificado em deliberado versus não-deliberado e
electrónico versus não-electrónico (Rodman, 2000). O disfarce deliberado-electrónico
corresponde à utilização de aparelhos electrónicos para alterar a voz, enquanto o não-
deliberado-electrónico inclui as distorções e alterações na voz provocadas pelas
propriedades dos canais de transmissão ou limitações da banda telefónica, por
exemplo. O disfarce não-deliberado-não-electrónico diz respeito às alterações já
comentadas anteriormente que resultam de estados involuntários, como estado
emocional, doenças, consumo de álcool ou drogas. Por fim, o disfarce deliberado-não-
electrónico é o que se enquadra na definição de disfarce antes apresentada,
correspondente à distorção da voz através de alterações na configuração do tracto
vocálico ou na forma de fonação tal como produção de falsetes ou bloqueio das fossas
nasais. É neste último tipo de disfarce que incide o presente trabalho. Künzel (2000)
apresenta os tipos de disfarce mais frequentes no contexto forense e classifica-os em
quatro categorias distintas, segundo o aspecto em que incidem. O autor categoriza os
diferentes tipos de disfarce em: alterações de voz (levantamento e abaixamento de
pitch2, voz chiada, rouquidão artificial e voz sussurrada), características de ressonância
(objecto no tracto vocálico, ressoador adicional – ex. caneca perto da boca,
hipernasalidade e lenço à frente da boca), língua (mudança de dialecto e simulação de
um sotaque estrangeiro) e a forma de falar (redução ou exagero na variação do pitch e
mudanças no tempo de fala). A lista apresentada por Künzel não é exaustiva, mas
demonstra bem a multiplicidade de formas possíveis para camuflar a identidade de um
falante. Assim, percebe-se facilmente que muitos dos disfarces apresentados
provoquem alterações significativas nos parâmetros acústicos do sinal de fala,
nomeadamente nos valores da frequência fundamental, nas frequências dos
2 O pitch é o correlato perceptivo da frequência fundamental.
22
formantes, na banda formântica ou na duração dos segmentos, o que dificulta ou
impossibilita, muitas vezes, a identificação do falante. Por outro lado, alguns disfarces
serão mais eficazes do que outros, isto é, determinados disfarces provocarão mais
modificações no sinal acústico do que outros. Da mesma forma, certos parâmetros
acústicos podem ser afectados por um tipo de disfarce mas podem ser impermeáveis a
um outro tipo. A eficácia do disfarce está, também, relacionada com o indivíduo que o
efectua. Dito de outro modo, nem todos os falantes são igualmente aptos para
efectuar um tipo de disfarce, já que a habilidade para disfarçar a voz está dependente
do poder de manipulação dos órgãos vocais, pelo que o mesmo disfarce pode ser
eficaz para um falante e ineficaz para outro.
A literatura sobre o disfarce de voz não é muito extensa. É necessário, por um lado,
estudar as várias possibilidades de disfarce e, por outro lado, é preciso alargar a
análise aos vários parâmetros acústicos. No entanto, alguns trabalhos demonstram
que a presença do disfarce interfere nos parâmetros acústicos.
Reich et al. (1976) testaram o efeito de seis tipos de disfarce (imitação da voz de um
velho, rouquidão, hiper-nasalidade, diminuição do tempo de fala e disfarce à escolha)
na identificação de falantes através da análise espectrográfica. Os resultados
revelaram que a presença do disfarce interfere na identificação de falantes, pelo que a
taxa de correcta identificação decresce significativamente. Os autores afirmam que,
embora todos os disfarces interfiram na identificação do falante, alguns são mais
eficazes que outros. A nasalidade e a diminuição no tempo de fala foram os disfarces
menos eficazes. A justificação para a ineficácia destes disfarces prende-se com o facto
de, no caso da nasalidade, o espectro gerado durante a fonação nasal ser fortemente
dependente das características anatómicas do falante. A diminuição no tempo de fala,
apesar de aumentar a duração das vogais e das palavras, provoca poucas alterações
nas frequências dos formantes e na banda formântica. Segundo os autores, a fraca
percentagem de correcta identificação nos disfarces da imitação da voz de um velho e
rouquidão deve-se, possivelmente, às alterações da fonte laríngea.
Rose & Simmons (1996) estudaram a influência de alguns tipos de disfarce no padrão
formântico das vogais. Neste estudo, são abordados os disfarces relativos à imitação
23
de um sotaque regional, imitação da voz de um comentador político, colocação de um
lenço à frente da boca e imitação de uma voz feminina. Os autores concluem que o
primeiro e segundo formantes apresentam sempre diferenças consideráveis,
independentemente do disfarce usado. Relativamente a F3 e F4, os autores afirmam
que a existência de diferenças depende do tipo de disfarce. Na imitação do
comentador político e da voz feminina, F3 e F4 apresentaram diferenças substanciais
contudo, na colocação do lenço à frente da boca ou na imitação de um sotaque, F3 e
F4 não diferiram consideravelmente. Ainda neste artigo, os autores mencionam que o
disfarce que envolvia uma alteração no tipo de fonação (falsete) teve de ser excluído
porque não podia ser adequadamente analisado pelo computador, dado que o
formant tracker3 confundia as harmónicas com os formantes. Esta constatação é
bastante interessante uma vez que demonstra as limitações impostas pelo disfarce na
utilização de uma ‘ferramenta’ de análise para medição dos formantes.
Num outro estudo sobre o disfarce da voz, Künzel (2000) testa os efeitos de três
disfarces (aumento de F0, descida de F0 e desnasalização apertando o nariz) na
frequência fundamental. Os resultados sugerem que é possível recuperar a frequência
fundamental natural de um falante, com uma margem de erro aceitável, se o disfarce
consistir na descida de F0 ou na desnasalização. Contudo, se o disfarce envolver a
subida de F0 os dados não permitem inferir, com precisão, a frequência fundamental.
O autor observa, ainda, que houve um decréscimo no tempo de fala particularmente
nos disfarces que envolvem a subida e descida de F0. Adicionalmente, observa-se um
aumento do número e duração das pausas que pode ser explicado como consequência
da configuração inabitual dos órgãos articulatórios que exige mais concentração e
esforço na articulação por parte do falante.
Zhang & Tan (2007) estudaram o efeito de dez tipos de disfarce na performance de um
sistema automático de reconhecimento de falantes. Os disfarces testados foram o
aumento de F0, a descida de F0, a rapidez e o abrandamento de elocução, o sussurro,
a nasalidade, uma máscara à frente da boca, o uso de um bite block (lápis), um objecto
3 O formant tracker é uma ferramenta disponível em vários softwares de análise acústica da voz que localiza, automaticamente, os formantes nos espectrogramas.
24
na boca (pastilha elástica) e um sotaque estrangeiro. Os autores concluíram que, em
comparação com a voz normal, a taxa de correcta identificação diminui
substancialmente na presença de qualquer disfarce, à excepção do sotaque
estrangeiro. Contudo, os disfarces que mais degradaram a eficiência do sistema de
reconhecimento de falantes foram a máscara à frente da boca, a subida de F0 e o
sussurro. Em segundo lugar, os disfarces relativos à pastilha elástica, descida de F0 e
nasalidade foram os que tiveram mais influência no desempenho do sistema.
Constatou-se que o sistema automático de reconhecimento de falantes é eficiente nos
restantes disfarces, uma vez que o seu efeito não é significativo. Neste estudo
demonstrou-se, ainda, que a variação inter-falante existe não só na voz normal, mas
também no disfarce. Assim, a extensão da variação inter-falante difere para cada tipo
de disfarce, já que alguns falantes estão mais aptos para determinados disfarces. Neste
sentido, os autores verificaram que um determinado disfarce não é eficaz para todos
os indivíduos.
Depois de abordadas as principais questões relacionadas com a Fonética Forense e
reunidas algumas perspectivas que servem de suporte teórico no contexto da
Identificação de Falantes, pode proceder-se à análise exploratória dos dados, a fim de
compreender a influência do disfarce na voz.
25
3. METODOLOGIA
3.0. Introdução
Neste capítulo são apresentados todos os detalhes metodológicos. Em primeiro lugar,
descreve-se o desenho experimental e propõem-se as hipóteses subjacentes a este
trabalho (3.1.); em segundo lugar, caracterizam-se os Informantes que participaram no
estudo (3.2.); de seguida, descreve-se a elaboração dos materiais utilizados (3.3.) e faz-
se a descrição da recolha de dados (3.4.); por último, no ponto 3.5., explica-se como
foram tratados os dados relativamente à análise espectrográfica (3.5.1) e estatística
(3.5.2).
3.1. Desenho Experimental
É indiscutível que os seres humanos são capacitados para a identificação de vozes e
que, mesmo sem visualizar o emissor de um trecho de fala, são capazes de lhe atribuir
algumas características físicas ou psicológicas (Lasse et al., 1979; Shipp & Hollien,
1969). Estes factos demonstram que, para além do seu conteúdo linguístico, um
continuum sonoro possui informação inerente ao falante nele codificada.
O Reconhecimento de Falantes assenta na premissa de que o sinal acústico produzido
por um indivíduo contém marcas específicas do mesmo que se veiculam
indirectamente no sinal de fala. A assunção de que cada falante imprime traços
individuais em qualquer produção discursiva baseia-se no facto de o sistema produtor
dos sons de fala - combinação de uma fonte de energia sonora e de filtros que moldam
o som produzido pela fonte (Fant, 1960) - estar directamente relacionado com as
características anatómicas do aparelho fonador de cada falante. Desta forma, assume-
se que parâmetros acústicos como a frequência fundamental (F0) ou os formantes das
vogais fornecem informação particular sobre os indivíduos, visto que dependem da
configuração fisiológica e estrutural do tracto vocálico de cada sujeito.
26
Porém, no contexto forense, são vários os casos em que o infractor utiliza estratégias
para camuflar a voz, de forma a ocultar a sua identidade e, consequentemente, não
ser reconhecido. O recurso ao disfarce da voz levanta uma questão que serviu de
ponto de partida para este estudo: será que os parâmetros acústicos são
suficientemente robustos na tarefa de reconhecimento de falantes na presença do
disfarce? Nesta linha de pensamento, colocam-se outras questões, não menos
importantes, tais como:
Os disfarces actuam todos da mesma forma?
Haverá disfarces mais eficientes do que outros?
Os vários parâmetros acústicos são igualmente afectados na presença de um
disfarce em particular?
Haverá um padrão de mudança dos parâmetros acústicos associado a cada
disfarce?
Serão alguns parâmetros mais robustos do que outros?
No decurso da investigação surgiram, ainda, outras questões que importa averiguar:
Será que o factor falante tem alguma influência na execução do disfarce?
Serão todas as vogais igualmente permeáveis ao disfarce?
O principal objectivo deste trabalho é, portanto, estudar a influência do disfarce nos
seguintes parâmetros acústicos: F0, F1, F2, F3 e F4. Partindo da análise dos referidos
parâmetros nas vogais [u], [o], [ɔ], [i], [e], [ɛ] e [a] produzidas em diferentes
condições, pretende-se, num primeiro momento dedicado à análise da Voz Normal, (i)
descrever os vários parâmetros acústicos, abordando a variação intra e inter-falante; e
(ii) verificar a eficiência de cada parâmetro na distinção entre falantes. Na segunda
parte da análise, procura-se (iii) averiguar se os disfarces causam alterações nos vários
parâmetros acústicos, através da comparação dos dados da Voz Normal com os dados
dos disfarces testados; (iv) verificar se os diferentes disfarces produzem todos o
mesmo efeito nos parâmetros acústicos; (v) aferir se todos os parâmetros são,
igualmente, afectados por cada disfarce; (vi) apurar se existem parâmetros resistentes
ao disfarce; (vii) observar se o efeito do disfarce é homogéneo entre as vogais; (viii)
27
constatar se o factor falante tem alguma influência na performance do disfarce; e (ix)
observar as alterações produzidas pelo(s) disfarce(s) nos triângulos vocálicos.
Antes de descrever o procedimento metodológico, são apresentadas as hipóteses
subjacentes a este estudo, considerando os objectivos anteriormente descritos e
tendo em vista os resultados de trabalhos anteriores (secção 2.5.).
Hipótese 1: A presença do disfarce interfere sempre nos parâmetros
acústicos, embora determinados disfarces provoquem mais
modificações no sinal acústico do que outros (Reich et al., 1976).
Hipótese 2: A influência de um tipo de disfarce não é homogénea entre os
diversos parâmetros acústicos (Rose & Simmons, 1996; Künzel,
2000).
Hipótese 3: Cada parâmetro acústico não é igualmente afectado pelos vários
disfarces (Künzel, 2000), pelo que o mesmo parâmetro pode ser
alterado por um tipo de disfarce mas ser impermeável a outro
(Rose & Simmons, 1996).
3.2. Informantes
A amostra formada para as gravações é constituída por oito pessoas, quatro do sexo
masculino e quatro do sexo feminino, inseridas na faixa etária dos 20-25 anos. Todos
os Informantes são falantes da variedade standard do Português Europeu e naturais da
zona de Lisboa. No que diz respeito à formação académica, apenas dois Informantes
possuem conhecimentos linguísticos, pois frequentam o 1º ano do curso de Línguas,
Literaturas e Culturas. Os restantes Informantes são formados em áreas diversas,
distintas da Linguística, pelo que não detêm nenhum tipo de conhecimento linguístico
específico.
28
3.3. Materiais – Corpus
O corpus utilizado é composto por 28 frases (vide Anexo 6). A elaboração do mesmo foi
feita com base nalguns critérios específicos, na tentativa de ser o mais uniforme
possível.
Em primeiro lugar, escolheram-se para a análise todas as vogais orais tónicas do
Português Europeu ( [u], [o], [ɔ], [i], [e], [ɛ] e [a] ) com excepção da vogal [ɐ]. Esta não
foi tida em consideração, uma vez que, devido às suas restrições fonológicas, não
ocorre em todos os contextos segmentais. Posteriormente, foram seleccionadas
palavras com três sílabas que contivessem cada uma das vogais mencionadas em
sílaba tónica intermédia. A escolha da sílaba tónica foi motivada pelo facto de,
geralmente, ser esta a sílaba com maior duração e com mais energia, propiciando uma
maior estabilidade, já que a quantidade de informação disponível é maior (mais
duração) e os formantes das vogais são mais visíveis (mais energia).
Em segundo lugar, foi tido em conta o contorno fonético das vogais relativamente à
consoante que ocupa a posição de ataque na sílaba tónica. Assim, foram escolhidas
quatro consoantes orais vozeadas com base no modo de articulação: duas fricativas
([z] e [v]) e duas oclusivas ([b] e [d]). No que diz respeito ao ponto de articulação, os
segmentos seleccionados classificam-se em consoantes dentais ([d] e [z]), bilabial ([b])
e labiodental ([v]). Importa referir que a selecção destas consoantes em particular não
obedeceu a nenhum critério específico, visto que o foco deste trabalho não incide na
influência exercida por cada consoante nos segmentos vocálicos. Estas foram
escolhidas com o intuito homogeneizar o efeito da coarticulação progressiva e de
modo a contextualizar as vogais a analisar.
Por último, todas as palavras foram integradas na frase Eu digo …, Paulo., de forma a
manter o mesmo ritmo e intensidade em todas as frases. Optou-se por manter o
mesmo contorno prosódico a fim de evitar variações entoacionais que poderiam ter
influência nos parâmetros acústicos analisados.
29
3.4. Recolha dos Dados
3.4.1. Requisitos éticos
Todos os Informantes leram a Declaração de Objectivos (vide Anexo 7) e assinaram o
Termo de Aceitação (vide Anexo 8), expressando o consentimento na utilização dos
dados nos termos descritos no documento.
3.4.2. Gravações
A recolha dos dados foi feita através de gravações de voz realizadas no Laboratório de
Fala do Centro de Linguística da Universidade de Lisboa, uma vez que este dispõe de
uma sala com tratamento acústico próprio - sem eco ou ruído. Este ambiente de
gravação, embora artificial, foi escolhido no sentido de se obter uma boa qualidade do
sinal e sem interferências de qualquer tipo. Foi utilizado um gravador Marantz PMD
670 e um microfone Sennheiser ME 62 com bandolete de suporte (tipo auricular) que
permite manter sempre a mesma distância entre a boca e o microfone para todos os
Informantes. As gravações foram efectuadas com uma frequência de amostragem de
44100Hz, 16-bit, Mono.
Todos os Informantes foram gravados em sessões individuais. As frases que
constituem o corpus surgiram num monitor, frente ao qual os Informantes ficaram
sentados. A passagem das frases foi feita pela investigadora de modo a poder
controlar a eventual necessidade de repetição de leitura.
Cada Informante leu o conjunto de 28 frases (ver ponto 3.3.) sob cinco condições
diferentes:
1 - Voz normal (VN);
2 - Subida de F0 (D1);
3 - Descida de F0 (D2);
4 - Máscara (D3);
5 - Palhinha (D4).
30
No decurso da análise dos dados, cada condição será referida como VN, D1, D2, D3 e
D4. Os disfarces mencionados foram escolhidos tendo em vista o tipo de influência
provocado por cada um. D1 e D2 têm uma acção directa na manipulação da fonte
sonora (cordas vocais); D3 e D4 incidem nos filtros do tracto vocálico, já que D3
funciona como um filtro adicional e D4 actua como limitador da acção do filtro. VN
actua como uma condição neutra, servindo como condição de controlo.
Antes de cada sessão, foram dadas instruções ao Informante sobre a forma de
produção das frases pretendida em cada Condição. Foi, também, explicado aos
Informantes que o tema do presente trabalho era o disfarce da voz. Assim, durante a
execução da tarefa, nas Condições 2 e 3, solicitou-se aos Informantes que imaginassem
uma situação fictícia de um telefonema anónimo em que tinham de disfarçar a voz,
segundo as instruções fornecidas, para não serem reconhecidos. Na Condição 1, foi
pedido aos Informantes que produzissem as frases de forma mais natural possível,
usando o seu modo de falar normal e a sua qualidade vocal. Na Condição 2, pediu-se
aos Informantes que produzissem as frases com uma voz aguda. Na Condição 3,
solicitou-se a produção das frases com uma voz grave. Na Condição 4, foi pedido aos
Informantes que produzissem as frases de forma natural com uma máscara à frente da
boca. Finalmente, na Condição 5, pediu-se aos Informantes que produzissem as frases
de forma natural com uma palhinha colocada horizontalmente entre os dentes
incisivos.
3.5. Tratamento dos Dados
3.5.1. Análise Espectrográfica
Os ficheiros foram segmentados e convertidos para uma frequência de amostragem de
11025Hz através do programa Adobe Audition, versão 3.0. Procedeu-se à redução da
frequência de amostragem para 11025Hz, que corresponde à visualização de
frequências entre os 0 e 5500Hz no espectrograma produzido pela SpeechStation –
programa usado na medição dos formantes - para que a medição das frequências dos
formantes fosse feita de forma mais precisa, uma vez que com uma frequência de
31
amostragem de 44100Hz o espectro encontra-se mais comprimido, dificultando a
localização dos formantes a medir. Deve salientar-se que a redução da frequência de
amostragem não acarreta consequências nos parâmetros acústicos.
O valor de F0 das vogais foi extraído, automaticamente, através do programa Praat,
versão 5.1.23. Para a medição das frequências dos formantes das vogais utilizou-se o
programa SpeechStation2.
Os formantes foram medidos através da técnica de Linear Predictive Coding (LPC), em
banda estreita (512 pontos), order 12 nas Condições 1, 3, 4 e 5 e order 10 na Condição
2. A medição dos formantes foi feita no núcleo vocálico, pois este é o ponto mais
estável do segmento (Figura 3). Foi escolhida a técnica de análise espectral LPC, em
detrimento da Fast Fourier Transform (FFT), dado que representa a combinação da
forma espectral da fonte glotal e a forma espectral imposta pelo tracto vocálico, sendo
assim mais apropriada para a medição dos formantes4. Através da técnica de auto-
correlação para encontrar as frequências dos componentes proeminentes, a LPC
apresenta a forma global do espectro, independentemente das frequências específicas
das harmónicas, fornecendo uma representação precisa dos filtros do tracto vocálico.
Optou-se por fazer a análise em banda estreita porque esta fornece informação
frequencial mais detalhada sobre os formantes, ao contrário da banda larga que
destaca a informação temporal sobre cada impulso glotal. Por fim, foi necessário medir
os formantes das vogais produzidas na Condição 2 em order 10, pois em order 12 não
era possível identificar correctamente os formantes, já que eram, também, visíveis as
harmónicas. Importa, ainda, referir que nalguns casos não foi possível medir o valor de
F3 e F4, pois os formantes não eram legíveis.
Figura 3 - Localização da medição de F2 da vogal [ɛ] em VN, na frase Eu digo cadela, Paulo.
4 Deve referir-se que a LPC é considerada uma boa técnica de análise de fala, com resultados precisos, desde que não se incluam segmentos nasais.
32
3.5.2. Análise Estatística
Os dados obtidos foram analisados através do programa de estatística SPSS 18. A
análise estatística efectuada assentou na aplicação de dois testes paramétricos: teste
t-student para comparação de médias e teste ANOVA para análise da variância. Antes
de se efectuar qualquer um dos testes, verificou-se se os dados em análise satisfazem
os requisitos impostos por estes testes. O primeiro requisito é cumprido, já que a
variável dependente (F0 e formantes) é sempre quantitativa; observou-se, através dos
testes Kolmogorov-Smirnov e Shapiro-Wilk, se a distribuição da variável dependente
(F0 e formantes) segue a normalidade; e, por último, confirmou-se a homogeneidade
de variância através do teste de Levene. Nalguns casos, as variáveis dependentes
representam distribuições afastadas da normalidade ou não se verifica
homogeneidade da variância devido, em parte, ao reduzido tamanho da amostra e à
variabilidade dos parâmetros entre os Informantes. Nas situações em que uma das
condições não é cumprida, realizou-se o teste não-paramétrico Kruskal-Wallis para
confirmar ou rejeitar o resultado dos testes paramétricos.
Como os testes referidos anteriormente (t-student e ANOVA) são testes de hipóteses,
implicam a existência de uma hipótese nula (H0) e de uma hipótese alternativa (Ha).
Designa-se por hipótese nula a hipótese da não diferença, a que é sujeita ao teste, por
oposição à hipótese alternativa que é a hipótese da diferença (Martinez & Ferreira,
2008). A rejeição ou aceitação da hipótese nula é feita em função do nível de
significância estabelecido, a que é directamente comparável uma probabilidade de
significância (p-value). Se o p-value for inferior ao nível de significância, então rejeita-
se a hipótese nula, caso contrário não existe evidência estatística para o fazer
(Martinez & Ferreira, 2008).
Neste trabalho, considerou-se que se rejeita a hipótese nula a partir de um valor de
significância de p < 0,05.
33
4. ANÁLISE E DISCUSSÃO DOS DADOS
4.0. Introdução
Este capítulo está dividido em duas secções, correspondentes à descrição dos dados da
voz normal (4.1.) e à comparação da voz normal com os disfarces (4.2.).
Na primeira parte (4.1.), faz-se a caracterização da voz normal, abordando, num
primeiro momento, a variação intra e inter-falante através da descrição dos triângulos
vocálicos (4.1.1.); posteriormente, descrevem-se os dados relativos à frequência
fundamental (4.1.2.) e aos formantes (4.1.3.); partindo dos dois últimos pontos,
verifica-se a eficácia de cada parâmetro na distinção de falantes (4.1.4.); e, por último,
analisa-se a relação entre as variáveis informante e vogais, de forma a testar a
influência do factor informante nas frequências das vogais (4.1.5.).
Na segunda parte (4.2.), faz-se a comparação dos parâmetros acústicos da voz normal
com os dos disfarces, com o intuito de constatar as alterações provocadas pelo(s)
disfarce(s) nos vários parâmetros (4.2.1.); testa-se a interacção entre disfarce e
informante (4.2.2.); verifica-se a influência do(s) disfarce(s) nas vogais (4.2.3.); por fim,
apresentam-se os triângulos vocálicos relativos a cada disfarce, no sentido de se
averiguar as modificações dos mesmos, comparativamente aos triângulos vocálicos da
voz normal (4.2.4.).
4.1. Voz normal
4.1.1. Triângulos vocálicos: variação intra e inter-falante
A partir das frequências de F1 e F2 das vogais estudadas, foi construído o triângulo
vocálico de cada Informante (Figuras 4 a 11). Os vários pontos que o constituem
resultam da conjugação das frequências de F1 em ordenada e de F2 em abcissa. Em
cada triângulo estão representadas as sete vogais em análise ( [u], [o], [ɔ], [i], [e], [ɛ] e
[a] ), apresentadas com cores distintas para a melhor visualização dos dados.
34
Figura 4 - Triângulo vocálico do Informante 1. Figura 5 - Triângulo vocálico do Informante 2.
Figura 6 - Triângulo vocálico do Informante 3. Figura 7 - Triângulo vocálico do Informante 4.
Figura 8 - Triângulo vocálico do Informante 5. Figura 9 - Triângulo vocálico do Informante 6.
35
Figura 10 - Triângulo vocálico do Informante 7. Figura 11 - Triângulo vocálico do Informante 8.
Legenda:
[i] [e] [ɛ] [a] [ɔ] [o] [u]
A observação dos vários triângulos vocálicos permite verificar que cada vogal não
corresponde a um ponto único, mas antes a uma área de localização. A dispersão dos
valores das vogais é consequência de diversos factores entre os quais se destacam,
para o presente estudo, o factor individual e o contexto fonético. Desta forma, a
variação das frequências dos segmentos está relacionada com o fenómeno da
coarticulação, isto é, a existência de quatro pontos distintos para cada vogal é, não
exclusivamente, o resultado da produção da mesma vogal em contextos fonéticos
diferentes. Por outro lado, a variação intra-falante desempenha, também, um papel
importante na variação dos valores de F1 e F2 de cada segmento, pois a extensão da
variabilidade das frequências das vogais depende de cada falante. Se se observarem, a
título exemplificativo, os pontos correspondentes às vogais [u], [i] e [a], verifica-se que
a disposição dos mesmos é distinta entre os indivíduos. Constate-se que os pontos
relativos à vogal [i] do Informante 3 (Figura 6) estão muito concentrados, formando
quase um ponto único, ao passo que no Informante 4 (Figura 7) os pontos estão mais
dispersos; a distribuição da vogal [a] nos Informantes 5 e 8 (Figuras 8 e 11) é variável,
quase exclusivamente, ao nível de F2, visto que os pontos apresentam
aproximadamente os mesmos valores no plano de F1; pelo contrário, as frequências
desta vogal variam tanto em F1 como em F2 no Informante 7 (Figura 10); a distribuição
dos valores da vogal [u] é mais uniforme no Informante 1 (Figura 4) do que no
36
Informante 2 (Figura 5). Assim, a inexistência de valores invariáveis deve-se não só à
influência dos segmentos adjacentes à vogal, mas também à variação intra-falante,
caso contrário a variação das frequências de um mesmo segmento seria igual em todos
os Informantes.
Por outro lado, a distribuição das vogais no espaço acústico não é semelhante entre os
Informantes. As diferentes configurações dos triângulos vocálicos, produto das
diferenças entre os falantes relativamente às frequências de F1 e F2 das vogais, são o
reflexo das características anatómicas do tracto vocálico de cada indivíduo e, ainda,
das tendências articulatórias adopta quando fala. Neste sentido, o triângulo vocálico
fornece pistas importantes para a identificação de falantes, uma vez que permite
apontar marcas específicas dos indivíduos, relacionadas com a localização das vogais, a
faixa de variação de F1 e F2, a dimensão do polígono, as distâncias acústicas, a
organização dos segmentos ou a própria localização do triângulo no espaço acústico.
Observe-se, assim, que no Informante 1 (Figura 4), existe uma separação demarcada
entre as vogais anteriores e os restantes segmentos e que os valores de F1 e F2 das
vogais anteriores média e baixa são muito próximos. No Informante 2 (Figura 5), a
proximidade das vogais posteriores alta e média forma um cluster, que se encontra
ligeiramente afastado do continuum gerado pela localização dos outros segmentos. O
triângulo vocálico do Informante 3 (Figura 6) é bastante compacto, uma vez que as
distâncias acústicas entre as vogais são pouco demarcadas. Relativamente ao
Informante 4 (Figura 7), a proximidade das vogais central e posteriores forma um
continuum separado das vogais anteriores, cujas distâncias acústicas são mais
acentuadas. O Informante 5 (Figura 8) e o Informante 6 (Figura 9) apresentam
triângulos vocálicos semelhantes do ponto de vista da sua configuração, assim como
no que diz respeito à divisão, não muito acentuada, entre as vogais anteriores e as
restantes. Contudo, os dois indivíduos apresentam alguns traços distintos, visto que o
polígono do Informante 5 é mais expandido, as distâncias acústicas entre os
segmentos são superiores às do Informante 6, bem como a extensão da variação intra-
falante. A disposição dos valores de F1 e F2 das vogais do Informante 7 (Figura 10) dá
origem a uma configuração específica do triângulo acústico. A distribuição das vogais
anteriores é bastante coesa, na medida em que as distâncias acústicas são reduzidas;
37
as vogais posteriores alta e média estão dispostas de forma circular, o que constitui
uma característica deste falante; as vogais central e posterior baixa formam um pólo
afastado dos outros segmentos, que dá origem à organização dos segmentos em três
grupos: vogais anteriores, vogais central/posterior baixa e vogais posteriores
média/alta. Por último, as distâncias entre os segmentos são relativamente uniformes
no Informante 8 (Figura 11), embora haja uma proximidade acentuada entre as vogais
posteriores alta e média.
Tomando como referência as vogais correspondentes aos extremos de constrição do
tracto vocálico, que equivalem aos ‘vértices’ do polígono ( [u], [a] e [i] ), é possível
estimar a faixa de variação de F1 e F2 de cada indivíduo. O intervalo entre as vogais [i]
e [u] corresponde, respectivamente, ao valor mínimo e máximo de F2 e a distância
entre as vogais [i]/[u] e [a] está relacionada com o valor mínimo e máximo,
respectivamente, de F1. Desta forma, a gama de variação de F1 e F2 é proporcional às
distâncias entre os vértices do triângulo acústico, pelo que quanto menor for a
distância entre si, menor será a faixa de variação desse parâmetro (F1 ou F2). Quer isto
dizer que os polígonos com dimensões reduzidas têm também uma faixa de variação
de F1 e F2 reduzida. A observação dos vários triângulos vocálicos permite verificar que
a faixa de variação de F1 e F2 não é homogénea entre os indivíduos. Constate-se, por
exemplo, que entre os Informantes 2 e 3, a variação de F1 e de F2 é superior no
Informante 2, ou que entre os Informantes 4 e 6, a gama de variação de F2 é
claramente maior no Informante 4, apesar da faixa de variação de F1 ser próxima entre
os dois falantes.
No que diz respeito à dimensão dos triângulos vocálicos, comprova-se que esta é
menor nos Informantes 3, 5, 6 e 8 do que nos restantes. Consequentemente, a gama
de variação de F1 e F2 é menor nestes indivíduos do que nos Informantes 1, 2, 4 e 7.
Por outro lado, a localização do triângulo no espaço acústico também não é
semelhante entre os dois grupos. Os polígonos das Figuras 6, 8, 9 e 11 situam-se,
tendencialmente, na zona superior direita, resultado dos valores relativamente baixos
38
dos dois primeiros formantes, ao contrário dos das Figuras 4, 5, 7 e 10 que são mais
expandidos, tanto no plano de F1 como de F2.
A divisão entre os Informantes 3, 5, 6, 8 e Informantes 1, 2, 4 e 7, motivada pelas
diferenças na dimensão e localização dos triângulos, está relacionada com o sexo dos
indivíduos, já que ao primeiro grupo pertencem todos os Informantes do sexo
masculino e ao segundo correspondem os Informantes do sexo feminino. As diferenças
verificadas entre os dois géneros estão associadas, não exclusivamente, ao tamanho
do tracto vocálico, pois quanto maior for o comprimento do mesmo, menores serão as
frequências das vogais. Uma vez que o tracto vocálico masculino é, geralmente, maior
do que o feminino, é natural que os triângulos vocálicos dos Informantes do sexo
masculino apresentem dimensões mais reduzidas do que os do sexo feminino,
consequência dos baixos valores dos formantes.
Desta forma, a variação inter-falante é mais um factor que justifica a inexistência de
valores invariáveis de F1 e F2 para as vogais. Existem, pelo contrário, zonas de
incidência para cada segmento que os distingue entre si. Neste sentido, confrontando
os vários triângulos vocálicos, verifica-se que cada vogal ocupa sempre a mesma
posição relativamente à forma do triângulo. Ou seja, a área de cada vogal pode diferir
de falante para falante no espaço acústico, bem como a distância acústica entre as
vogais, mas a sua posição relativa é igual em todos os Informantes. Importa ainda
esclarecer que, apesar de as frequências das vogais diferirem consoante os indivíduos,
a variação só existe dentro de determinados limites, caso contrário a vogal perderia as
suas características acústicas, e consequentemente a sua identidade, deixando de ser
entendida como tal.
A análise efectuada centrou-se, primordialmente, na descrição da variação intra e
inter-falante, relativamente a F1 e F2, através da visualização dos triângulos vocálicos.
Porém, é necessário, por um lado, fazer uma descrição mais aprofundada do que a
análise visual e, por outro lado, é preciso estender a análise aos outros parâmetros.
Dado que para o modelo forense é a informação particular de cada falante que é
relevante, permitindo distinguir os indivíduos entre si, de agora em diante, a análise
centrar-se-á exclusivamente na variação inter-falante.
39
4.1.2. Frequência fundamental (F0)
O gráfico da Figura 12 reúne os valores médios da frequência fundamental de cada
Informante, possibilitando visualizar as diferenças de F0 entre os falantes. Pode
observar-se que o Informante 5 é o que apresenta o valor mais baixo de F0 (94Hz) e
que o valor mais elevado (212Hz) pertence ao Informante 2, o que demonstra que a
frequência fundamental oscila entre 94Hz e 212Hz entre os indivíduos.
Figura 12 - Valores médios da frequência fundamental de cada Informante.
À excepção dos Informantes 3, 5 e 8, que apresentam valores próximos de F0 em torno
dos 100Hz, os valores médios da frequência fundamental são bastante diversos nos
restantes falantes. No entanto, pode constatar-se que há uma clara separação entre os
Informantes que origina dois grupos distintos: num grupo, a média de F0 situa-se entre
os 160Hz e 212Hz (Informantes 1, 2, 4 e 7) e, no outro grupo, a média localiza-se entre
os 94Hz e 124Hz (Informantes 3, 5, 6 e 8). Tal como foi mencionado anteriormente, a
divisão em dois conjuntos é motivada pelo contraste de género, já que ao primeiro
correspondem todos os Informantes do sexo feminino e, no segundo conjunto, estão
incluídos os Informantes do sexo masculino, sendo que a média de F0 de cada grupo é
de 186Hz e 103Hz, respectivamente. Verifica-se, portanto, que a frequência
fundamental é um parâmetro relevante na distinção de indivíduos de sexos opostos,
visto que o valor médio de F0 de cada sexo é consideravelmente diferente.
40
Para averiguar se a frequência fundamental é um parâmetro proeminente na distinção
de falantes, independentemente do sexo, realizou-se um teste t-student que compara
os valores de F0 de cada par possível de Informantes. Na Tabela 2 são apresentados os
resultados do teste para cada par testado, através do valor de t e do valor de
significância (p).
Tabela 2 - Resultados do teste t-student na comparação dos valores de F0 entre os Informantes.
Informante 1 2 3 4 5 6 7 8
1 t - -17,9 49,111 -13,32 63,667 27,84 -15,5 48,926 p - 0,000 0,000 0,000 0,000 0,000 0,000 0,000
2 t - - 38,22 11,219 40,082 27,442 8,989 38,869 p - - 0,000 0,000 0,000 0,000 0,000 0,000
3 t - - - -53,83 1,766 -22,97 -63,2 -2,521 p - - - 0,000 0,089 0,000 0,000 0,018
4 t - - - - 52,958 38,448 -3,429 61,036 p - - - - 0,000 0,000 0,002 0,000
5 t - - - - - -20,28 -67,8 -3,514 p - - - - - 0,000 0,000 0,002
6 t - - - - - - -34,62 28,714 p - - - - - - 0,000 0,000
7 t - - - - - - - 60,129 p - - - - - - - 0,000
8 t - - - - - - - - p - - - - - - - -
Os resultados indicam que, à excepção do par 3-5 (células marcadas a cinzento), todos
os pares testados são distintos entre si (p < 0,05). Dito de outro modo, o valor de F0 de
cada indivíduo difere significativamente quando comparado com outro falante. Apesar
de os sujeitos serem estatisticamente divergentes em relação a F0, o valor da
diferença não é igual em todos os pares. Ou seja, ainda que os falantes sejam distintos
entre si, o grau da diferença não é idêntico para todos os Informantes. Observe-se, a
título exemplificativo, que o valor de significância é igual (p < 0,000) em todos os pares
que contrastam o Informante 1 com os outros indivíduos. Todavia o valor de t varia
consoante o par de comparação. Assim, as diferenças são mais acentuadas no par 1-5
(t = 63,67) do que no par 1-4 (t = -13,32), por exemplo. Quer isto dizer que o
41
Informante 1 está mais próximo do Informante 4 do que do Informante 5 em relação
ao valor médio de F0, tal como se pode observar no gráfico da Figura 12. A diferença
do valor de t entre os dois pares assinalados é, maioritariamente, definida pelo sexo
dos Informantes: no par 1-4, os indivíduos são ambos do sexo feminino, ao passo que
o par 1-5 é composto por Informantes do sexo masculino e feminino. Neste sentido,
pode observar-se que os pares que apresentam resultados mais significativos, isto é,
valores mais elevados de t, são os pares constituídos por Informantes de sexos
opostos, já que os valores médios de F0 do sexo masculino e do feminino são
claramente distintos (Figura 12). Ainda assim, as diferenças de F0 também são
expressivas entre falantes do mesmo sexo, dado que, exceptuando um par, os
resultados do teste são estatisticamente significativos para todos os pares testados,
pelo que se pode afirmar que F0 é um parâmetro eficaz na distinção de falantes.
4.1.3. Formantes
No sentido do que se observou a partir dos triângulos vocálicos (ponto 4.1.1.), e tal
como sucede com a frequência fundamental, os valores dos formantes variam de
acordo com o falante. Na Figura 13 são apresentados os valores médios de F1, F2, F3 e
F4 de cada Informante, de forma a poder visualizar as diferenças entre si no conjunto
dos formantes.
Figura 13 - Valores médios de F1, F2, F3 e F4 de cada Informante.
42
O gráfico demonstra que as frequências dos formantes não são uniformes entre os
indivíduos. Constata-se que os valores mais baixos de qualquer um dos formantes
dizem respeito aos falantes do sexo masculino (Informantes 3, 5, 6 e 8) e que os
valores mais elevados correspondem aos sujeitos do sexo feminino (Informantes 1, 2,
4 e 7). O facto de os valores de F1, F2, F3 e F4 serem sempre mais baixos no sexo
masculino do que no feminino evidencia a relação existente entre a dimensão
(comprimento) do tracto vocálico e as frequências dos formantes. Assim, tal como F0,
os valores dos formantes permitem distinguir indivíduos de sexos opostos. Por outro
lado, a variabilidade entre os Informantes não é semelhante nos quatro parâmetros
acústicos (F1, F2, F3 e F4). A variação inter-falante verifica-se em todos os formantes,
mas quanto mais elevado for o formante, maior variabilidade existe entre os sujeitos,
já que a variação aumenta à medida que os valores são mais altos. Constate-se que as
frequências de F1 são muito próximas entre os indivíduos, porém os valores de F2 são
mais distintos entre os falantes, uma vez que há um aumento nas distâncias das
frequências. A diferença nos valores dos formantes é ainda mais notória em F3, pois a
separação entre os indivíduos é ampliada, verificando-se que as distâncias entre os
falantes variam numa extensão de 500Hz. Ainda assim, é em F4 que se registam as
maiores diferenças entre os indivíduos, visto que a dimensão da variabilidade deste
formante é superior aos restantes. Observe-se que a distância entre os Informantes 2 e
3, por exemplo, é de 250Hz em F3, mas que em F4 aumenta para 700Hz. Assim, as
diferenças entre os indivíduos são mais acentuadas em F3 e F4, ao contrário de F1 e
F2, cujos valores não são tão díspares. Desta forma, pode afirmar-se que a variação
inter-falante é mais elevada nos formantes altos (F3 e F4) do que em F1 e F2.
4.1.4. Eficácia dos parâmetros acústicos na distinção de falantes
No sentido de se verificar a eficácia de cada parâmetro na distinção de falantes, foi
realizado um teste de análise da variância (ANOVA), cujos resultados são apresentados
na Tabela 3. O valor de F juntamente com o valor de significância (p) demonstram a
eficiência de cada variável na discriminação de sujeitos. Quanto mais elevado for o
valor de F, mais variação do parâmetro existe entre os Informantes.
43
Tabela 3 - Resultado do teste de análise de variância (ANOVA).
Variável F Sig.
f0 456,422 0,000
f1 0,652 0,711
f2 0,638 0,722
f3 33,673 0,000
f4 37,914 0,000
Os baixos valores de F para F1 e F2, assim como os valores de significância (0,711 e
0,722), demonstram que estes dois parâmetros não variam muito entre os
Informantes, pelo que não são estatisticamente significativos para a discriminação de
falantes. Contudo, importa referir que F1 e F2 não são significantes, apenas, quando
analisados individualmente, pois a conjugação de ambos demonstra ser um parâmetro
relevante na distinção entre indivíduos, como se verificou na análise dos triângulos
vocálicos (ponto 4.1.1.). Em contrapartida, F3 e F4 apresentam valores elevados de F.
Quer isto dizer que estes parâmetros diferem consideravelmente entre os falantes,
sendo, por isso, eficientes na discriminação de indivíduos. No que diz respeito a F0, o
resultado do teste ANOVA indica que este é o parâmetro que apresenta a maior
variação inter-falante, como se pode observar através do valor de F (456,422) e de
significância (0,000). Porém, estes resultados podem estar relacionados com o facto de
o teste ter sido realizado sem fazer separação entre os Informantes do sexo masculino
e feminino. Recorde-se que, tal como se verificou através do gráfico da Figura 10,
existe uma diferença acentuada nos valores da frequência fundamental de indivíduos
de sexos opostos. Assim, é necessário testar a variável F0 em função do sexo dos
Informantes, de forma a perceber se o resultado obtido está relacionado com a
diferença de género ou se, pelo contrário, F0 continua a ser um parâmetro relevante
para a discriminação de falantes. Os resultados do teste da análise de variância
(ANOVA) para cada género são apresentados na Tabela 4. Adicionalmente, foram
testadas todas as outras variáveis (F1, F2, F3 e F4) em função do sexo do Informante.
44
Tabela 4 - Resultado do teste da análise de variância (ANOVA) para cada género.
Variável F Sig.
f0 feminino 46,11 0,000
masculino 188,51 0,000
f1 feminino 0,281 0,839
masculino 0,047 0,986
f2 feminino 0,006 0,999
masculino 0,069 0,976
f3 feminino 8,545 0,000
masculino 3,777 0,024
f4 feminino 4,813 0,009
masculino 0,843 0,484
À excepção de F4 para o sexo masculino, os resultados do teste em função do género
dos Informantes mantêm-se idênticos aos do primeiro teste ANOVA (Tabela 3). Deste
modo, verifica-se que F0 continua a ser um parâmetro eficaz na discriminação de
falantes do mesmo sexo, no sentido do que apontam os resultados obtidos com o
teste t-student (Tabela 2). À semelhança do anterior teste ANOVA, F1 e F2 não são
suficientemente distintos entre os indivíduos, tal como seria esperado. Da mesma
forma, F3 e F4 para o sexo feminino mantêm resultados que ilustram a variação inter-
falante. No entanto, F4 revela-se não significante para a distinção dos indivíduos do
sexo masculino, como se pode constatar através do valor de F (0,843) e de significância
(0,484). Por último, os valores de F de F0, tanto para o sexo masculino como para o
feminino, continuam a ser os mais elevados de todas as variáveis, revelando que, no
conjunto dos parâmetros testados, este é o mais robusto para a distinção de falantes.
4.1.5. Informante versus Vogais
Nos gráficos das Figuras 14 a 17 são apresentados os valores médios de F1, F2, F3 e F4
de cada vogal e para cada Informante. Pode observar-se que os valores dos formantes
das vogais variam consideravelmente consoante o falante, tal como se verificou no
ponto 4.1.3.. A representação das frequências de cada vogal por formante e falante
demonstra a existência da interacção Informante versus Vogal. Caso não existisse
45
nenhuma relação entre as variáveis apontadas, as linhas correspondentes a cada vogal
seriam paralelas.
Figura 14 – Média de F1 por vogal, para cada Informante.
Figura 15 - Média de F2 por vogal, para cada Informante.
46
Figura 16 - Média de F3 por vogal, para cada Informante.
Figura 17 - Média de F4 por vogal, para cada Informante.
A comparação dos gráficos permite verificar que a distribuição das linhas
correspondentes a cada vogal não é semelhante nos quatro formantes. Em relação a
F1 e F2 (Figuras 14 e 15), as linhas estão relativamente separadas entre si, o que
demonstra que os valores destes formantes variam de acordo com a vogal. Desta
forma, F1 e F2 determinam o espaço acústico de cada vogal, sendo, portanto, os
formantes responsáveis pela qualidade da vogal. Por outro lado, nos gráficos
correspondentes a F3 e F4 (Figuras 16 e 17), as linhas que representam as vogais estão
praticamente todas sobrepostas, tornando difícil a localização de uma vogal em
particular. Assim, F3 e F4 não são preponderantes para a identificação da vogal, ao
contrário de F1 e F2, mas estão relacionados com as características individuais de cada
47
falante. Note-se que, apesar de as linhas estarem sobrepostas, estas não são rectas, o
que indicaria a inexistência de variação inter-falante. Neste sentido, os valores de F3 e
F4 das várias vogais tendem a ser muito próximos em cada indivíduo, embora a
concentração das vogais seja maior nalguns Informantes do que noutros. Os diferentes
picos, formados pela concentração dos valores das vogais, demonstram a variação
entre os falantes, pois a localização dessas áreas de concentração é diferente para
cada sujeito, ainda que os Informantes 5 e 6 apresentem uma distribuição próxima.
Constata-se, ainda, que a tendência para uma certa uniformização dos valores das
vogais é superior em F4 (Figura 17), o que sugere que quanto mais elevado for o
formante menos divergente será o valor do mesmo.
A análise dos gráficos anteriores (Figuras 14 a 17) complementa os resultados obtidos
no teste ANOVA (Figura 5). Justifica-se, assim, o facto de F1 e F2 não serem
significantes na distinção de falantes, dado que estes são os formantes responsáveis
pela determinação da identidade da vogal, pelo que a variação entre os indivíduos
nunca pode ser em grande escala. Pelo contrário, F3 e F4 demonstram ser pouco
variáveis em função da vogal, de forma que a significância destes parâmetros para a
discriminação de sujeitos está relacionada com as diferenças anatómicas do tracto
vocálico dos indivíduos.
4.2. Disfarce – variação dos parâmetros acústicos
4.2.1. Voz Normal versus Disfarce(s)
Nesta secção, pretende-se averiguar se a presença dos disfarces estudados acarreta
alterações nos parâmetros acústicos. Para o efeito, realizou-se um teste de análise de
variância ANOVA, cujos resultados são apresentados na Tabela 5, que integra todos os
Informantes e todas as condições de produção (voz normal e disfarces). Este teste é o
ponto de partida para perceber se existem diferenças, em cada variável, no conjunto
dos dados da voz normal e dos disfarces.
48
Tabela 5 – Resultado do teste ANOVA.
Variável F Sig.
f0 37,423 0,000
f1 13,828 0,000
f2 4,036 0,009
f3 4,928 0,003
f4 4,507 0,005
Pode observar-se que existem alterações significativas em todos os parâmetros nas
diferentes condições de produção, como demonstram os valores de significância (p <
0,05), embora as modificações de cada variável não sejam homogéneas entre si. O
valor de F (37,423) e de significância (0,000) indicam que F0 é o parâmetro mais
afectado no conjunto dos dados. F1 é o formante que sofre mais alterações, visto que
apresenta o valor mais elevado de F (13,828), seguido de F3, F4 e F2, cuja proximidade
dos valores de F (4,928, 4,507 e 4,036, respectivamente) e de significância (0,003,
0,005 e 0,009, respectivamente) demonstra que a variabilidade destes formantes é
idêntica no conjunto das cinco condições de produção.
Uma vez que foram detectadas diferenças em todos as variáveis, é necessário fazer
uma análise mais pormenorizada para, em primeiro lugar, apurar quais os disfarces
que alteram os parâmetros acústicos e, em segundo lugar, aferir se todos os
parâmetros se modificam na presença do mesmo disfarce.
Nas Figuras 18, 19, 20 e 21 são apresentados os valores médios de F0, F1, F2, F3 e F4
da voz normal e de cada disfarce. Os gráficos permitem, por um lado, observar as
alterações que ocorrem nos parâmetros acústicos, através da comparação de VN com
D1, D2, D3 e D4, e, por outro lado, fazer uma caracterização geral de cada disfarce.
49
Figura 18 - Comparação de VN com D1
Figura 19 - Comparação de VN com D2.
Figura 20 - Comparação de VN com D3.
50
Figura 21 - Comparação de VN com D4.
No que diz respeito a D1 (Figura 18), as frequências de F0, F1, F2, F3 e F4 são
significativamente mais elevadas do que em VN. Apesar de existir um aumento
generalizado dos valores de todos os parâmetros acústicos, em F1 e F2 o aumento não
é tão significativo como em F0, F3 e F4. Pode afirmar-se, portanto, que a presença de
D1 potencia um aumento das frequências de todos os parâmetros acústicos.
Relativamente a D2 (Figura 19), não é possível apontar uma tendência tão evidente
como em D1, já que nem todos os parâmetros se alteram. Comprova-se um
decréscimo dos valores de F2 e F4, ainda que a diminuição destes seja mais visível em
F4 do que em F2. Contudo, F0, F1 e F3 não sofrem praticamente nenhuma alteração na
presença deste disfarce. Estes resultados são, de certa forma, inesperados, pois, para
além de D2 não apresentar uma tendência tão marcada e linear na mudança dos
parâmetros como D1, praticamente não se verificam alterações em relação a F0. De
facto, era esperado que F0 fosse o parâmetro mais afectado em D1 e D2, uma vez que
ambos os disfarces envolvem a manipulação da frequência fundamental, embora o
façam em direcções opostas (subida e descida, respectivamente). Deste modo,
esperar-se-ia que D1 e D2 apresentassem um padrão de mudança semelhante, isto é,
seria expectável que ambos os disfarces afectassem os mesmos parâmetros acústicos,
ainda que o fizessem de forma diferente. Previa-se, assim, que a presença de D2 se
reflectisse na descida dos valores de todos os parâmetros acústicos, tal como D1
potencia a subida dos mesmos, mas que tivesse, sobretudo, um impacto visível em F0.
Contrariamente ao esperado não se verificam mudanças em F0, sendo que as
51
mudanças mais marcadas se registam na descida dos valores de F2 e F4, como foi já
referido.
Os resultados obtidos por Künzel (2000) aproximam-se, em parte, do que se constatou
relativamente às diferenças entre D1 e D2, no que diz respeito a F0. O autor verificou
que, apesar de ambos os disfarces produzirem alterações na frequência fundamental,
na descida de F0 é possível recuperar o seu valor natural, ao passo que na subida de F0
não é possível determinar, com precisão, os valores da frequência fundamental dos
indivíduos. Estes dados sugerem que as transformações de F0 não são tão efectivas na
descida como na subida da frequência fundamental.
Por outro lado, Zhan & Tan (2007) constataram que, embora a subida de F0 tenha sido
mais eficaz, a descida de F0 também surge no grupo dos disfarces que mais
degradaram a eficácia do sistema de reconhecimento automático de falantes.
Tendo em vista os resultados dos experimentos dos autores mencionados, dever-se-
iam ter registado modificações na frequência fundamental não só em D1, mas também
em D2, embora de menor dimensão. Ainda a respeito de D1, é interessante fazer um
paralelismo com uma das questões metodológicas observadas em Rose & Simmons
(1996). Os investigadores afirmam que tiveram de excluir um dos disfarces (falsete),
pois não era possível analisar os formantes automaticamente, através do formant
tracker, dado que eram confundidas as harmónicas com os formantes. Recorde-se que
a análise de D1 foi efectuada com uma ligeira alteração dos valores de order no
programa de análise espectrográfica, uma vez que, no sentido do que verificaram Rose
& Simmons, não era possível distinguir os formantes das harmónicas. Estes dados
demonstram que os disfarces que implicam a elevação de F0 condicionam, logo à
partida, os recursos de análise, estando subjacente a ideia de que são potencialmente
eficazes.
No que concerne a D3 (Figura 20), os valores de qualquer um dos parâmetros
permanecem praticamente iguais aos registados em VN, pelo que se pode concluir que
este disfarce não é eficaz na alteração destes parâmetros acústicos.
52
Contrariamente a estes resultados, a máscara à frente da boca demonstrou ser um
disfarce bastante invasivo para o sistema de reconhecimento automático de falantes,
pois surge entre os três disfarces mais destabilizadores da performance do sistema
(Zhan & Tan, 2007).
Na investigação levada a cabo por Rose & Simmons (1996), as conclusões sobre o
disfarce do lenço à frente da boca - equivalente a D3 - são coincidentes com os dados
apresentados na Figura 20, no que diz respeito a F3 e F4. Porém, relativamente a F1 e
F2, os resultados não apontam no mesmo sentido, já que os autores afirmam que
estes formantes apresentam diferenças consideráveis comparativamente à voz
normal.
Por último, F0 e F1 não são alterados na presença de D4 (Figura 21), visto que os seus
valores se mantêm idênticos aos de VN, mas verifica-se uma ligeira descida nos valores
de F2, F3 e F4.
O resultado da análise comparativa entre VN e D1, D2, D3 e D4 vai ao encontro do que
tem sido apontado na literatura relativamente às diferenças entre os diversos
disfarces. Tal como demonstram alguns estudos (Reich et al., 1976; Zhang & Tan, 2007;
Rose & Simmons, 1996), determinados disfarces são mais eficazes do que outros, na
medida em que a sua influência é mais destabilizadora do conjunto dos parâmetros
acústicos. Desta forma, conclui-se que D1 é o mais eficiente, dado que afecta
significativamente todos os parâmetros, ao contrário de D3 que revelou ser ineficaz, já
que a sua presença não implica nenhuma modificação dos mesmos.
Adicionalmente, constata-se que o efeito produzido em cada parâmetro acústico
depende do disfarce utilizado. Quer isto dizer que o mesmo parâmetro é afectado em
função de alguns disfarces, mas permanece inalterável na presença de outros. Assim, a
robustez de um parâmetro acústico está dependente do próprio disfarce. Tendo em
vista esta linha de pensamento, F0 não é um parâmetro sólido em relação a D1, mas é
robusto quando se trata de D2, D3 e D4, visto que não existem mudanças significativas
dos valores da frequência fundamental nestes disfarces. A robustez de F1 verifica-se,
apenas, em D3 e D4, pois as frequências deste formante são alteradas em D1 e D2.
53
Uma vez que os valores de F2 são modificados em D1, D2 e D4, este parâmetro é
eficiente unicamente na presença de D3. F3 é eficaz com respeito a D2 e D3, mas não o
é relativamente a D1 e D4, dado que estes disfarces modificam as suas frequências,
embora as alterações sejam de maior magnitude em D1. Finalmente, F4 demonstra
não ser um parâmetro robusto em D1, D2 e D4, apesar de as transformações
produzidas por este último não serem tão significativas como nos dois primeiros (D1 e
D2), mas é eficaz em relação a D3 porque as transformações provocadas por si são
praticamente inexistentes.
Deste modo, conclui-se que, à semelhança do que verificaram outros autores, cada
parâmetro não é modificado de forma idêntica pelos vários tipos de disfarce. Reich et
al. (1976) constataram que as frequências dos formantes e a banda formântica não são
afectados no disfarce da diminuição do tempo de fala, embora haja um aumento da
duração das vogais e das palavras, uma vez que o próprio disfarce incide nestes
parâmetros. Contudo, neste estudo fica por esclarecer a influência específica dos
disfarces analisados em cada um dos parâmetros utilizados pelos autores. Ainda que se
afirme que os formantes e a banda formântica não foram afectados, não é certo que
todos os restantes parâmetros tenham sofrido alguma modificação. Da mesma forma,
fica por saber se os disfarces considerados mais eficazes (rouquidão e imitação da voz
de um velho) produziram modificações apenas nos parâmetros relacionados com a
fonte ou se estes foram os mais afectados, entre outros.
O trabalho de Rose & Simmons (1996) aponta, também, no sentido de que a robustez
de um parâmetro depende do disfarce utilizado. Os autores verificaram que na
presença de quatro tipos de disfarce, os dois primeiros formantes (F1 e F2)
apresentam sempre alterações significativas. Porém, F3 e F4 são modificados apenas
em dois dos disfarces (imitação do comentador político e voz feminina), uma vez que
se mantêm inalterados nos disfarces relativos à colocação do lenço à frente da boca e
à imitação de um sotaque.
54
4.2.2. Disfarce versus Informante
Após averiguar as alterações, no conjunto dos parâmetros acústicos, produzidas por
cada disfarce, importa analisar o efeito do disfarce em função de cada Informante. Os
gráficos que se seguem representam a distribuição dos valores de F0 (Figura 22), F1
(Figura 23), F2 (Figura 24), F3 (Figura 25) e F4 (Figura 26) para cada Informante,
relativamente a VN, D1, D2, D3 e D4.
Figura 22 – Distribuição de F0 segundo o Informante em VN, D1, D2, D3 e D4.
Figura 23 – Distribuição de F1 segundo o Informante em VN, D1, D2, D3 e D4.
55
Figura 24 - Distribuição de F2 segundo o Informante em VN, D1, D2, D3 e D4.
Figura 25 - Distribuição de F3 segundo o Informante em VN, D1, D3 e D4.
Figura 26 - Distribuição de F4 segundo Informante em VN, D1, D2, D3 e D4.
No que diz respeito ao disfarce, os gráficos permitem comprovar que D1 é o mais
invasivo entre os quatro disfarces testados. A eficiência de D1, que se traduz no
56
aumento dos valores de todos os parâmetros, é visível nos gráficos pelo afastamento
da linha que lhe corresponde de VN.
Da mesma forma, confirma-se, novamente, que o mesmo parâmetro acústico não é
influenciado de igual modo pelos vários disfarces, isto é, cada parâmetro pode ser
alterado na presença de um disfarce específico, mas pode ser impermeável a outro.
Assim, F0 é fortemente afectado na presença de D1, enquanto os restantes disfarces
não parecem causar grandes distorções neste parâmetro. Contrariamente a F0, a
variabilidade dos restantes parâmetros acústicos não se deve exclusivamente a um
disfarce. Verifica-se, então, que F1, F2 e F4 apresentam variações na presença dos
quatro disfarces, embora a magnitude e direcção da mudança não seja igual para
todos os disfarces. F3 é o parâmetro menos afectado, uma vez que, à excepção de D1,
as linhas relativas a cada disfarce se encontram praticamente sobrepostas,
demonstrando a inexistência de variabilidade deste parâmetro.
Ainda que existam tendências gerais associadas a cada disfarce relativamente ao tipo
de modificação dos parâmetros, a variação inter-falante existe não só na voz normal,
mas também na presença do disfarce, como demonstram os gráficos apresentados
anteriormente (Figuras 22 a 26). Desta forma, existe uma relação entre disfarce e
Informante, pois as mudanças produzidas por cada disfarce num parâmetro específico
não são semelhantes entre os falantes. Observe-se que, em relação à frequência
fundamental (Figura 22), o aumento de F0, em D1, não é tão elevado nos Informantes
2 e 5 como nos restantes; para a maioria dos indivíduos não há oscilação dos valores
de F0 entre VN, D2, D3 e D4, mas nos Informantes 1, 6 e 8 as frequências divergem
nestas quatro condições de produção. No que diz respeito a F1 (Figura 23), o
Informante 2 destaca-se dos demais falantes, uma vez que é o que apresenta a maior
subida e descida dos valores em D1 e D2, respectivamente. Apesar de as frequências
de F2 (Figura 24) serem idênticas entre os Informantes 2, 4 e 7 em VN e D1, o mesmo
não se verifica nos restantes disfarces. O Informante 2 apresenta valores distintos para
D2 e D4, ao passo que nos Informantes 4 e 7 as frequências de F2 são próximas nos
referidos disfarces, embora a variação seja mais elevada no Informante 7.
Relativamente a F3 (Figura 25), os Informantes 1 e 4 têm valores muito aproximados
57
de VN, D2, D3 e D4, contudo distinguem-se quanto às frequências de D1, dado que
estas são muito mais elevadas no Informante 4 do que no Informante 1. Por último,
também os diversos valores de F4 (Figura 26) entre os indivíduos, nas várias condições
de produção, ilustram a variação inter-falante. O Informante 2 é o único falante cujos
valores de D2 se afastam consideravelmente dos de VN; da mesma forma, o
Informante 4 isola-se dos restantes indivíduos, visto que apresenta frequências
distintas entre VN e D3, o que não se verifica nos outros Informantes.
Para verificar, estatisticamente, as diferenças entre os Informantes relativamente a
cada disfarce, realizou-se um teste t-student. Através deste teste, faz-se a comparação
de cada parâmetro entre VN e D1, D2, D3 e D4, para cada Informante individualmente.
Os resultados do teste são apresentados na Tabela 6, através do nível de significância
de cada parâmetro.
Tabela 6 - Resultado do teste t-student na comparação entre VN e Disfarce(s).
Disfarce/Parâmetro 1 2 3 4 5 6 7 8
VN-D1
f0 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000
f1 0,042 0,000 0,037 0,012 0,012 0,000 NS 0,000
f2 NS NS NS NS NS NS NS NS
f3 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,028
f4 NS NS 0,000 0,000 0,000 0,000 NS 0,000
VN-D2
f0 0,000 0,040 0,001 NS NS 0,000 0,023 0,000 f1 NS NS NS NS NS NS NS NS f2 NS NS NS NS NS NS NS NS f3 0,013 NS NS NS NS NS NS NS
f4 NS 0,000 NS 0,000 0,027 NS NS 0,000
VN-D3
f0 NS NS NS NS NS NS NS 0,011
f1 NS NS NS NS NS NS NS NS
f2 NS NS NS NS NS NS NS NS
f3 NS NS NS NS NS NS NS NS
f4 NS NS NS NS NS NS NS NS
VN-D4
f0 0,000 NS NS NS NS 0,000 NS 0,002
f1 NS NS NS NS NS NS NS NS
f2 NS NS NS NS NS NS NS NS
f3 NS NS 0,021 NS NS NS NS NS
f4 NS NS NS NS NS NS 0,025 0,011 Legenda: NS = não significativo.
58
Os resultados do teste confirmam a existência da interacção entre disfarce e
Informante, já que o efeito do disfarce não é igual para todos os indivíduos. Assim,
verifica-se que a presença de D1 não é significativa no Informante 7 em F1, nem nos
Informantes 1, 2, e 7 em F4. Na comparação de VN com D2, os Informantes 4 e 5 não
apresentam variabilidade de F0, ao contrário dos restantes Informantes, cujos valores
de significância demonstram que houve alteração da frequência fundamental; em
relação a F3, os valores não diferem na maioria dos falantes, à excepção do Informante
1, dado que o resultado do teste é significativo (p = 0,013); há um equilíbrio na
variação de F4, pois em 50% dos Informantes não se registam alterações significativas,
mas nos restantes 50% houve mudanças nas frequências deste parâmetro. Em VN-D3,
o Informante 8 distingue-se dos restantes falantes, uma vez que é o único indivíduo
que apresenta variabilidade nas frequências de F0; nos restantes parâmetros, os
resultados não são significantes para nenhum Informante. No contraste de VN-D4, os
resultados confirmam a variação dos valores em função do falante, pois só se registam
alterações de F0 nos Informantes 1, 6 e 8; não existem mudanças nos valores de F3 de
qualquer indivíduo, à excepção do Informante 3; e, em relação a F4, as alterações são
significativas apenas nos Informantes 7 e 8.
Por outro lado, apesar de existirem alterações significativas do mesmo parâmetro em
vários Informantes, a magnitude da mudança não é igual para todos os falantes, como
se pode constatar através do nível de significância. Para exemplificar, observe-se que,
embora os valores de F4, em VN-D2, sejam significativos nos Informantes 2, 4, 5 e 8, o
grau de alteração deste parâmetro não é igual entre si, pois os níveis de significância
demonstram que a mudança é superior nalguns indivíduos do que noutros. Assim, a
modificação dos valores de F4 foi mais elevada nos Informantes 2, 4 e 8 (p = 0,000) do
que no Informante 5, que é o que apresenta a menor variação das frequências (p =
0,027) nas duas condições de produção.
Mesmo quando o nível de significância é igual entre os Informantes, tal não significa
que as alterações dos parâmetros acústicos sejam homogéneas entre si. Os dados
apresentados na Tabela 6 indicam que a variação de F0 entre VN e D1 é significante (p
= 0,000) para qualquer falante. Contudo, as mudanças entre as duas condições de
59
produção não são semelhantes nos vários indivíduos, como se verificou através do
gráfico da Figura 22. A alteração das frequências de F0 é mais elevada no Informante 3
do que no Informante 2, por exemplo, uma vez que no primeiro o aumento é de cerca
de 300Hz, ao passo que no segundo é de 70Hz, aproximadamente.
Ainda a respeito de F0, importa averiguar isoladamente o efeito de D2 na frequência
fundamental, em função de cada Informante. O teste t-student (Tabela 6) indica que
houve alterações significativas de F0 em VN-D2 em todos os sujeitos, à excepção dos
Informantes 4 e 5. Porém, o gráfico VN versus D2 (Figura 19) contraria estes
resultados, visto que os valores de F0 se mantêm praticamente idênticos nas duas
condições de produção. Para compreender melhor este fenómeno, de seguida são
apresentados os valores médios de F0 de VN e D2 de cada Informante (Figura 27).
Figura 27 – Valores médios de F0 de cada Informante em VN e D2.
A descida dos valores da frequência fundamental efectua-se apenas nos Informantes 2,
5 e 7, pois nos restantes Informantes regista-se um aumento ou manutenção dos
valores de F0. Assim, houve uma alteração nos valores de F0, comprovada pelos
resultados significativos do teste t-student (Tabela 6), mas essa mudança traduz-se no
aumento da frequência fundamental. O facto de a maior parte dos Informantes não ter
sido capaz de alterar a sua frequência fundamental em D2 - pretendia-se uma descida
dos valores de F0 - levanta uma questão interessante relativamente ao desempenho
de cada indivíduo em disfarçar a voz. De facto, os disfarces que envolvem a alteração
60
do número de vibrações das cordas vocais por segundo, como D1 e D2, pressupõem
alguma ‘habilidade’ individual para executar essas mudanças.
Estes resultados revelam que, à luz do que foi apontado por Zhang & Tan (2007), existe
uma relação entre disfarce e Informante, demonstrando que a execução do disfarce
está dependente do desempenho de cada indivíduo. Consequentemente, nem todos
os tipos de disfarce são eficientes para todos os Informantes, já que alguns falantes
são mais aptos para determinados disfarces (Zhang & Tan, 2007). Neste sentido,
apesar de D1 ter sido eficiente para todos os sujeitos, D2 revelou-se eficaz apenas para
os Informantes 2 e 7. D2 não é considerado eficaz para o Informante 5 pois, embora se
tenha registado uma descida nos valores de F0 (Figura 27), os resultados do teste t-
student (Tabela 6) indicam que essa alteração não é estatisticamente significativa.
Por fim, a Tabela 6 permite cimentar algumas observações relativas ao(s) disfarce(s).
Em primeiro lugar, confirma-se que alguns disfarces não são eficientes. À excepção de
F0 no Informante 8, nenhum parâmetro foi significativamente alterado em D3, pelo
que os resultados não são significativos (NS). Desta forma, D3 não é um disfarce eficaz,
já que a utilização do mesmo não modifica nenhum dos parâmetros analisados.
Em segundo lugar, o mesmo disfarce não influencia de forma igual todos os
parâmetros acústicos. Recorde-se que na comparação de VN-D1, apesar de os
resultados serem significativos na maioria dos parâmetros, F2 não é significativo em
nenhum dos Informantes. Ainda que o gráfico da Figura 18 demonstre que, no
conjunto dos dados, os valores de F2 são mais elevados em D1 do que em VN, o
aumento das frequências não é significativo a nível estatístico. Por último, tendo em
vista o número de resultados significativos em todos os Informantes em D1, verifica-se
que este é, efectivamente, o disfarce que provoca mais alterações nos parâmetros
acústicos e, consequentemente, o disfarce mais eficaz.
61
4.2.3. Disfarce versus Vogais
Nesta secção, pretende-se testar o efeito do disfarce nas vogais para apurar se todos
os segmentos são igualmente afectados ou se, pelo contrário, existem alguns mais
permeáveis ao disfarce do que outros. Os gráficos que se seguem apresentam os
valores médios de F1 e F2 de cada vogal relativamente a D1 (Figura 28), D2 (Figura 29),
D3 (Figura 30) e D4 (Figura 31), no conjunto dos Informantes. Em cada gráfico, são
também apresentados os valores médios dos referidos parâmetros em VN, de forma a
poder observar as alterações produzidas por cada disfarce.
Figura 28 – Distribuição dos valores de F1 e F2 de cada vogal em VN e D1.
Figura 29 - Distribuição dos valores de F1 e F2 de cada vogal em VN e D2.
62
Figura 30 - Distribuição dos valores de F1 e F2 de cada vogal em VN e D3.
Figura 31 - Distribuição dos valores de F1 e F2 de cada vogal em VN e D4.
Relativamente a D1 (Figura 28), pode verificar-se que todas as vogais foram afectadas,
tanto em F1 como em F2. No entanto, a influência do disfarce não é semelhante entre
os vários segmentos, uma vez que alguns são mais afectados que outros. Da mesma
forma, o efeito do disfarce também não é idêntico em cada um dos formantes, isto é,
as vogais que sofrem maior influência do disfarce em F1 não são necessariamente as
mesmas que em F2. Assim, em F1 o aumento das frequências é mais elevado nas
vogais abertas ( [ɛ], [a], [ɔ] ) do que nas restantes, pelo que a interferência do disfarce
é maior nas três vogais referidas. Em relação a F2, são as vogais anteriores ( [i], [e], [ɛ] )
que sofrem maior influência do disfarce, dado que são estas que registam o maior
aumento dos valores. Deste modo, conclui-se que a vogal anterior baixa ( [ɛ] ) é a mais
vulnerável a D1, pois as suas frequências são alteradas de forma significativa, tanto em
63
F1 como em F2, ao passo que a mais resistente é a vogal posterior média ( [o] ), visto
que é a que sofre menos modificações no conjunto dos dados.
No que diz respeito a D2 (Figura 29), o efeito do disfarce é relativamente homogéneo
entre as vogais. Porém, tal como em D1, o primeiro e segundo formantes não são
igualmente afectados por este disfarce. Apesar de se registar uma ligeira descida nas
frequências de F1 das vogais central e posterior baixa ( [a] e [ɔ] ), a presença de D2 é
praticamente insignificante neste formante. Por outro lado, todas as vogais
apresentam uma descida mais acentuada dos valores de F2, ainda que não exista
grande disparidade entre os segmentos. No conjunto dos dados, a vogal anterior alta (
[i] ) é a mais vulnerável ao disfarce, pois é a que apresenta a maior variação do valor
de F2 entre VN e D2.
Na presença de D3 (Figura 30), não se regista praticamente nenhuma alteração das
frequências das vogais. Embora se observe um decréscimo superfluo na frequência de
F2 da vogal [i], os segmentos apresentam valores semelhantes aos de VN quer em F1,
quer em F2.
Por último, as frequências de F1 das vogais não são modificadas na presença de D4
(Figura 31). Porém, a presença do disfarce é visível em F2, ainda que não seja idêntica
para todas as vogais, como se verificou nos disfarces anteriores. Assim, à semelhança
do que sucede com D1, os segmentos mais permeáveis a D4 são as vogais anteriores (
[i], [e] e [ɛ] ). A influência de D4 nas vogais é algo surpreendente, pois esperava-se que
este disfarce tivesse um impacto de maior relevo, dadas as limitações impostas por si.
Devido ao facto de os movimentos do maxilar serem quase inexistentes, os lábios
estarem estirados e os movimentos da língua ficarem mais limitados, como
consequência da colocação da palhinha entre os dentes incisivos, esperar-se-ia que os
segmentos mais afectados fossem as vogais abertas e arredondadas, tanto no plano de
F1 como de F2.
Em suma, constata-se que quando os disfarces interferem nas frequências dos
formantes, as vogais não são afectadas de forma homogénea. Dito de outro modo, há
segmentos que são mais permeáveis ao disfarce do que outros. Da mesma forma, a
64
influência do disfarce também não é idêntica entre os formantes, uma vez que os
segmentos que sofrem maior interferência do disfarce variam em função do formante.
Por outro lado, a permeabilidade das vogais depende do tipo de disfarce, já que as
frequências de uma vogal podem ser alteradas por um disfarce, mas serem
impermeáveis a outro.
4.2.4. Triângulos vocálicos – Comparação de VN com o(s) Disfarce(s)
Nesta secção, pretende-se averiguar em que medida é que as alterações nas
frequências dos formantes (F1 e F2), provocadas por cada disfarce, afectam a
configuração dos triângulos vocálicos. Consequentemente, procura-se verificar se as
características individuais dos falantes são preservadas mesmo na presença do
disfarce. Assim, são apresentados os triângulos vocálicos de cada Informante
relativamente a D1 (Figuras 32, 33, 34, 35, 36, 37, 38 e 39), D2 (Figuras 40, 41, 42, 43,
44, 45, 46 e 47), D3 (Figuras 48, 49, 50, 51, 52, 53, 54 e 55) e D4 (Figuras 56, 57, 58, 59,
60, 61, 62 e 63). De forma a poder constatar as mudanças impostas por cada disfarce,
apresentam-se simultaneamente os triângulos vocálicos de VN para cada Informante.
Ao contrário dos triângulos apresentados no início da análise (ponto 4.1.1.) que
continham quatro pontos para cada vogal, estes são constituídos pelo valor médio de
cada segmento, uma vez que o foco de atenção recai na comparação de VN com os
disfarces.
4.2.4.1. VN versus D1
Figura 32 - Triângulo vocálico VN-D1, Informante 1 Figura 33 - Triângulo vocálico VN-D1, Informante 2
65
Figura 34 - Triângulo vocálico VN-D1, Informante 3 Figura 35 - Triângulo vocálico VN-D1, Informante 4
Figura 36 - Triângulo vocálico VN-D1, Informante 5 Figura 37 - Triângulo vocálico VN-D1, Informante 6
Figura 38 - Triângulo vocálico VN-D1, Informante 7 Figura 39 - Triângulo vocálico VN-D1, Informante 8
Legenda:
VN D1
No que diz respeito ao Informante 1 (Figura 32), pode verificar-se que o disfarce incide
sobretudo nas vogais anteriores. O agrupamento formado pelas vogais anteriores
66
média e baixa e o afastamento da vogal anterior alta, característicos deste indivíduo,
não são conservados em D1. Há, pelo contrário, uma ‘inversão’ na disposição destes
segmentos, uma vez que a vogal [e] se aproxima de [i] e a vogal [ɛ] fica isolada. Por
outro lado, o disfarce altera também a relação entre as vogais posteriores média e
alta, dado que em D1 a vogal [o] é mais recuada que [u]. Contudo, a distribuição das
vogais central e posterior baixa é preservada, assim como o espaço acústico que gera a
divisão entre os segmentos central/posteriores e anteriores.
No Informante 2 (Figura 33), o disfarce provoca transformações significativas na
configuração do triângulo vocálico, pelo que nenhum traço individual do falante é
conservado. Observa-se, por um lado, o alargamento considerável da dimensão do
polígono e, por outro lado, uma reestruturação na organização dos segmentos. Assim,
o cluster existente em VN, marca específica deste indivíduo, não é mantido no
disfarce; devido à estandardização dos valores de F1, o traço de avanço/recuo é o
único traço distintivo entre os segmentos [i] e [e]; a relação entre as vogais baixas
obedece a um novo padrão que consiste na uniformização das distâncias acústicas
entre si e no alinhamento das vogais anterior e posterior no plano de F1; por último, a
separação das vogais anteriores dos restantes segmentos não se verifica em D1, sendo
criada uma nova divisão entre as vogais altas/anterior média e baixas/posterior média.
Relativamente ao Informante 3 (Figura 34), o triângulo vocálico é alargado devido,
essencialmente, ao aumento dos valores de F2 das vogais anteriores. Apesar de o
padrão de distribuição das vogais anteriores se manter em D1, a disposição dos
restantes segmentos é bastante alterada. O disfarce gera um cluster, formado pelas
vogais [o] e [u], que não se verifica em VN; o traço distintivo de avanço/recuo é
suprimido relativamente às vogais [a] e [ɔ], dado que estas estão alinhadas no plano de
F2; e a distância acústica entre a vogal central e as vogais anteriores é ampliada.
No Informante 4 (Figura 35), a faixa de variação de F1 é aumentada em D1 e,
consequentemente, a dimensão do triângulo vocálico é alargada. Por outro lado, o
acentuado aumento dos valores de F1 das vogais baixas origina uma separação, que
não é característica deste falante, entre as vogais baixas e os restantes segmentos.
67
Em relação ao Informante 5 (Figura 36), o disfarce provoca o alargamento do polígono,
essencialmente ao nível das vogais baixas. Apesar de os valores dos segmentos
posteriores alto e médio permanecerem idênticos aos de VN, o aumento das
frequências de F1 das vogais baixas gera uma divisão entre as vogais baixas e
médias/altas, inexistente em VN; a disposição das vogais anteriores também é
afectada, pois há uma aproximação das vogais [i] e [e] relativamente aos valores de F1;
e a distância acústica entre as vogais central e posterior baixa é aumentada.
No Informante 6 (Figura 37), o aumento das frequências dos segmentos dá origem ao
deslocamento do triângulo vocálico no espaço acústico. Embora a configuração geral
do polígono não seja afectada, o disfarce cria dois clusters ( [i]/[e] e [ɛ]/[a] ). Assim,
gera-se uma nova divisão entre as vogais posteriores alta/média e central/posterior
baixa. Contudo, a separação entre as vogais anteriores e os restantes segmentos
continua presente em D1.
No Informante 7 (Figura 38), a alteração das frequências das vogais anteriores altera
consideravelmente a configuração do triângulo vocálico. O aumento da faixa de
variação de F2, bem como das distâncias acústicas entre as vogais, dão origem ao
alargamento do polígono. Por outro lado, verifica-se que o disfarce modifica a
organização dos segmentos no triângulo vocálico, sobretudo ao nível das vogais baixas.
O traço distintivo de altura é praticamente suprimido em relação às vogais baixas
devido à aproximação dos valores de F1 destes segmentos. Ainda assim, pode
observar-se que a separação entre os segmentos posteriores médio/alto e
central/posterior baixo, existente em VN, é mantida também em D1.
Finalmente, no Informante 8 (Figura 39), o disfarce causa a deslocação do polígono no
espaço acústico, resultado do aumento das frequências, maioritariamente, de F1.
Verifica-se também que há uma aproximação das vogais médias às vogais altas
relativamente ao eixo de F1 e, ainda, um estreitamento do triângulo vocálico.
68
4.2.4.2. VN versus D2
Figura 40 - Triângulo vocálico VN-D2, Informante 1 Figura 41 - Triângulo vocálico VN-D2, Informante 2
Figura 42 - Triângulo vocálico VN-D2, Informante 3 Figura 43 - Triângulo vocálico VN-D2, Informante 4
Figura 44 - Triângulo vocálico VN-D2, Informante 5 Figura 45 - Triângulo vocálico VN-D2, Informante 6
69
Figura 46 - Triângulo vocálico VN-D2, Informante 7 Figura 47 - Triângulo vocálico VN-D2, Informante 8
Legenda:
VN D2
Os resultados obtidos para D2 são, de certo modo, condicionados, uma vez que a
maioria dos indivíduos não efectuou a descida da frequência fundamental, como
pretendido com este disfarce. Constatou-se que, à excepção dos Informantes 2, 5 e 7,
os restantes falantes mantiveram ou aumentaram os valores de F0 em D2 (cf. Figura
27). Desta forma, pode observar-se que não há alterações significativas nos triângulos
vocálicos dos Informantes 1, 3 e 8 (Figuras 40, 42 e 47), pelo que as marcas indivíduais
de cada falante permanecem inalteráveis, relativamente à configuração e localização
do polígono.
No entanto, os triângulos vocálicos dos Informantes 4 e 6 apresentam algumas
modificações comparativamente a VN. No Informante 4 (Figura 43), há uma
diminuição das frequências, essencialmente de F1, das vogais posteriores e anteriores
alta e baixa. O aumento do valor de F1 da vogal central causa um maior
distanciamento entre esta e a vogal [ɔ], bem como a ampliação do intervalo acústico
entre a vogal central e as vogais anteriores. Por outro lado, o traço distintivo de altura
é suprimido relativamente às vogais anteriores média e baixa, dando origem a uma
nova disposição das vogais anteriores. Relativamente ao Informante 6 (Figura 45), o
disfarce tem um grande impacto nas vogais posteriores e central, dado que as
distâncias acústicas entre estes segmentos são, praticamente, elididas. As distâncias
entre as vogais anteriores também são reduzidas, mas de forma menos significativa.
Como resultado das alterações das frequências dos segmentos, a faixa de variação de
F1 e F2 é reduzida, dando origem ao encolhimento do triângulo vocálico. Ainda assim,
70
observe-se que a divisão entre as vogais anteriores e os restantes segmentos
permanece em D2.
As modificações observadas nos triângulos vocálicos dos Informantes 4 e 6 estão,
provavelmente, relacionadas com a alteração dos movimentos e posições dos
articuladores. No entanto, estes resultados não são tidos em conta, visto que se
pretendia a modificação da fonte e não dos filtros.
No que diz respeito ao Informante 2 (Figura 41), o disfarce provocou o encolhimento
do triângulo acústico, resultado da diminuição das frequências de F1 e F2 de todos os
segmentos; consequentemente, também a faixa de variação de F1 e F2 é reduzida; e a
redução da distância entre as vogais [a] e [ɔ] origina um cluster inexistente em VN.
Porém, pode verificar-se que alguns traços específicos deste falante são mantidos,
visto que o cluster formado por [o] e [u] continua presente, assim como a distância
entre este e a vogal posterior baixa, e a disposição das vogais anteriores ( [i], [e] e [ɛ] )
não é modificada.
No Informante 5 (Figura 44), a presença do disfarce manifesta-se no decréscimo das
frequências das vogais, maioritariamente no plano de F2, embora a redução dos
valores dos formantes não seja significativa. Desta forma, não há alterações
substanciais das características do triângulo vocálico deste falante.
Por último, é no Informante 7 (Figura 46) que se registam as maiores alterações
provocadas pelo disfarce. Embora a dimensão e localização do polígono não sejam
modificadas, a disposição de alguns segmentos é alterada, desfazendo algumas marcas
particulares deste indivíduo. A diminuição e aumento do valor de F2 das vogais [i] e
[e], respectivamente, gera a aproximação destes segmentos, ao passo que em VN as
distâncias entre [i], [e] e [ɛ] são semelhantes; o agrupamento formado pelas vogais
central e posterior baixa, existente VN, é desfeito; os segmentos [o] e [u] são distintos,
apenas, a partir das frequências de F1, pois o disfarce aproxima-os no plano de F2.
71
4.2.4.3. VN versus D3
Figura 48 - Triângulo vocálico VN-D3, Informante 1 Figura 49 - Triângulo vocálico VN-D3, Informante 2
Figura 50 - Triângulo vocálico VN-D3, Informante 3 Figura 51 - Triângulo vocálico VN-D3, Informante 4
Figura 52 - Triângulo vocálico VN-D3, Informante 5 Figura 53 - Triângulo vocálico VN-D3, Informante 6
72
Figura 54 - Triângulo vocálico VN-D3, Informante 7 Figura 55 - Triângulo vocálico VN-D3, Informante 8
Legenda:
VN D3
No que diz respeito a D3, pode constatar-se que, no conjunto dos Informantes, este
disfarce não acarreta modificações substânciais na configuração dos triângulos
vocálicos. Tal como tinha já sido observado através da análise comparativa entre VN e
D3 (Figura 20), os valores de F1 e F2 não sofrem alterações na presença deste disfarce.
Assim, no Informante 1 (Figura 48), as posições das vogais permanecem inalteradas,
embora a vogal [ɛ] apresente um maior desvio dos que as restantes que, ainda assim,
não é relevante. Mantém-se, pois, a proximidade das vogais anteriores média e baixa,
bem como o afastamento demarcado das vogais anteriores dos restantes segmentos.
Pelo contrário, as alterações provocadas por D3 são mais visíveis no Informante 2
(Figura 49). A diminuição dos valores de F2 vogais anteriores alta e média provocam a
redução da faixa de variação de F2. Por outro lado, a distância acústica entre as vogais
[i]/[e] e [ɛ] é reduzida, alterando uma marca particular deste indivíduo que consiste no
isolamento de [ɛ] dos restantes segmentos. Regista-se, ainda, um ligeiro decréscimo
dos valores de F1 das vogais baixas [a] e [ɔ], mas a distância acústica entre si não é
afectada. Do mesmo modo, não houve nenhuma modificação relativamente aos
segmentos posteriores alto e médio, pelo que se mantém o cluster característico deste
falante.
No Informante 3 (Figura 50), a influência do disfarce é praticamente inexistente,
apesar de haver uma modificação nas frequências das vogais posteriores alta e média,
que reduz a distância acústica entre si e as aproxima no plano de F2.
73
Relativamente ao Informante 4 (Figura 51), não se verificam alterações substanciais no
triângulo acústico, uma vez que os valores de F1 e F2 dos segmentos não se afastam
muito dos de VN. Porém, é alterado um traço específico do falante, respeitante à
relação entre as vogais posteriores alta e média, dado que em VN estas estão
alinhadas no eixo de F2, ao passo que em D3 não.
O efeito de D3 não se manifesta no Informante 5 (Figura 52), pois as frequências de F1
e F2 das vogais são idênticas às de VN. Deste modo, todas as características do
polígono são preservadas na presença deste disfarce.
Da mesma forma, também a influência de D3 no Informante 6 (Figura 53) é supérflua.
Ainda que as frequências das vogais oscilem ligeiramente entre VN e D3, não há
alterações na configuração do triângulo vocálico.
Com respeito ao Informante 7 (Figura 54), pode observar-se que, à semelhança do
Informante 6, as ligeiras modificações nos valores dos formantes das vogais não
condicionam a configuração do polígono, pelo que as marcas específicas deste sujeito
são preservadas. Ainda assim, há uma mudança superficial nos segmentos anteriores
médio e baixo, pois a distância acústica entre si é reduzida devido à aproximação dos
seus valores de F1.
Finalmente, no Informante 8 (Figura 55), a presença do disfarce reflecte-se na redução
das frequências de F2 das vogais anteriores e, ainda, na perda do traço distintivo de
avanço/recuo entre as vogais posteriores média e alta. Contudo, o disfarce não
acarreta transformações substanciais nas características do triângulo vocálico, visto
que a sua configuração geral e a disposição dos segmentos não são modificadas.
74
4.2.4.4.VN versus D4
Figura 56 - Triângulo vocálico VN-D4, Informante 1 Figura 57 - Triângulo vocálico VN-D4, Informante 2
Figura 58 - Triângulo vocálico VN-D4, Informante 3 Figura 59 - Triângulo vocálico VN-D4, Informante 4
Figura 60 - Triângulo vocálico VN-D4, Informante 5 Figura 61 - Triângulo vocálico VN-D4, Informante 6
75
Figura 62 - Triângulo vocálico VN-D4, Informante 7 Figura 63 - Triângulo vocálico VN-D4, Informante 8
Legenda:
VN D4
No que diz respeito ao Informante 1 (Figura 56), não se verificam transformações
consideráveis nas frequências das vogais. Para além do ligeiro aumento dos valores de
F1 das vogais posteriores alta e média, o disfarce potencia um aumento mais
significativo da frequência de F1 da vogal [ɛ], enfraquecendo a proximidade existente
entre as vogais anteriores média e baixa. Ainda assim, pode afirmar-se que as
características do triângulo vocálico deste falante são preservadas, na medida em que
a configuração do polígono não é alterada e o agrupamento formado pelos segmentos
[e] e [ɛ], característico deste indivíduo, é mantido, embora não seja tão coeso como
em VN.
Pelo contrário, no Informante 2 (Figura 57), a presença de D4 acarreta modificações
significativas na disposição dos segmentos. Em primeiro lugar, o decréscimo das
frequências de F2 das vogais anteriores e de F1 das vogais central e posterior baixa
originam a redução da faixa de variação de F1 e F2 e, consequentemente, a diminuição
da dimensão do polígono. Neste sentido, também as distâncias acústicas entre os
segmentos são afectadas, pelo que com o disfarce é suprimido o intervalo entre as
vogais [ɔ] e [o]/[u]. Por outro lado, perde-se o traço distintivo de avanço/recuo entre
as vogais [a] e [ɔ], dado que os valores de F2 destas são semelhantes, assim como as
vogais anteriores média, baixa e posterior baixa se aproximam no plano de F1. Desta
forma, a única marca que permanece intacta diz respeito ao cluster formado pelas
vogais [o] e [u], já que os restantes traços individuais não são conservados em D4.
76
No Informante 3 (Figura 58), a dimensão do polígono é reduzida, resultado da
diminuição e aumento das frequências de F2 das vogais anteriores e posteriores,
respectivamente, e da redução do valor de F1 da vogal central. Apesar de o disfarce
não comprometer a configuração geral do triângulo vocálico, a aproximação das
frequências de F1 das vogais [o] e [u] gera um cluster que não é característico deste
indivíduo.
Relativamente ao Informante 4 (Figura 59), a presença do disfarce desfaz uma marca
particular do falante, relativa ao alinhamento das vogais posteriores média e alta no
plano de F2. Em adição, são aumentadas as distâncias entre alguns segmentos,
nomeadamente entre as vogais anteriores alta e média e entre as vogais posteriores
média e baixa. Ainda assim, a divisão entre as vogais anteriores e os restantes
segmentos é preservada e a configuração geral do triângulo vocálico não é afectada.
No Informante 5 (Figura 60), apesar da redução generalizada das frequências de F2 dos
segmentos, à excepção da vogal [u] cujos valores se mantêm idênticos aos de VN, não
há alterações na configuração do triângulo vocálico, pelo que as marcas individuais do
falante continuam presentes em D4.
No Informante 6 (Figura 61), à semelhança do que sucede com o Informante 5, não há
grande discrepância nas frequências das vogais entre VN e D4. No entanto, o disfarce
provoca uma alteração na disposição das vogais posteriores, pois o traço distintivo de
avanço/recuo é eliminado, sendo que estas ficam alinhadas no eixo de F2. Ainda que a
mudança dos valores destas vogais não seja muito acentuada, esta é bastante
significativa, pois dá origem a uma configuração do triângulo vocálico diferente da de
VN.
No que diz respeito ao Informante 7 (Figura 62), não há modificações significativas na
configuração do triângulo vocálico. Embora a redução dos valores de F1 das vogais
central e posterior baixa elida o intervalo acústico que as separa das vogais
posteriores, pode observar-se que a organização dos segmentos permanece idêntica à
de VN.
Por último, no Informante 8 (Figura 63), o disfarce provoca a redução da faixa de
variação de F2, devido ao aumento das frequências do segundo formante das vogais
posteriores e decréscimo dos valores do mesmo formante nas vogais anteriores.
77
Embora a configuração do triângulo vocálico se mantenha semelhante a VN, as
distâncias entre as vogais anteriores e central são uniformizadas, pelo que o ligeiro
afastamento das vogais anteriores dos restantes segmentos é suprimido. Por outro
lado, e à semelhança do que acontece no Informante 3, a influência de D4 é mais
visível nas vogais posteriores média e alta, uma vez que há uma aproximação das
mesmas no plano de F2.
4.2.4.5. Considerações finais
No conjunto dos dados, verificou-se que as modificações dos triângulos vocálicos
provocadas pelos disfarces consistem na ampliação/redução das faixas de variação de
F1 e F2, aumento/diminuição da dimensão do polígono, deslocação do triângulo no
espaço acústico, alteração das distâncias acústicas entre as vogais e reorganização dos
segmentos.
De modo geral, as alterações produzidas por D1 traduzem-se na expansão da gama de
variação de F1 e F2, provocando a ampliação do triângulo vocálico, e/ou na deslocação
do polígono no espaço acústico, como resultado do aumento generalizado das
frequências de F1 e F2. No que diz respeito a D2, a presença deste disfarce resulta na
diminuição das faixas de variação de F1 e F2, originando o encolhimento do triângulo
vocálico. Contudo, os dados relativos a D2 não correspondem, na sua totalidade, ao
solicitado, visto que apenas três Informantes realizaram, efectivamente, a descida da
frequência fundamental. Neste sentido, alguns dos resultados obtidos não são tidos
em consideração, já que não podem ser entendidos como decorrentes da presença
deste disfarce. Relativamente a D3, observa-se que este não acarreta distorções na
configuração dos triângulos acústicos. Por último, o efeito de D4 causa a redução, não
muito acentuada, da dimensão do polígono, embora não se verifique nenhum tipo de
alteração nalguns Informantes. Assim, de entre os quatro disfarces analisados, D1 é o
que causa mais modificações na configuração do triângulo vocálico, ao passo que D3 é
o que menos interfere nas características do polígono.
78
Todavia, importa frisar que, como se demonstrou no ponto 4.2.2., existe uma
interacção entre as variáveis falante e disfarce, pelo que o efeito do(s) disfarce(s) não é
semelhante para todos os indivíduos. Apesar de haver tendências gerais associadas a
cada disfarce (aumento global das frequências dos formantes, por exemplo), tal não
significa que essas se verifiquem em todos os sujeitos. Desta forma, as transformações
que um disfarce em particular provoca no triângulo vocálico não são necessariamente
idênticas em todos os falantes.
Por outro lado, a variabilidade dos parâmetros acústicos é uma constante, visto que
existem sempre diferenças entre dois enunciados produzidos pelo mesmo falante nas
mesmas condições (variação intra-falante). Deste modo, ainda que um disfarce como
D3 não produza modificações nos triângulos vocálicos, as frequências dos formantes
não são exactamente iguais entre as duas condições de produção (VN e D3).
Adicionalmente, a extensão da variação intra-falante difere consoante os indivíduos,
sendo que nalguns falantes a variabilidade é maior do que noutros.
O triângulo vocálico é uma ‘ferramenta’ relevante para o Reconhecimento de Falantes,
na medida em que espelha as características anatómicas do tracto vocálico dos
indivíduos e as tendências articulatórias que adoptam enquanto falam, permitindo
fazer uma caracterização do falante. Neste sentido, toda a informação que é possível
extrair dos triângulos vocálicos, desde a sua configuração à organização interna dos
segmentos, constitui pistas extremamente importantes para a identificação do falante.
Assim, a tarefa do perito consiste em procurar as marcas específicas do indivíduo, que
permitam identificá-lo, e verificar através da comparação dos triângulos vocálicos se
esses traços individuais estão presentes nas duas amostras em análise. Porém, deve
salientar-se que, embora a análise e comparação do triângulo vocálico seja um método
valioso para a identificação, este não deve constituir uma prova única, mas deve antes
ser utilizado em conjunto com outros parâmetros acústicos e/ou outras pistas
linguísticas.
No que diz respeito à comparação de VN com D1, D2, D3 e D4, constata-se que,
mesmo na presença do disfarce, são preservadas algumas marcas individuais de cada
sujeto. Ainda que o(s) disfarce(s) provoque(m) alterações nos parâmetros acústicos,
79
em vários casos permanecem intactos alguns traços específicos dos falantes, tais como
a configuração do polígono, a conservação de clusters, a manutenção das distâncias
acústicas ou a própria organização dos segmentos. No entanto, nalgumas situações a
presença do disfarce não permite recuperar nenhuma marca particular, como se
verifica no Informante 2 em D1 (Figura 33).
80
5. CONCLUSÃO
Após a análise e discussão dos resultados, interessa agrupar as principais conclusões obtidas
com o presente trabalho, de forma a poder responder às questões de partida e confirmar ou
infirmar as hipóteses estabelecidas no ponto 3.1.
5.1. Conclusões
No que diz respeito à voz normal, a análise dos triângulos vocálicos permite demonstrar que
não existem valores fixos para as frequências das vogais, resultado do fenómeno da
coarticulação e da variação intra e inter-falante. Assim, a cada vogal corresponde um espaço
de dispersão no triângulo, que é determinado pelo sistema vocálico de cada língua. Neste
sentido, apesar de as zonas de incidência de cada vogal não serem idênticas para todos os
indivíduos, a variação dos segmentos é limitada, pois a sua posição relativa no triângulo
vocálico é aproximada dentro da mesma área para todos os falantes, desde que se
mantenham os mesmos factores de produção.
Por outro lado, as variadas configurações dos triângulos acústicos dos Informantes,
resultantes das dissemelhanças nos valores dos formantes das vogais, evidenciam as
diferenças entre os sujeitos relativamente às características anatómicas do tracto vocálico e
às tendências articulatórias adoptadas aquando da produção de fala. Desta forma, a
disposição dos segmentos, as distâncias acústicas entre as vogais, a faixa de variação de F1 e
F2, bem como a dimensão e localização do triângulo no espaço acústico permitem apontar
marcas específicas de cada falante e, consequentemente, distinguir os indivíduos entre si.
Os valores de F0 permitem verificar que este é um parâmetro relevante para a distinção de
indivíduos de sexos opostos, uma vez que a média da frequência fundamental é mais
elevada no sexo feminino do que no masculino. Do mesmo modo, a comparação dos valores
médios de F0 dos vários Informantes demonstra que a frequência fundamental é, também,
um parâmetro eficaz na distinção de falantes do mesmo sexo.
81
As frequências de F1, F2, F3 e F4 estabelecem, também, a separação entre Informantes de
sexos distintos, pois os valores dos formantes dos indivíduos do sexo masculino são mais
baixos do que os do sexo feminino. Da mesma forma, as frequências dos formantes
possibilitam a distinção entre falantes do mesmo sexo, dado que os valores diferem entre si,
embora a variação inter-falante seja superior nos formantes mais elevados (F3 e F4).
O facto de os valores dos formantes da mesma vogal não serem uniformes entre os
Informantes confirma a existência da relação falante/vogal. Porém, a variação entre os
indivíduos não é proporcional em todos os formantes. A menor variação inter-falante de F1
e F2 prende-se com o facto de estes formantes serem os responsáveis pela determinação da
identidade da vogal. Pelo contrário, as frequências de F3 e F4 são pouco variáveis em função
das vogais, mas são consideravelmente distintas entre os indivíduos, demonstrando que
estes parâmetros estão relacionados com as características anatómicas de cada falante.
Assim, a eficiência dos parâmetros na distinção de falantes é, por ordem de relevância, F0,
F4, F3, F1 e F2. Ainda que, individualmente, F1 e F2 apresentem resultados pouco
significativos, quando utilizados em conjunto são parâmetros satisfatórios para a
discriminação de indivíduos, como demonstram os triângulos vocálicos.
Em relação ao disfarce, pôde constatar-se que os diferentes disfarces não têm
consequências idênticas. Nos disfarces que envolvem a manipulação de F0, D1 traduz-se no
aumento das frequências de todos os parâmetros, ao passo que a influência de D2 é,
apenas, visível no decréscimo das frequências de F2 e F4. Os restantes parâmetros não são
afectados por D2, visto que F0, F1 e F3 mantêm valores semelhantes aos de VN.
Relativamente aos disfarces com recurso ao uso de um objecto, D3 não provoca alterações
em nenhum dos parâmetros acústicos e as modificações causadas por D4 manifestam-se
apenas em F2, F3 e F4, através da descida dos valores destes formantes. Deste modo,
infirma-se a primeira parte da Hipótese 1, que previa que a presença do disfarce interferiria
sempre nos parâmetros acústicos, visto que D3 não afecta nenhum dos parâmetros.
82
No entanto, a segunda parte da Hipótese 1, que afirmava que determinados disfarces
provocam mais modificações no sinal acústico, é válida, pois D1 afecta todos os parâmetros,
enquanto D2 e D4 interferem apenas em F2/F4 e F2/F3/F4, respectivamente.
Neste sentido, confirma-se também a Hipótese 2, que afirmava que a influência de um tipo
de disfarce não seria homogénea entre os vários parâmetros acústicos. De facto, os
diferentes parâmetros não são igualmente afectados pelo mesmo disfarce, uma vez que este
pode modificar todos os parâmetros acústicos (D1), mas pode ter o foco de alteração
centralizado apenas nalguns parâmetros em particular (D2 e D4).
A análise do efeito dos disfarces em cada parâmetro, individualmente, demonstrou que F0 é
alterado apenas em D1, pois, nos restantes disfarces, os valores da frequência fundamental
mantêm-se idênticos aos de VN; F1 não é alterado na presença de D3 e D4, mas sofre
modificações em D1 e D2; as frequências de F2 permanecem invariáveis apenas em D3, dado
que D1 potencia o aumento dos valores deste formante e o valor das frequências diminui
em D2 e D4; a modificação de F3 ocorre através do aumento das frequências em D1,
diminuição das mesmas em D4 e manutenção dos valores em D2 e D3; por fim, F4 não é
alterado em D3, mas verifica-se o aumento das frequências em D1 e a descida dos valores
em D2 e D4.
Desta forma, confirma-se a Hipótese 3, que afirmava que cada parâmetro acústico pode ser
afectado por um tipo de disfarce, mas ser impermeável a outro, visto que o mesmo
parâmetro não é alterado por todos os disfarces.
Assim, conclui-se que os disfarces não actuam todos da mesma forma e que há,
efectivamente, disfarces mais eficazes do que outros. No conjunto dos disfarces estudados,
D1 é o disfarce mais eficiente, pois potencia um aumento das frequências de todos os
parâmetros, ao passo que D3 demonstrou ser ineficaz, visto que a sua presença não acarreta
modificações em nenhum dos parâmetros acústicos. Por outro lado, uma vez que cada
parâmetro não é igualmente afectado por todos os disfarces, conclui-se que a sua robustez
está directamente relacionada com o tipo de disfarce utilizado.
83
Verificou-se que a variação inter-falante existe não só na voz normal, mas também no
disfarce, pelo que a variabilidade dos vários parâmetros em função do disfarce está
dependente de cada indivíduo. Existe, portanto, uma relação entre disfarce e falante, uma
vez que as mudanças produzidas pelos disfarces não são idênticas entre os Informantes,
sendo que um parâmetro pode ser alterado num indivíduo e permanecer inalterado noutro.
Desta forma, a eficiência do(s) disfarce(s) está relacionada com o desempenho de cada
falante na performance do disfarce, sobretudo naqueles que implicam a manipulação dos
articuladores do aparelho fonador, como D1 e D2. Consequentemente, ainda que todos os
Informantes tenham sido capazes de efectuar D1, D2 não foi bem conseguido pela maior
parte dos indivíduos, já que não conseguiram produzir o abaixamento de F0.
Averiguou-se, ainda, que a influência do(s) disfarce(s) não é homogénea entre as vogais e
que o efeito do disfarce em função da vogal não é semelhante em F1 e F2. A presença de D1
manifesta-se em todas as vogais, mas o aumento das frequências de F1 é mais elevado nas
vogais baixas ( [ɛ], [a], [ɔ] ), ao passo que, em F2, os segmentos mais afectados são as vogais
anteriores ( [i], [e], [ɛ] ). Em D2, há uma ligeira descida nos valores de F1 das vogais baixas [a]
e [ɔ], embora a interferência do disfarce seja quase insignificante neste formante. Ainda que
todas as vogais sofram uma descida nas frequências de F2, é na vogal [i] que o impacto do
disfarce é mais relevante. Com respeito a D3, não houve alterações significativas nas
frequências de F1 e F2, apesar de o valor de F2 da vogal [i] diminuir superficialmente.
Quanto a D4, registam-se modificações consideráveis apenas nas frequências de F2 das
vogais anteriores ( [i], [e], [ɛ] ).
Por fim, a confrontação dos triângulos vocálicos de VN com D1, D2, D3 e D4 demonstra que
D1 é o disfarce que causa mais modificações no formato do triângulo vocálico, enquanto que
D3 é o que menos interfere nas características do polígono. Apesar de a presença do(s)
disfarce(s) se reflectir nos triângulos vocálicos, verificou-se que são preservadas algumas
marcas individuais de cada falante, tais como a configuração do triângulo vocálico, a
tendência de localização das vogais, a manutenção de clusters, a não alteração das distâncias
84
acústicas entre as vogais ou a preservação da organização interna dos segmentos. A
recuperação dos traços específicos de cada indivíduo no disfarce é extremamente
importante, pois é através destes que se podem relacionar duas amostras de fala e,
consequentemente, associá-las ao mesmo falante. Contudo, num caso em particular, o
disfarce é tão invasivo que não é possível estabelecer a ligação entre os dois triângulos, já
que no polígono correspondente ao disfarce não é mantida nenhuma característica do
Informante.
Por outro lado, as alterações do triângulo vocálico provocadas pelo disfarce não são
idênticas em todos os indivíduos, uma vez que existe uma relação entre o disfarce e o
falante. Assim, o mesmo disfarce pode resultar na deslocação do triângulo vocálico no
espaço acústico num falante e no aumento da sua dimensão noutro indivíduo.
Para concluir, demonstrou-se que:
(i) a diferente configuração e localização do triângulo vocálico no espaço acústico
resulta da variação inter-falante;
(ii) os parâmetros relevantes para a distinção de falantes na voz normal são F0, F3 e
F4, mas também F1 e F2 se utilizados em conjunto;
(iii) os vários disfarces não actuam todos da mesma forma;
(iv) há disfarces mais eficientes do que outros;
(v) cada parâmetro acústico não é afectado de igual modo pelos vários disfarces;
(vi) a robustez dos parâmetros está dependente do tipo de disfarce;
(vii) algumas vogais são mais permeáveis à influência do(s) disfarce(s);
(viii) mesmo na presença do(s) disfarce(s), são preservadas algumas marcas individuais
de cada falante, que se podem observar através dos triângulos vocálicos.
5.2. Limitações do estudo
A principal limitação do presente estudo prende-se com o facto de um dos disfarces (D2) não
ter sido bem sucedido. Tal como se demonstrou através da análise de D2, a maioria dos
Informantes não efectuou a descida da frequência fundamental. Assim, os resultados
85
obtidos são, de certa forma, condicionados, uma vez que não revelam com precisão a
influência do disfarce nos parâmetros acústicos analisados. No entanto, apesar de o
conjunto dos dados relativos a este disfarce não espelhar, com rigor, as alterações
provocadas nos parâmetros, estes resultados permitiram concluir que a performance do
disfarce está dependente de cada falante, pelo que o mesmo tipo de disfarce não é eficaz
para todos os indivíduos.
Adicionalmente, o reduzido tamanho da amostra e as suas características (faixa etária e
dialecto) podem ser apontados como um factor limitador, na medida em que não são
representativos do padrão populacional.
5.3. Perspectivas futuras
Numa perspectiva futura, aposta-se, em primeiro lugar, na análise mais aprofundada dos
parâmetros acústicos estudados, bem como a extensão da análise a outros parâmetros
relevantes para o Reconhecimento de Falantes. Importa prosseguir a investigação na
procura de parâmetros, por um lado, potencialmente discriminadores da identidade e, por
outro, robustos perante o disfarce. Desta forma, é fundamental estender a investigação a
diferentes parâmetros como a banda formântica, a transição entre segmentos, a amplitude,
a duração de segmentos, o jitter, o shimmer, entre outros. Do mesmo modo, é essencial
alargar a investigação a outros tipos de disfarce que surgem no contexto forense, como a
nasalidade, o sussurro, a mudança de dialecto ou a rouquidão, por exemplo, de forma a
compreender a acção de cada um nos parâmetros geralmente utilizados na Identificação de
Falantes. Por outro lado, é relevante estender o presente estudo a uma amostra mais
abrangente, relativamente à faixa etária e à variedade dialectal. Fica, ainda, por explorar a
perspectiva perceptiva do disfarce da voz, já que é necessário verificar em que medida é que
o disfarce difere do ponto de vista perceptivo e acústico. Por agora, fica o contributo da
presente investigação como ponto de partida para o conhecimento e desenvolvimento dos
estudos sobre o disfarce da voz no âmbito da Fonética Forense.
86
BIBLIOGRAFIA
Amino, Kanae & Arai, Takayuki (2008). Effects of linguistic contents on perceptual speaker identification: comparison of familiar and unknown speaker identifications. Acoustical Science and Technology, 30(2): 89-99.
Amino, Kanae & Arai, Takayuki (2009). Speaker-dependent characteristics of the nasals. Forensic Science International, 185: 21-28.
Bahr, Ruth (2007). Age as a disguise in a voice identification task. Fundamentals of Verbal and Nonverbal Communication and the Biometric, 18(1): 129-139.
Ball, Martin & Rahilly, Joan (1999). Phonetics: the science of speech. London: Arnold.
Blatchford, Helen & Foulkes, Paul (2006). Identification of voices in shouting. International Journal of Speech, Language and the Law, 13: 241-254.
Boë, Louis-Jean (2000). Forensic voice identification in France. Speech Communication, 31: 205-224.
Boersma, Paul & Weenink, David (2007). Praat – doing phonetics by computer. Version 5.1.23. [www.praat.org].
Bolt, Richard et al. (1970). Speaker identification by speech spectrograms: a scientists’ view of its reliability for legal purposes. Journal of the Acoustical Society of America, 47(2): 597-612.
Bonastre, Jean-François et al. (2003). Person authentication by voice: a need for caution. Proceedings of the European Conference on Speech, Communication and Technology, Switzerland.
Broeders, A. (2001). Forensic speech and audio analysis forensic linguistics. Proceedings of the 13th INTERPOL Forensic Sciences Symposium, 16-19 October, Lyon.
Champod, Christophe & Meuwly, Didier (2000). The inference of identity in forensic speaker recognition. Speech Communication, 31(2-3): 193-203.
Clark, John & Yallop, Colin (1995). An introduction to phonetics and Phonology. 2ª edição. Oxford: Blackwell Publishers.
Delgado-Martins, Maria Raquel (1973). Análise acústica das vogais tónicas em Português. Boletim de Filologia, 22: 303-314.
87
Delgado-Martins, Maria Raquel (1992). Ouvir falar: Introdução à Fonética do Português. 2ª edição. Lisboa: Caminho.
Delgado-Martins, Maria Raquel (2002). Fonética do Português: trinta anos de investigação. Lisboa: Caminho.
Fant, Gunnar (1960). The acoustic theory of speech production. The Hague: Mouton.
Figueiredo, Ricardo (1994). Identificação de falantes: aspectos teóricos e metodológicos. Dissertação de Doutoramento. Universidade Estadual de Campinas.
Fry, Dennis (1979). The physics of speech. Cambridge: Cambridge University Press.
Ghiurcau, Marius et al. (2010). A study of the effect of emotional state upon the variation of fundamental frequency of a speaker. Journal of Applied Computer Science & Mathematics, 4: 79-82.
Hansen, John (1996). Analysis and compensation of speech under stress and noise for environmental robustness in speech recognition. Speech Communication - special issue on speech under stress, 20(1&2): 151-170.
Hardcastle, William & Laver, John (1997). The handbook of phonetic sciences. Oxford: Blackwell Publishers.
Harnsberger, James et al. (2008). Speaking rate and fundamental frequency as speech cues to perceived age. Journal of Voice, 22(1): 58-69.
Hollien, Harry & Schwartz, Reva (2001). Speaker identification utilizing noncontemporary speech. Journal of Forensic Science, 46(1): 63-67.
Jessen, Michael (2008). Forensic phonetics. Language and Linguistics Compass, 2(4): 671-711.
Jessen, Michael et al. (2005). Influence of vocal effort on average and variability of fundamental frequency. Speech, Language and the Law, 12(2): 174-213.
Johnson, Keith (1997). Acoustic and auditory phonetics. Oxford: Blackwell Publishers.
Koenig, Bruce (1986). Spectrographic voice identification: a forensic survey. Journal of the Acoustical Society of America, 79(6): 2088-2090.
Kredens, Krzysztof & Góralewska-Lach, Grazyna (1998). Language as sole incriminating evidence: the Augustynek case. Forensic Linguistics, 5(2): 194-202.
Kuehn D. & Moll, K. (1976). A cineradiographic of VC and CV articulatory velocities. Journal of Phonetics, 4: 303-320.
88
Künzel, Hermann (1989). How well does average fundamental frequency correlate with height and weight identification? Phonetica, 46: 117-125.
Künzel, Hermann (1995). The relation between speech tempo, loudness, and fundamental frequency: an important issue in forensic speaker identification. Science and Justice, 35(4): 291-295.
Künzel, Hermann (2000). Effects of voice disguise on speaking fundamental frequency. Journal of Speech, Language and the Law, 7(2): 150-179.
Ladefoged, Peter (1982). A course in phonetics. New York: Hartcourt Publishers.
Ladefoged, Peter (1996). Elements of acoustic phonetics. 2ª edição. Chicago: The University of Chicago Press.
Lass, Norman et al. (1976). Speaker sex identification from voiced, whispered, and filtered isolated vowels. Journal of the Acoustical Society of America, 59(3): 675-678.
Lass, Norman et al. (1979). The effect of phonetic complexity on speaker height and weight identification. Language and Speech, 22: 297-309.
Laver, John (1980). The phonetic description of voice quality. Cambridge: Cambridge University Press.
Lavner, Yizhar et al. (2000). The effects of acoustic modifications on the identification of familiar voices speaking isolated vowels. Speech Communication, 30: 9-26.
Lieberman, Philip & Blumstein, Sheila (1988). Speech physiology, speech perception and acoustic phonetics. Cambridge: Cambridge University Press.
Lu, Xugang & Dang, Jianwu (2008). An investigation of dependencies between frequency components and speaker characteristics for text-independent speaker identification. Speech Communication, 50: 312-322.
Martinez, Luís & Ferreira, Aristides (2008). Análise de dados com SPSS. 2ª edição. Lisboa: Escolar Editora.
Mateus, Maria Helena Mira et al. (2005). Fonética e Fonologia do Português. Lisboa: Universidade Aberta.
Nolan, Francis (1983). The phonetic basis of speaker recognition. Cambridge: Cambridge University Press.
Nolan, Francis (1994). Auditory and acoustic analysis in speaker recognition. In Gibbons, John, Language and Law. New York: Longman Publishing.
89
Perrot, Patrick et al. (2007). Detection and recognition of voice disguise. Proceedings of the 16th International Association for Forensic Phonetics and Acoustics, 22-25 July, Plymouth.
Perrot, Patrick & Chollet, Gérard (2008). The question of disguised voice. Proceedings of Acoustics 2008, 29 Juin-4 July, Paris.
Reich, Alan et al. (1976). Effects of selected voice disguises upon spectrographic speaker identification. Journal of the Acoustical Society of America, 60(4): 919-925.
Rodman, Robert & Powell, Michael (2000). Computer recognition of speakers who disguise their voice. Proceedings of the 2007 International conference on signal processing applications and technology, 16-19 October, Dallas.
Romero, Carlos (2001). La identificación de locutores en el ámbito forense. Dissertação de Doutoramento. Universidade Complutense de Madrid.
Rose, Phil (2006). Technical forensic recognition: evaluation, types and testing of evidence. Computer Speech and Language, 20: 159-191.
Rose, Philip (2002). Forensic speaker identification. London: Taylor & Francis.
Rose, Philip & Simmons, Alison (1996). F-pattern variability in disguise and over the telephone – comparisons for forensic speaker identification. Proceedings of the 6th Australian International Conference on Speech Science and Technology, 10-12 December, Adelaide.
Shipp, Thomas & Hollien, Harry (1969). Perception of the aging male voice. Journal of Speech and Hearing Research, 12: 703-710.
Sjöström, Maria et al. (2006). A switch of dialect as a disguise. Working Papers 52, Lund University, Centre for Languages and Literatures, Department of Linguistics & Phonetics: 113-116.
Solov’eva, E. et al. (2007). Use of pitch and formant analysis in speech biometry. Biomedical Engineering, 41(1): 34-38.
Stevens, Kenneth (2000). Acoustic Phonetics. Cambridge: Massachusetts Institute of Technology Press.
Van Lancker, Diana et al. (1985). Familiar voice recognition: patterns and parameters. Journal of Phonetics, 13: 19-38.
Yarmey, Daniel et al. (2001). Commonsense beliefs and the identification of familiar voices. Applied Cognitive Psychology, 15: 283-299.
90
Zetterholm, Elisabeth (2002). A case study of successful voice imitation. Logopedics Phoniatrics Vocology, 27(2): 80-83.
Zetterholm, Elisabeth (2002). A comparative survey of phonetic features of two impersonators. Proceedings of Phonetik 2002, 44(1): 129-132.
Zhang, Cuiling & Tan, Tiejun (2008). Voice disguise and automatic speaker recognition. Forensic Science International, 175(2): 118-122.
Zhang, Cuiling et al. (2006). Intra- and inter-speaker variations of formant pattern for lateral syllables in Standard Chinese. Forensic Science International, 158: 117-124.
91
ANEXO 1
Valores F0, F1, F2, F3, F4 – VN
Info
rman
te 4
F4
3747
40
91
3857
40
13
3949
41
69
4054
39
30
3843
39
62
4334
41
69
4293
42
88
4132
38
34
4141
38
98
4164
40
72
3820
38
71
4233
42
28
4027
40
91
3866
41
27
4043
16
3
F3
2949
28
43
3210
28
53
3114
29
44
2935
30
22
3109
28
02
2830
31
14
2871
27
79
3008
30
77
3031
29
81
2917
31
32
2912
30
45
2724
28
48
2871
29
08
2412
28
66
2932
15
8
F2
1051
11
28
1302
10
46
1059
26
65
2389
11
28
1142
19
03
2220
14
95
1972
21
46
1495
12
38
922
1229
17
61
2550
10
64
1215
21
69
2151
11
05
2554
13
62
2055
16
26
560
F1
514
353
601
394
468
303
367
431
615
555
390
775
546
381
743
615
365
702
546
358
491
560
399
404
353
307
743
532
493
139
F0
197
180
193
201
182
176
193
185
173
181
189
171
184
186
170
179
181
173
176
184
182
185
185
180
182
194
167
179
182 8
Info
rman
te 3
F4
3224
35
08
3224
39
26
3073
35
63
3357
33
07
3252
32
24
3389
35
13
3490
33
66
3554
34
76
3385
34
17
3513
32
79
3252
31
92
3311
33
75
3137
32
42
3403
33
89
3369
16
9
F3
2509
24
95
2522
23
62
2651
26
46
2463
26
42
2564
20
96
2449
24
99
2504
24
76
2426
26
19
2412
25
59
2499
25
22
2408
24
81
2366
24
63
2233
26
23
2454
23
16
2474
12
4
F2
784
780
1014
70
2 89
4 20
22
2013
94
0 90
3 14
45
1766
12
02
1674
19
17
1289
10
23
926
972
1445
20
55
949
949
1738
17
66
876
2045
10
78
1610
13
13
458
F1
390
257
541
275
413
289
303
431
509
504
390
647
495
390
624
537
349
569
514
307
440
518
422
422
353
280
633
514
440
114
F0
96
106
96
101
98
94
99
100
95
97
93
94
90
97
96
94
95
94
96
100
94
93
97
106
96
100
99
98
97
4
Info
rman
te 2
F4
- 42
38
4059
42
83
3829
42
33
4288
41
00
4109
41
65
4391
42
16
4253
41
70
4101
40
27
4485
39
68
4331
38
84
4068
40
13
4317
42
48
- 41
46
- 40
18
4158
15
6
F3
3031
29
31
2729
28
07
3036
30
41
2669
29
76
2697
26
02
2828
24
09
2676
28
64
2285
26
42
2990
25
70
2713
30
41
2660
25
27
2708
27
17
2770
28
43
2405
25
38
2739
20
5
F2
917
1059
13
12
1059
10
55
2692
22
01
1270
10
96
1821
23
26
1531
21
61
2340
15
63
1321
12
02
1205
16
37
2683
10
99
1202
21
98
2166
10
94
2536
13
65
2005
16
47
569
F1
445
376
816
353
477
321
371
431
683
552
423
920
418
409
883
665
431
782
653
371
451
656
423
386
408
294
869
579
530
186
F0
216
247
231
252
210
193
223
218
212
217
212
221
204
202
194
192
234
192
197
213
207
196
209
189
221
228
192
203
212
17
Info
rman
te 1
F4
3596
39
67
3820
38
75
3820
42
65
4063
37
61
3751
37
88
4105
-
4238
37
88
3898
38
25
- 38
06
3898
40
40
3738
37
93
3912
40
95
3550
40
59
3811
37
51
3885
17
6
F3
2990
28
89
3013
29
17
3013
29
40
2857
30
04
3073
29
72
2931
30
36
2999
28
89
3008
30
45
2963
29
99
2940
31
46
2958
30
59
2976
29
72
2990
31
41
2958
29
86
2988
67
F2
1009
10
73
1371
10
14
1133
25
18
2376
12
11
1141
19
45
2238
14
72
2027
21
55
1518
13
21
968
1234
18
44
2687
93
1 11
65
2100
20
32
1011
26
78
1362
21
05
1630
57
1
F1
367
344
622
307
449
335
321
417
601
463
394
734
459
422
711
486
321
784
431
321
408
601
431
431
316
321
772
454
465
146
F0
166
179
179
163
163
168
164
163
158
165
171
158
170
162
158
164
163
156
165
162
152
156
163
158
164
166
152
157
163 6
Pa
lavr
a
ab
ono
abut
re
adón
is
adub
o an
dorr
a ar
dido
as
ilo
azot
o ba
bosa
ba
rbel
a ca
beça
ca
dáve
r ca
dela
ca
dete
ca
saco
ca
sota
ca
sulo
ca
valo
do
nzel
a er
vilh
a fa
vore
s ga
ivot
a ga
veta
ga
zeta
gr
avur
a na
biça
ta
baco
tr
aves
sa
méd
ia
d.p.
92
Info
rman
te 8
F4
3302
33
43
3343
31
87
3430
35
59
3467
32
52
3339
33
89
3573
34
44
3371
35
82
3453
34
03
3352
35
36
3284
34
12
3380
32
88
3339
34
49
3362
35
31
3440
30
68
3389
11
7
F3
2293
24
03
2321
22
84
2366
24
63
2261
24
67
2270
21
23
2238
23
76
2279
22
98
2243
23
07
2371
21
60
2261
25
50
2298
21
33
2201
22
93
2288
22
66
2027
21
37
2285
11
2
F2
807
830
1087
78
9 92
2 20
73
1876
97
2 83
5 15
87
1724
12
80
1637
17
66
1275
10
50
738
1073
14
03
1958
85
8 87
1 17
11
1729
84
4 19
58
1137
16
46
1301
43
7
F1
390
303
504
303
417
257
280
399
486
486
390
592
472
390
596
523
335
582
482
303
381
486
390
394
349
271
587
436
421
102
F0
99
101
98
107
101
101
100
98
99
98
99
101
94
98
89
94
98
97
102
104
97
100
101
102
99
99
90
104
99
4
Info
rman
te 7
F4
3825
38
06
4123
39
49
3788
41
05
4201
39
90
3994
43
16
4279
45
63
4352
42
15
4499
44
07
3962
41
32
4471
40
77
3875
39
49
4228
43
84
- 40
91
3935
43
89
4145
22
6
F3
2646
28
16
2628
28
62
2926
26
55
2651
29
12
2775
27
06
2678
29
08
2798
26
14
2724
28
57
3086
27
52
2926
27
29
2692
27
65
2614
26
60
2784
27
93
2532
26
65
2756
12
4
F2
1105
11
74
1454
11
47
1206
23
44
2119
13
76
1247
17
75
2022
16
37
1871
19
81
1619
13
67
1078
12
29
1775
23
89
1380
12
61
1954
19
08
1335
22
88
1440
18
94
1621
40
3
F1
514
367
807
344
537
303
353
417
720
601
381
839
601
394
807
752
367
775
601
390
504
720
440
459
349
344
862
537
539
180
F0
191
202
189
204
187
193
193
195
186
190
191
187
185
176
195
180
185
176
182
199
200
189
182
182
184
193
182
174
188 8
Info
rman
te 6
F4
3322
31
92
3429
30
54
3378
33
66
3297
34
01
3553
34
53
3435
37
15
3508
33
94
3696
35
39
3238
36
28
3541
33
61
3198
34
33
3316
34
49
3100
33
20
3770
35
22
3415
17
4
F3
2578
24
58
2583
23
89
2638
23
16
2311
25
55
2717
22
93
2376
26
46
2357
23
53
2541
26
52
2665
26
60
2518
23
20
2403
25
74
2270
23
21
2325
23
57
2463
22
93
2462
14
3
F2
813
968
1151
91
7 10
17
1940
18
76
1077
97
0 16
37
1807
12
34
1679
18
16
1321
11
64
803
1073
16
10
2022
96
6 95
6 17
93
1743
89
4 19
86
1174
16
65
1360
41
1
F1
360
321
518
330
393
284
289
397
513
472
367
647
472
390
601
527
303
637
482
284
444
494
390
408
344
280
642
514
432
114
F0
122
120
131
128
131
122
130
121
128
119
122
121
120
121
111
129
116
127
131
124
124
123
129
124
129
122
115
124
124 5
Info
rman
te 5
F4
3192
32
10
3641
31
46
3229
34
90
3389
34
53
3605
34
99
3596
37
24
3687
35
22
3742
37
01
- 37
74
3715
34
72
3086
36
28
3463
35
73
3187
35
45
3637
35
91
3500
20
2
F3
2490
23
66
2582
24
31
2449
27
84
2550
25
41
2385
23
94
2376
23
71
2559
25
04
2022
23
66
2467
22
06
2568
27
33
2334
21
28
2357
24
76
2293
29
67
2192
23
62
2438
19
5
F2
761
913
1169
82
5 10
36
2197
20
96
1224
10
23
1605
17
89
1270
17
43
1903
13
12
1142
79
3 10
96
1596
21
42
931
1046
18
30
1834
83
7 22
88
1151
17
24
1403
47
7
F1
339
307
587
275
431
257
289
431
523
527
408
670
495
385
670
569
261
647
523
280
408
560
399
408
312
275
660
523
444
136
F0
105
106
100
99
96
108
91
94
97
102
97
90
97
91
89
91
87
92
91
101
96
82
90
87
96
94
89
94
95
6
Pa
lavr
a
ab
ono
abut
re
adón
is
adub
o an
dorr
a ar
dido
as
ilo
azot
o ba
bosa
ba
rbel
a ca
beça
ca
dáve
r ca
dela
ca
dete
ca
saco
ca
sota
ca
sulo
ca
valo
do
nzel
a er
vilh
a fa
vore
s ga
ivot
a ga
veta
ga
zeta
gr
avur
a na
biça
ta
baco
tr
aves
sa
méd
ia
d.p.
93
ANEXO 2 Valores F0, F1, F2, F3, F4 – D1
Info
rman
te 4
F4
4297
42
15
4132
44
99
4279
46
96
4586
45
04
4403
-
4416
- -
4609
-
4279
- - -
4742
-
4196
-
4756
43
16
4655
- -
4446
20
2
F3
3793
37
29
3618
38
71
- 33
85
3568
35
86
3802
35
63
3458
37
47
3485
35
40
3655
38
02
3770
38
94
3559
35
18
3761
37
74
3366
35
63
3573
33
80
3485
34
07
3617
15
8
F2
963
1206
13
57
1197
11
88
2896
29
03
1348
13
02
2321
24
58
1674
21
33
2742
17
84
1376
11
97
1293
19
90
3077
11
51
986
2431
26
05
1307
28
62
1445
23
71
1842
69
3
F1
518
472
890
454
610
472
454
569
839
926
482
1252
87
1 47
2 12
38
885
472
752
780
436
560
871
504
454
449
472
945
812
675
243
F0
451
462
441
451
439
241
445
450
400
475
411
420
445
468
408
431
454
436
446
439
419
458
479
443
436
478
246
237
422
67
Info
rman
te 3
F4
3403
-
3403
38
71
- - - - 34
12
- - 37
70
3976
-
3614
-
3632
38
29
- 45
04
3527
- -
4059
37
47
- 38
25
- 37
55
301
F3
- 27
10
2953
27
98
2742
26
83
- 30
86
- 31
55
- 28
34
2958
-
2811
33
16
2807
29
58
2875
29
40
2706
29
08
3527
28
34
2541
-
2871
-
2905
22
2
F2
885
1110
12
66
1165
11
83
2325
23
80
1069
95
4 19
81
2220
11
33
2142
22
20
1046
12
93
1101
12
75
2110
22
38
991
1055
21
97
2013
11
05
2348
12
52
1995
15
73
550
F1
477
390
715
408
454
390
404
518
564
720
500
837
619
454
743
743
408
853
615
390
445
509
472
440
427
390
794
560
544
150
F0
423
385
426
404
402
377
396
428
373
473
442
419
419
444
346
454
405
431
385
374
411
371
423
392
416
393
402
387
407
28
Info
rman
te 2
F4
4137
- -
4857
40
36
- 47
33
4114
- -
4435
35
77
- 44
62
4421
42
19
4283
42
70
4201
45
59
- 44
39
4293
44
67
- 41
69
3972
-
4297
28
5
F3
- 32
10
3582
30
86
2976
38
43
3151
- -
3476
33
30
2495
38
02
- 31
74
2834
29
99
3256
-
3866
-
3440
- - - -
2495
36
92
3262
41
5
F2
1101
10
96
1101
10
91
1059
29
81
2600
13
07
1144
24
99
2587
19
49
2339
26
09
1949
11
37
1119
14
95
2541
27
61
1069
11
74
2669
25
64
1078
31
23
1500
23
89
1858
73
7
F1
674
537
958
518
944
495
518
913
1023
10
18
518
1036
11
24
532
1014
99
5 53
7 10
29
1014
56
0 58
2 10
32
560
523
537
518
944
890
769
236
F0
260
274
255
256
252
482
259
257
269
258
247
253
268
255
253
268
263
265
264
277
264
272
268
257
265
262
249
270
269
42
Info
rman
te 1
F4
3926
- -
4132
-
4265
- - - - - -
4288
-
3843
-
4013
- - - - - - - - - -
4357
41
18
196
F3
3146
33
16
3274
30
64
3160
32
84
3274
34
85
3307
31
78
3123
33
89
3151
32
06
2917
34
44
3201
34
40
3270
34
12
3178
35
08
3105
32
70
3082
32
61
3375
29
21
3241
15
2
F2
958
1032
12
11
1229
10
09
2843
25
54
1110
11
97
1775
25
50
1362
24
44
2454
13
76
1280
11
19
1325
17
20
2802
92
6 12
38
2596
25
32
853
2798
13
85
2279
17
13
698
F1
468
472
780
431
491
422
408
518
766
853
454
766
784
468
752
674
408
761
770
431
509
798
518
468
408
408
793
775
591
165
F0
434
467
399
425
380
420
410
395
398
451
467
372
368
395
366
344
403
369
369
427
394
419
432
411
393
412
372
378
402
31
Pa
lavr
a
ab
ono
abut
re
adón
is
adub
o an
dorr
a ar
dido
as
ilo
azot
o ba
bosa
ba
rbel
a ca
beça
ca
dáve
r ca
dela
ca
dete
ca
saco
ca
sota
ca
sulo
ca
valo
do
nzel
a er
vilh
a fa
vore
s ga
ivot
a ga
veta
ga
zeta
gr
avur
a na
biça
ta
baco
tr
aves
sa
méd
ia
d.p.
94
Info
rman
te 8
F4
3476
36
14
3729
37
61
3660
38
20
3738
37
70
3637
38
02
- 37
51
3760
37
51
3884
37
38
3660
36
96
- 38
78
3632
36
41
3573
36
83
3696
36
92
3706
37
15
3710
89
F3
2499
34
53
2394
26
23
2325
27
10
2357
24
54
2344
21
28
- 22
15
- 23
44
2278
23
30
2518
24
76
2779
35
77
2449
23
07
2252
21
88
2527
23
53
2068
22
52
2469
35
0
F2
991
1018
13
53
1110
10
59
2004
17
98
1321
11
24
1601
19
67
1206
18
44
1830
13
76
1229
10
00
1133
17
98
2293
10
91
1247
17
93
1688
92
2 18
07
1270
17
66
1451
38
2
F1
495
495
637
482
495
495
472
509
624
615
518
876
541
482
835
610
472
665
702
454
518
693
486
486
454
472
807
527
568
121
F0
495
435
480
470
459
374
475
473
461
254
498
466
467
468
470
465
468
465
453
456
450
469
466
464
444
462
467
464
455
45
Info
rman
te 7
F4
4004
40
95
- 41
73
4215
45
31
4522
43
38
- - 43
75
4618
- -
4563
-
4183
-
4270
43
48
4017
-
4449
46
27
3985
43
29
- 44
71
4322
20
8
F3
3132
32
61
3286
32
74
3082
31
74
- 31
46
- - - 32
06
3132
-
3284
33
20
3485
33
20
3114
32
97
3082
-
3307
33
20
3164
32
38
3339
31
23
3231
10
3
F2
1023
13
02
1279
11
42
1201
28
16
2706
96
8 13
44
2820
28
85
1789
22
66
2692
12
47
1431
10
04
1298
22
93
2697
92
2 12
89
2261
25
87
945
2623
16
79
2183
18
10
712
F1
569
472
863
408
693
454
390
537
908
858
504
1160
78
9 66
0 56
9 89
0 39
0 91
7 10
55
367
569
858
742
766
454
431
1101
82
1 68
6 23
4
F0
411
455
410
416
386
458
389
396
379
463
475
466
443
428
409
460
364
412
382
363
441
383
370
395
442
410
369
321
411
38
Info
rman
te 6
F4
- - 44
81
- - - - 37
47
4880
45
36
4715
41
55
4040
47
92
4426
- -
4490
48
43
- - 34
12
4783
- - -
4756
-
4433
44
4
F3
2853
33
52
2568
34
44
2692
26
19
3609
27
10
2628
25
96
2476
27
61
- - - 26
28
3761
28
75
3380
35
63
2830
24
67
2137
-
3086
37
19
- - 29
43
466
F2
1018
11
10
991
1238
13
57
2119
23
02
1018
15
87
1880
17
24
1472
17
43
2215
13
16
1275
11
05
1293
18
94
2302
10
59
1362
17
29
1724
11
28
2334
13
30
1766
15
50
431
F1
514
477
839
486
592
454
454
518
885
550
518
901
821
477
862
853
486
825
879
454
527
968
477
500
477
472
848
807
640
187
F0
466
473
455
474
466
453
453
452
446
453
449
451
437
430
453
445
476
431
461
452
463
452
447
438
453
464
444
452
453
12
Info
rman
te 5
F4
3843
38
89
3962
40
95
4114
42
79
4545
40
95
3917
42
47
3862
38
43
4091
36
96
3917
-
4141
40
36
4072
-
4146
39
49
4155
41
23
- 44
90
3811
40
13
4053
20
0
F3
3174
31
23
3128
-
3082
30
59
3008
34
26
3022
30
31
2752
27
88
2798
28
30
2756
32
65
4141
29
17
2908
-
3132
28
20
2788
28
16
- 31
14
2596
28
53
3013
30
3
F2
968
848
1234
92
6 91
7 24
54
2412
10
96
1029
18
07
2036
14
63
1789
21
19
1486
10
87
885
1188
19
22
2476
96
8 94
0 22
20
1940
90
3 25
04
1376
20
13
1536
58
1
F1
468
335
647
321
358
303
303
362
711
679
367
913
624
335
825
624
303
807
550
303
390
748
326
362
353
280
848
555
500
204
F0
321
324
317
307
309
305
301
312
265
343
320
279
313
303
307
295
298
289
280
294
319
276
310
315
269
280
285
287
301
19
Pa
lavr
a
ab
ono
abut
re
adón
is
adub
o an
dorr
a ar
dido
as
ilo
azot
o ba
bosa
ba
rbel
a ca
beça
ca
dáve
r ca
dela
ca
dete
ca
saco
ca
sota
ca
sulo
ca
valo
do
nzel
a er
vilh
a fa
vore
s ga
ivot
a ga
veta
ga
zeta
gr
avur
a na
biça
ta
baco
tr
aves
sa
méd
ia
d.p.
95
ANEXO 3 Valores F0, F1, F2, F3, F4 – D2
Info
rman
te 4
F4
3678
38
11
3605
41
46
3609
38
89
3985
36
96
3733
37
24
3907
- -
3843
-
3733
38
02
3692
-
3811
37
15
3779
39
49
3953
39
26
3852
37
47
- 38
08
131
F3
2935
29
12
3018
29
53
3004
29
03
2798
30
54
3114
26
32
2683
31
83
2820
27
88
2747
30
68
2949
29
35
2921
30
64
2958
31
32
2756
28
11
2605
28
85
2995
30
54
2917
15
0
F2
954
830
1165
96
5 10
78
2366
23
25
1014
10
69
1853
21
92
1490
20
45
2288
15
27
1202
92
2 11
88
1917
24
81
981
1082
21
83
2252
97
7 23
66
1362
21
19
1578
58
0
F1
394
307
793
261
390
206
238
349
495
523
408
807
440
390
835
509
394
848
371
229
385
385
408
390
294
216
837
353
445
198
F0
199
224
193
211
201
190
211
194
195
180
211
185
189
208
189
190
202
191
195
211
198
184
206
195
204
209
175
202
198
11
Info
rman
te 3
F4
3064
31
51
3210
32
88
3146
34
63
3343
33
94
3022
32
38
3481
33
71
3476
33
89
3660
32
61
3219
34
72
3495
33
07
3132
31
51
3270
34
53
3183
33
20
3481
34
58
3318
15
5
F3
2353
23
16
2454
24
21
2536
26
69
2440
25
45
2637
21
05
2316
24
76
2399
24
67
2454
25
50
2366
26
87
2412
24
44
2614
26
78
2266
23
89
2215
24
44
2532
21
19
2439
15
2
F2
917
922
1096
84
8 88
5 20
73
1995
92
6 91
7 15
82
1834
12
66
1683
18
99
1293
11
05
885
1041
15
82
2013
89
9 93
1 17
93
1880
88
1 20
45
1124
16
79
1357
45
1
F1
408
275
555
280
408
303
248
381
486
463
371
693
472
335
670
546
307
592
459
294
390
514
371
394
284
238
592
468
421
126
F0
114
119
113
115
112
110
115
115
119
113
114
113
114
108
113
115
107
105
111
112
108
108
110
111
110
115
111
111
112 3
Info
rman
te 2
F4
3155
-
3385
32
52
3229
- -
3261
33
94
3338
34
25
3513
34
39
3402
34
48
3527
33
25
3384
34
90
3380
30
94
3325
33
06
3402
-
3403
36
37
3467
33
74
121
F3
2554
24
05
2853
21
55
2614
32
79
3403
25
27
2775
24
00
2336
26
85
2593
-
2524
26
28
2458
28
64
2671
28
16
2657
28
43
2188
23
49
2370
27
24
2818
24
83
2629
28
5
F2
903
780
1004
96
8 90
3 19
49
1857
11
33
958
1421
18
30
1140
15
31
1775
12
18
1302
94
0 10
67
1595
18
85
777
991
1710
17
15
1025
19
90
1200
16
00
1327
39
5
F1
316
275
536
266
376
225
316
390
477
529
386
561
474
372
575
537
316
524
524
316
336
495
395
363
290
266
566
455
409
109
F0
199
198
198
194
186
200
200
199
191
199
202
192
187
191
197
184
182
181
183
198
189
186
207
201
193
199
187
191
193 7
Info
rman
te 1
F4
3568
37
70
3522
37
33
3550
40
13
4031
36
09
3696
36
37
3903
38
43
4118
40
17
3843
35
86
3609
38
29
3857
38
98
3715
36
73
3862
40
08
3761
39
49
3843
39
12
3798
16
5
F3
2834
28
30
2885
27
88
2885
29
08
2931
29
17
2963
27
06
2857
29
35
2963
28
43
2848
29
08
2802
28
94
2843
29
99
2880
29
72
2885
28
85
2889
31
60
2894
28
80
2892
80
F2
981
883
1073
98
6 10
14
2435
24
76
977
1023
17
89
2339
14
26
2119
23
53
1417
11
79
995
1192
18
62
2591
98
1 11
24
2334
22
75
844
2614
12
98
2165
15
98
636
F1
454
381
610
381
459
266
312
408
592
482
404
738
592
431
766
569
390
697
560
330
440
564
399
408
367
252
738
546
483
142
F0
229
233
205
198
205
220
204
191
199
205
193
181
198
209
183
190
202
179
187
196
197
191
194
199
205
201
186
182
199
13
Pa
lavr
a
ab
ono
abut
re
adón
is
adub
o an
dorr
a ar
dido
as
ilo
azot
o ba
bosa
ba
rbel
a ca
beça
ca
dáve
r ca
dela
ca
dete
ca
saco
ca
sota
ca
sulo
ca
valo
do
nzel
a er
vilh
a fa
vore
s ga
ivot
a ga
veta
ga
zeta
gr
avur
a na
biça
ta
baco
tr
aves
sa
méd
ia
d.p.
96
Info
rman
te 8
F4
3123
30
59
3146
31
55
3128
29
40
3123
30
59
3238
30
31
- 33
25
3247
-
3004
31
64
3788
32
93
- 31
37
3151
32
74
- - 29
72
3096
32
79
3059
31
65
171
F3
2284
22
75
2463
22
75
2334
23
21
2087
24
90
2362
20
87
2073
24
54
2458
21
46
2174
25
27
2321
24
54
2307
22
47
2353
23
53
2091
22
15
2220
21
33
2316
20
96
2283
13
6
F2
816
798
991
926
1004
18
25
1779
97
2 89
4 14
22
1660
11
74
1463
15
96
1147
10
46
798
1000
14
58
1857
84
4 94
9 17
01
1660
82
5 17
70
1059
14
72
1247
37
0
F1
399
326
527
316
440
280
257
399
459
495
390
550
518
390
560
495
321
527
500
321
394
518
394
390
330
280
532
449
420
92
F0
136
134
137
131
140
135
131
130
129
125
134
130
133
135
128
128
135
129
124
129
133
131
133
133
133
136
131
129
132 4
Info
rman
te 7
F4
- 34
53
3797
36
69
3550
37
15
3972
34
81
3921
36
14
3605
44
90
4384
40
91
4531
39
35
- 42
42
4306
36
96
3586
39
62
3774
40
36
- 37
24
4297
44
35
3931
33
5
F3
3540
26
55
2646
26
51
2903
26
60
2697
28
57
2724
24
81
2476
29
86
2779
27
52
2853
29
76
3215
-
2761
29
12
2637
29
26
2591
27
20
- 29
95
2756
27
75
2805
22
5
F2
936
1046
12
06
1055
10
87
2169
19
58
1192
11
69
1706
20
27
1454
18
71
2128
14
72
1243
10
14
1247
17
79
2366
10
87
1165
20
50
2096
11
28
2238
13
62
1894
15
41
457
F1
472
312
647
335
472
316
344
413
670
532
330
825
546
422
780
624
330
770
518
335
477
656
394
482
330
312
830
500
499
167
F0
170
184
174
176
165
181
179
168
171
176
171
171
182
175
171
165
168
173
168
176
170
164
170
162
167
169
161
165
171 6
Info
rman
te 6
F4
3013
27
70
- 29
95
3216
31
55
- 30
50
3355
32
70
3261
35
73
3389
31
64
3518
34
42
3082
35
68
3453
33
52
2985
32
44
3302
32
24
- 31
32
3513
34
99
3261
20
9
F3
2611
23
85
2564
24
67
2481
22
20
- 26
48
2638
23
89
2376
25
82
2587
23
57
2628
26
43
2425
27
52
2532
25
18
2467
25
92
2334
23
66
2545
24
17
2637
24
99
2506
12
4
F2
883
853
1044
10
69
1054
16
74
1706
99
8 95
6 14
13
1550
11
74
1550
16
46
1128
10
30
991
1023
14
86
1848
10
35
915
1660
16
10
986
1724
10
87
1518
12
72
319
F1
411
376
476
394
411
344
344
365
462
472
390
486
427
353
482
499
362
587
454
353
323
393
390
376
298
376
486
468
413
66
F0
127
131
122
121
135
119
133
129
127
119
121
120
130
122
125
129
131
120
123
121
124
127
129
126
126
132
122
115
125 5
Info
rman
te 5
F4
2921
32
52
3325
30
82
3105
32
61
3178
31
28
3187
33
48
3362
36
23
3398
32
93
3508
34
67
3412
36
60
3490
30
31
3045
34
53
3348
33
39
- 31
14
3339
34
53
3301
18
4
F3
2449
24
21
2738
23
62
2376
26
09
2504
24
86
2697
22
70
2339
24
54
2403
23
99
2229
26
74
2266
23
66
2444
24
90
2311
24
21
2325
23
76
2151
26
92
2476
24
54
2435
14
4
F2
693
592
1096
84
8 97
7 21
42
1972
93
6 88
5 14
31
1793
12
29
1692
18
71
1202
10
23
706
1036
15
68
1935
78
4 95
4 17
93
1738
66
0 20
91
1192
15
59
1300
48
5
F1
344
238
550
294
436
257
275
404
509
518
408
688
518
390
688
560
252
624
495
252
371
523
417
422
252
248
688
523
434
144
F0
89
89
90
84
93
96
93
85
85
92
87
81
87
86
80
85
82
78
86
89
85
82
87
88
87
87
90
88
87
4
Pa
lavr
a
ab
ono
abut
re
adón
is
adub
o an
dorr
a ar
dido
as
ilo
azot
o ba
bosa
ba
rbel
a ca
beça
ca
dáve
r ca
dela
ca
dete
ca
saco
ca
sota
ca
sulo
ca
valo
do
nzel
a er
vilh
a fa
vore
s ga
ivot
a ga
veta
ga
zeta
gr
avur
a na
biça
ta
baco
tr
aves
sa
méd
ia
d.p.
97
ANEXO 4 Valores F0, F1, F2, F3, F4 – D3
Info
rman
te 4
F4
3880
39
58
3806
40
59
3857
41
05
3857
37
88
3784
38
48
4050
39
62
4137
42
15
3889
37
88
4059
39
94
4045
41
14
3770
37
42
4150
40
77
3967
40
27
3939
40
91
3963
13
5
F3
2999
29
12
3252
29
81
3027
28
85
2765
30
82
3100
26
92
2692
29
53
2871
28
62
2935
31
09
3022
26
92
2995
28
94
2981
29
86
2742
27
84
2885
29
90
2921
28
25
2923
13
7
F2
922
991
1280
88
3 10
78
2499
23
11
1119
10
82
1807
20
41
1546
19
49
2156
13
94
1229
91
7 12
93
1816
24
86
1069
12
15
2100
21
37
1036
26
28
1399
19
81
1584
55
4
F1
399
371
761
376
454
289
353
399
560
560
371
812
537
376
803
610
367
784
537
367
495
514
390
408
353
266
757
504
492
162
F0
188
199
182
202
187
188
182
186
185
182
184
170
181
180
173
175
189
163
172
188
177
173
180
176
185
182
178
170
181 8
Info
rman
te 3
F4
3187
33
25
3197
31
09
3164
33
48
3316
33
16
3293
31
51
3320
35
04
3660
34
03
3485
34
03
3302
34
07
3403
32
19
3229
33
02
3270
34
30
3219
33
02
3499
33
30
3325
12
4
F3
2509
23
80
2490
22
66
2476
24
90
2376
27
01
2720
20
73
2339
25
27
2467
24
31
2412
25
41
2467
24
81
2421
23
80
2463
25
68
2330
24
58
2353
26
19
2495
23
16
2448
12
9
F2
784
862
1073
99
5 10
08
2004
19
22
931
908
1495
17
43
1229
17
29
1834
13
02
1142
87
1 98
1 14
63
1981
91
7 94
9 17
38
1784
88
5 20
50
1124
16
10
1333
42
6
F1
394
261
495
303
417
307
303
330
504
495
404
647
482
381
610
537
321
555
477
303
353
523
408
408
307
257
637
518
426
115
F0
104
104
98
104
109
95
103
100
109
98
103
102
102
103
99
105
100
97
103
101
103
100
102
104
102
107
105
97
102 3
Info
rman
te 2
F4
4169
42
79
3825
40
31
3852
44
07
4215
41
32
3806
41
47
4239
43
13
4372
43
31
4211
43
38
4150
41
47
4207
37
79
4152
39
26
4137
41
98
4331
42
42
4138
42
44
4154
17
4
F3
2784
28
30
2454
26
37
2862
27
93
2669
27
75
2353
22
94
2630
25
50
2736
26
57
2193
27
06
2793
25
13
2768
28
66
2823
26
23
2657
27
03
2795
27
79
2455
23
82
2646
18
2
F2
1014
11
19
1302
10
55
1133
24
81
2266
12
70
1091
18
34
2009
13
93
2023
21
88
1554
13
35
1091
12
23
1669
24
35
1034
12
06
2188
20
23
1159
24
40
1365
19
08
1600
50
1
F1
449
408
644
390
449
422
358
408
622
600
409
860
515
432
823
633
422
745
685
394
372
670
440
432
395
358
828
506
524
156
F0
204
213
207
221
202
216
225
200
213
216
207
197
208
215
208
200
210
205
220
222
203
209
221
212
216
220
200
211
211 8
Info
rman
te 1
F4
3889
40
04
3719
38
94
3706
42
10
3944
38
02
3907
38
16
4050
38
48
4242
40
54
3907
37
61
- 40
08
3742
-
3733
38
11
3889
41
05
3843
42
10
3733
-
3913
16
1
F3
3050
29
26
2995
29
08
2963
30
59
2843
29
40
3036
28
75
2880
29
58
2921
29
58
2875
29
40
2921
29
67
2986
30
54
2866
30
13
2954
30
13
2871
30
27
2875
29
21
2950
64
F2
977
1041
13
67
1096
10
36
2628
23
11
1211
11
69
1853
22
43
1403
20
22
2243
14
72
1330
88
5 12
34
1867
26
23
1027
11
47
2133
20
32
1055
25
73
1426
20
22
1622
56
5
F1
436
326
624
316
449
335
335
449
615
523
413
693
482
431
697
587
326
720
495
321
449
601
440
431
326
321
775
504
479
138
F0
162
167
170
160
155
159
172
164
157
166
164
164
162
163
161
165
150
157
157
159
158
163
169
157
168
167
154
157
162 5
Pa
lavr
a
ab
ono
abut
re
adón
is
adub
o an
dorr
a ar
dido
as
ilo
azot
o ba
bosa
ba
rbel
a ca
beça
ca
dáve
r ca
dela
ca
dete
ca
saco
ca
sota
ca
sulo
ca
valo
do
nzel
a er
vilh
a fa
vore
s ga
ivot
a ga
veta
ga
zeta
gr
avur
a na
biça
ta
baco
tr
aves
sa
méd
ia
d.p.
98
In
form
ante
8
F4
3247
32
29
3508
31
97
3132
35
73
3197
33
25
3274
33
62
3366
34
14
3490
33
57
3385
33
43
3325
34
26
3334
32
84
3164
32
79
3302
34
95
3082
33
39
3426
34
03
3331
11
7
F3
2270
22
98
2284
22
66
2325
22
01
2133
24
90
2435
20
78
2201
23
53
2284
22
75
2288
23
57
2467
23
07
2288
22
61
2220
21
23
2174
22
84
2220
21
42
2160
21
69
2263
10
1
F2
794
793
1087
86
2 91
3 18
85
1747
92
6 81
2 14
63
1665
12
89
1550
16
83
1330
10
50
858
958
1344
19
03
803
871
1619
16
05
913
1812
10
41
1518
12
53
386
F1
390
321
523
321
427
303
321
394
463
495
408
592
463
381
546
486
353
560
504
303
399
472
422
394
339
303
587
477
427
89
F0
135
134
131
114
115
134
111
127
112
126
139
116
116
120
131
124
127
104
107
108
109
115
110
114
120
121
119
109
119
10
Info
rman
te 7
F4
3829
37
10
4260
36
73
3733
40
04
4095
37
47
3994
42
65
- 44
94
4247
41
73
4219
42
24
3797
42
19
4348
39
94
3829
39
21
4068
42
24
3825
39
94
4132
40
77
4041
21
9
F3
3174
29
26
3141
28
75
2875
28
02
2816
29
08
2839
26
97
2609
29
63
2752
25
41
2770
29
53
3036
27
33
2875
27
79
2908
27
38
2591
26
65
3077
27
38
2596
26
55
2823
16
5
F2
1064
10
78
1403
11
69
1234
23
25
2013
13
57
1174
16
65
2032
15
46
1885
19
17
1518
12
84
1142
12
93
1720
24
17
1206
12
80
1990
19
17
1114
22
84
1376
18
30
1580
41
4
F1
587
362
770
353
500
353
344
514
670
601
495
757
541
482
812
720
362
748
578
344
504
660
518
477
344
344
816
518
538
157
F0
181
184
173
189
174
188
184
181
170
195
179
171
172
168
175
171
177
168
173
173
175
166
173
173
177
177
161
168
175 7
Info
rman
te 6
F4
3258
30
36
3521
30
22
3248
33
16
3201
32
48
3470
35
08
3430
37
24
3559
33
02
3770
34
75
3169
36
23
3563
33
15
3253
33
92
3284
33
71
2995
32
61
3623
34
95
3373
20
2
F3
2583
23
57
2564
25
22
2643
23
16
2330
26
85
2735
22
79
2394
26
55
2389
23
25
2412
25
74
2683
26
42
2435
24
23
2440
26
38
2311
23
16
2412
25
18
2490
24
03
2481
13
7
F2
813
812
1109
92
6 97
0 18
99
1839
96
6 92
9 16
79
1816
12
15
1679
18
39
1270
10
40
775
1156
16
14
2009
93
3 92
0 17
43
1812
85
3 19
45
1234
16
92
1339
42
8
F1
393
321
564
321
439
312
316
420
522
518
404
651
500
404
711
545
316
656
482
321
453
504
408
422
330
303
683
472
453
121
F0
165
169
151
155
163
152
160
159
160
171
151
146
158
158
154
149
166
150
159
157
155
159
147
155
162
162
147
152
157 6
Info
rman
te 5
F4
2995
31
87
3481
30
13
3238
33
80
3261
33
62
3518
33
66
3540
37
56
3687
33
80
3774
36
51
3407
37
29
3605
33
48
3178
33
57
3449
35
13
3091
34
49
3591
34
21
3419
21
1
F3
2449
22
15
2651
22
93
2412
28
30
2591
25
41
2417
23
66
2467
24
63
2518
23
99
2155
23
57
2573
21
97
2536
28
53
2412
22
70
2399
24
17
2220
28
39
2000
24
17
2438
20
1
F2
734
839
1119
10
23
1073
21
65
2096
10
78
995
1568
19
08
1316
17
43
1871
13
07
1133
81
5 10
78
1601
21
92
908
1082
17
70
1816
78
0 21
37
1169
16
60
1392
46
9
F1
358
280
596
289
408
261
266
376
537
518
390
702
504
367
706
601
312
642
541
271
413
555
390
390
284
248
660
537
443
146
F0
102
111
102
103
102
106
96
96
92
93
97
92
95
95
84
95
90
88
100
99
93
90
97
98
87
100
84
90
96
6
Pa
lavr
a
ab
ono
abut
re
adón
is
adub
o an
dorr
a ar
dido
as
ilo
azot
o ba
bosa
ba
rbel
a ca
beça
ca
dáve
r ca
dela
ca
dete
ca
saco
ca
sota
ca
sulo
ca
valo
do
nzel
a er
vilh
a fa
vore
s ga
ivot
a ga
veta
ga
zeta
gr
avur
a na
biça
ta
baco
tr
aves
sa
méd
ia
d.p.
99
ANEXO 5 Valores F0, F1, F2, F3, F4 – D4
Info
rman
te 4
F4
3600
35
96
3366
33
43
3848
39
26
3637
33
85
3596
37
33
3637
34
99
4274
35
77
3724
34
49
3568
37
61
4063
38
06
3545
35
31
3715
34
67
3536
35
86
3770
35
63
3646
20
7
F3
2990
30
31
2843
29
49
3178
29
58
2949
29
26
3146
26
92
2811
29
81
2926
29
99
2981
35
45
2229
29
86
3261
30
59
2949
30
64
2820
29
58
2958
29
81
2972
29
44
2967
21
2
F2
867
825
1261
96
8 10
46
2509
22
93
1133
11
28
1885
17
84
1536
19
08
2183
13
85
1220
96
8 12
57
1614
26
69
1036
11
83
2078
20
32
848
2532
13
62
1853
15
49
561
F1
431
399
679
381
504
385
344
436
688
637
431
908
560
404
862
647
381
752
697
371
422
637
518
417
376
339
848
569
537
171
F0
211
215
204
219
184
213
197
196
176
211
205
187
189
191
199
200
196
180
178
177
180
175
185
192
197
192
195
186
194
13
Info
rman
te 3
F4
3219
33
48
3270
31
46
3155
34
72
3366
34
35
3265
31
92
3421
31
41
3421
34
67
3330
35
45
3499
33
94
3284
31
37
3164
31
23
3302
34
90
3100
32
70
3279
30
77
3297
13
8
F3
2270
22
43
2435
22
33
2490
24
21
2261
24
26
2449
20
22
2321
22
79
2376
24
44
2421
25
13
2366
24
21
2417
22
70
2201
24
54
2302
23
62
2151
23
57
2325
21
55
2335
11
6
F2
995
936
1174
11
92
1036
19
26
1775
11
79
922
1417
16
19
1298
14
86
1642
12
93
1151
99
1 99
5 13
90
1839
10
09
908
1605
16
46
1091
18
30
1023
14
49
1315
31
9
F1
335
243
482
344
339
326
307
381
472
463
408
527
436
417
555
493
358
518
500
321
349
491
390
408
298
289
550
472
410
88
F0
106
106
105
102
100
98
106
101
103
105
103
106
108
105
104
98
98
99
99
101
102
100
103
104
100
104
105
100
102 3
Info
rman
te 2
F4
4036
40
54
3857
40
54
3816
41
55
4072
42
88
3981
-
4156
41
01
4317
42
76
4340
-
4178
40
73
4041
39
21
3742
39
90
- 42
85
4271
42
33
3926
-
4090
16
6
F3
2871
29
31
2371
26
46
2678
27
38
2642
26
32
2596
22
07
2625
25
75
2602
26
39
2248
28
02
2940
24
37
2519
26
51
2588
26
05
2510
26
34
2777
27
98
2354
23
91
2607
18
5
F2
1000
10
91
1380
11
10
1105
23
34
2123
12
70
1018
15
49
1839
14
11
1853
20
00
1411
13
30
1041
10
85
1494
22
43
1191
11
28
1876
19
91
1108
22
84
1122
16
87
1503
43
6
F1
381
431
615
408
558
408
427
440
587
543
405
768
533
400
851
587
436
731
611
394
515
601
386
405
428
399
667
575
518
129
F0
207
213
211
210
200
206
214
211
203
209
204
204
201
204
203
197
205
201
202
203
196
199
201
185
215
218
196
192
204 7
Info
rman
te 1
F4
3784
36
78
3485
38
94
3719
42
47
4270
37
79
3866
39
72
4215
38
02
4068
43
66
3738
38
16
4022
41
23
4137
43
75
3793
37
97
4050
41
27
3596
42
65
3825
40
27
3958
23
8
F3
2885
28
20
2747
28
34
2857
29
99
2940
29
72
2972
28
57
2862
29
31
3041
30
04
2862
28
85
2807
28
94
3045
31
51
2811
29
03
2908
29
81
2885
31
74
2848
28
34
2918
10
1
F2
945
1101
12
80
926
1078
26
46
2334
12
29
1087
19
58
2155
15
13
2050
22
79
1559
13
39
899
1229
18
62
2564
92
2 11
60
2100
21
65
986
2669
13
48
1889
16
17
585
F1
454
408
660
344
472
326
335
536
537
537
408
803
569
399
751
600
344
715
472
371
404
579
367
495
367
289
770
550
495
145
F0
183
214
187
187
180
191
187
183
181
189
193
170
186
183
174
184
179
177
172
189
172
172
174
181
192
188
174
177
183 9
Pa
lavr
a
ab
ono
abut
re
adón
is
adub
o an
dorr
a ar
dido
as
ilo
azot
o ba
bosa
ba
rbel
a ca
beça
ca
dáve
r ca
dela
ca
dete
ca
saco
ca
sota
ca
sulo
ca
valo
do
nzel
a er
vilh
a fa
vore
s ga
ivot
a ga
veta
ga
zeta
gr
avur
a na
biça
ta
baco
tr
aves
sa
méd
ia
d.p.
100
In
form
ante
8
F4
3178
31
87
3366
31
32
3192
32
56
- 33
30
3339
30
86
3141
34
95
3366
34
35
3394
34
49
3077
33
20
3343
32
79
3183
32
15
3050
33
80
3219
32
65
3238
32
52
3265
11
8
F3
2417
24
31
2550
24
03
2614
23
07
2311
24
90
2348
18
99
2233
25
91
2344
22
70
1885
24
54
2426
21
97
2316
26
37
2238
20
32
2013
-
2100
23
21
1894
22
20
2294
21
5
F2
803
605
1165
10
36
1046
18
53
1614
10
73
876
1211
16
56
1257
14
58
1637
12
70
1174
10
00
981
1371
18
94
885
968
1472
15
36
1032
18
07
1091
15
23
1261
33
9
F1
381
284
463
284
399
307
330
408
495
468
390
582
504
390
573
504
358
560
495
303
390
504
390
404
367
321
587
509
427
93
F0
121
123
121
139
124
129
136
122
119
123
130
116
114
125
114
121
129
111
125
128
118
122
124
120
122
126
114
118
123 6
Info
rman
te 7
F4
- 39
67
3912
39
30
3751
42
38
4288
37
24
3724
36
84
3871
41
55
4265
40
77
3884
40
82
3907
38
25
3522
36
73
3683
36
09
3953
42
19
3747
-
3398
36
00
3873
24
1
F3
2859
28
85
2403
29
58
2843
26
05
2660
28
02
2752
25
45
2499
28
25
2802
26
97
2692
27
98
3008
27
33
2481
26
23
2697
25
96
2596
26
09
2843
-
2486
25
04
2696
15
7
F2
1124
95
8 12
93
1018
11
83
2302
19
90
1307
10
04
1683
19
26
1270
16
74
1880
13
71
1234
10
50
1105
14
40
2146
11
10
1114
19
26
1816
10
55
2536
12
06
1798
14
83
443
F1
601
367
688
344
509
326
330
399
537
605
399
715
642
413
743
651
349
647
582
353
495
647
471
445
344
257
711
500
503
144
F0
186
195
188
176
177
182
163
174
171
196
177
176
189
171
171
173
175
159
168
181
191
158
171
171
176
168
174
164
176
10
Info
rman
te 6
F4
3225
32
84
3368
28
89
3198
32
65
3444
30
68
3484
35
36
3504
34
58
3655
33
48
3683
32
90
3210
35
73
3871
33
71
3230
34
56
3880
37
42
3073
33
48
3596
38
34
3424
24
8
F3
2333
23
57
2380
22
38
2430
22
47
2288
24
65
2449
24
81
2444
21
83
2417
25
64
2628
22
87
2665
25
77
2435
23
53
2223
23
75
2515
24
12
2389
22
52
2275
24
35
2396
12
4
F2
878
913
1086
93
6 10
44
1679
17
93
1077
95
6 14
95
1692
11
19
1587
17
15
1165
10
12
968
1055
16
14
1981
91
5 88
3 17
84
1743
93
6 18
80
1091
15
59
1306
37
4
F1
439
381
591
367
508
344
353
439
568
482
431
725
537
459
637
578
385
633
495
344
476
522
399
431
390
376
656
537
482
105
F0
171
182
169
188
188
162
182
179
173
173
166
168
180
188
168
172
191
174
176
179
181
182
179
187
183
192
168
187
178 8
Info
rman
te 5
F4
3045
-
3646
33
80
2940
35
73
- 37
33
3444
37
10
3036
36
23
3930
37
29
3628
37
06
3380
34
03
3889
35
45
3513
34
76
- 37
74
3385
29
49
3499
38
16
3510
27
8
F3
2357
23
53
2353
22
75
2399
25
87
2541
22
75
2311
22
29
2211
21
33
2371
22
98
1977
24
95
2733
22
20
2495
24
03
2412
21
46
2385
23
76
2284
22
93
2091
22
38
2330
15
7
F2
720
908
1014
77
5 94
0 21
69
1899
11
69
972
1463
16
69
1211
16
60
1848
11
69
1114
88
5 98
6 15
14
2091
78
4 93
6 17
34
1660
84
4 20
32
1078
15
00
1312
44
5
F1
371
321
555
261
404
257
289
454
537
482
408
647
495
390
610
582
339
582
495
280
371
532
431
408
275
280
615
500
435
120
F0
107
107
104
98
102
108
102
98
98
108
107
94
100
100
95
98
95
94
98
106
96
96
95
104
99
103
96
93
100 5
Pa
lavr
a
ab
ono
abut
re
adón
is
adub
o an
dorr
a ar
dido
as
ilo
azot
o ba
bosa
ba
rbel
a ca
beça
ca
dáve
r ca
dela
ca
dete
ca
saco
ca
sota
ca
sulo
ca
valo
do
nzel
a er
vilh
a fa
vore
s ga
ivot
a ga
veta
ga
zeta
gr
avur
a na
biça
ta
baco
tr
aves
sa
méd
ia
d.p.
101
ANEXO 6
Corpus
Eu digo barbela, Paulo.
Eu digo ardido, Paulo.
Eu digo cabeça, Paulo.
Eu digo adónis, Paulo.
Eu digo abono, Paulo.
Eu digo abutre, Paulo.
Eu digo casaco, Paulo.
Eu digo azoto, Paulo.
Eu digo cadáver, Paulo.
Eu digo cadela, Paulo.
Eu digo casota, Paulo.
Eu digo favores, Paulo.
Eu digo gravura, Paulo.
Eu digo nabiça, Paulo.
Eu digo Andorra, Paulo.
Eu digo cadete, Paulo.
Eu digo casulo, Paulo.
Eu digo babosa, Paulo.
Eu digo gaivota, Paulo.
Eu digo gazeta, Paulo.
Eu digo tabaco, Paulo.
Eu digo gaveta, Paulo.
Eu digo asilo, Paulo.
Eu digo cavalo, Paulo.
Eu digo adubo, Paulo.
Eu digo donzela, Paulo.
Eu digo ervilha, Paulo.
Eu digo travessa, Paulo.
102
ANEXO 7
Declaração de Objectivos
Fica determinado que o material gravado pela mestranda Raïssa Ricardo Gillier, aluna nº 32755 da Faculdade de Letras da Universidade de Lisboa, será utilizado, divulgado e disponibilizado nas circunstâncias e condições abaixo explicitadas:
1. No âmbito do Mestrado em Linguística Portuguesa (“O disfarce da voz em fonética forense”). Para o desenvolvimento da investigação, será necessário fazer uso do material recolhido, nos seguintes contextos situacionais:
- elaboração da Tese de Mestrado;
- apresentação regular, em aula, da investigação em curso;
- colaborações e/ou participações em congressos, conferências, entre outros eventos.
2. Conservação em bases de dados, com aplicações e fins exclusivamente científicos.
Deve salientar-se que a identificação explícita de qualquer interveniente nas gravações não ficará expressa em nenhuma das circunstâncias acima apresentadas sendo, apenas, reveladas as seguintes informações.
- naturalidade;
- idade;
- sexo;
- habilitações literárias;
103
ANEXO 8
Termo de Aceitação
Eu, abaixo-assinado, considero-me informado acerca do uso, bem como das condições e circunstâncias de divulgação e disponibilização do material resultante da minha participação nas gravações efectuadas pela mestranda Raïssa Ricardo Gillier, aluna nº 32755 da Faculdade de Letras da Universidade de Lisboa.
Concordo com as condições apresentadas e autorizo a utilização dos dados, conforme os termos descritos na declaração em anexo a este documento.
Assinatura __________________________________________