esteta banner 960

dauridiogo

A foneticista Renata Regina Passetti, autora do estudo: determinando os parâmetros acústicos modificados e os que permaneceram inalterados

Nem sempre é o que se ouve: Estudo do IEL avalia os efeitos da transmissão telefônica no sinal da fala

Quando os peritos têm que avaliar um crime cuja única evidência é uma amostra de fala, obtida por meio de interceptação policial, então eles têm que conduzir gravações de outros suspeitos para compará-las. Ocorre que essas gravações não são feitas em telefone e sim em aparelhos de alta qualidade acústica, como microfones e placas de som em ambientes tratados, enquanto as gravações do celular são efetuadas em ambientes abertos, estando sujeitas a interferências, como os ruídos, por exemplo.

Um estudo de mestrado do Instituto de Estudos da Linguagem (IEL), envolvendo os efeitos da transmissão telefônica no sinal da fala, mostrou que as modificações nas disposições das vogais podem interferir na percepção de quem ouve. “O abaixamento e a centralização do espaço vocálico fazem com que certas vogais se situem próximas à posição original de outras vogais, o que pode resultar em percebê-las com qualidades acústicas distintas das originais”, concluiu a linguista e foneticista Renata Regina Passetti, autora do estudo.

Ao avaliar os efeitos da transmissão telefônica no sinal da fala, Renata conseguiu determinar os parâmetros acústicos modificados e os que permaneceram robustos, inalterados. Foram analisados diversos parâmetros acústicos para as vogais orais do português brasileiro, entre eles as frequências dos primeiros três formantes da fala, a ênfase espectral, a frequência fundamental e a duração interpicos de F0.

Segundo a mestranda, entre os parâmetros modificados, estiveram as frequências dos três primeiros formantes, que refletem o modo de vibração ressoante do tubo acústico da fala. “Mas a vogal ‘a’ não foi muito alterada pela transmissão telefônica, por se situar distante dos limiares da frequência de corte do filtro telefônico. Então ela seria uma boa candidata para análise forense.”

As frequências dos primeiros três formantes, conta ela, são responsáveis por produzir as qualidades distintivas de uma vogal e modificam-se de acordo com as movimentações de órgãos vocais. Isso tem a ver com as características do trato vocal de cada sujeito. Logo, este parâmetro está associado a características individuais e pode ser analisado a partir da extração por meio de programas de análise fonética.

O estudo da fala demonstra que existe uma fonte, um filtro e a fala propriamente. A fonte envolve o sistema respiratório, laringe e cordas vocais. Essas cordas vocais vibram e geram uma energia, um som que é filtrado e separa algumas frequências que dão o timbre da voz.

“Mas nosso trabalho não diz respeito ao modo como a pessoa fala e sim como o filtro telefônico age no sinal da fala”, ressalva Renata. “A distorção pode provir de efeitos técnicos como a filtragem específica do canal telefônico, que filtra a energia em uma frequência de banda que varia entre 300 e 3500 Hz. A energia que estiver acima e abaixo desses limites é atenuada, e a informação pode ficar seriamente comprometida.”

Essa pesquisa, orientada pelo professor do IEL Plínio Almeida Barbosa, revelou que a transmissão telefônica agiu de forma a aumentar artificialmente os valores de frequência do primeiro formante para todas as vogais orais. Este aumento foi, em média, de 14%.

Outros parâmetros, como a frequência fundamental (ligada à entoação da fala) e a ênfase espectral (ligada à intensidade da fala e à produção da energia em alta frequência), foram alterados porque esse filtro acaba cortando faixas de frequências da fala no sinal acústico. Então, em determinadas faixas, não passa informação.

A duração interpicos de F0 é um parâmetro associado ao ritmo e à organização da fala do ponto de vista entoacional. Este parâmetro mostrou-se robusto aos efeitos da transmissão telefônica e se manteve inalterado.

O uso desses parâmetros, menciona Renata, pode ajudar a determinar a influência do celular no sinal da fala e, com isso, mostrar quais parâmetros foram alterados e quais permaneceram robustos.

O projeto de Renata sugeriu aplicações na área forense de reconhecimento de locutor, que é quando se comparam gravações obtidas por telefone com gravações obtidas diretamente (registrada pelo microfone).

A mestranda acredita ter contribuído com o conhecimento sobre os efeitos da transmissão telefônica na fala com amostras da fala do português brasileiro. As investigações até aqui eram relacionadas ao alemão, ao inglês americano e ao britânico, além do sueco.

Comparação

A linguista salienta que tem havido um aumento nas investigações de crimes com base em amostras de fala de celulares, a fim de identificar as características linguísticas do criminoso para delimitar o conjunto de suspeitos. Por isso é preciso detectar com cautela o grau de modificação acústica da transmissão telefônica ao sinal da fala, de modo que a comparação não gere uma identificação errônea.

A transmissão no celular pode ser afetada por fatores ambientais, pela tecnologia ou por fatores relacionados ao falante, que pode adotar determinado comportamento ao falar ao telefone, o que provocaria uma alteração de estilo, a chamada “voz telefônica”.

Ao analisar os parâmetros para as vogais orais, os principais achados se relacionaram às frequências formânticas, que são bastante afetadas pela transmissão telefônica.

No estudo, percebeu-se que as frequências do primeiro formante, que estão associadas à abertura e ao fechamento mandibular, sofreram um aumento na gravação telefônica. Já as frequências do segundo formante sofreram uma diminuição para as vogais anteriores e um aumento para as vogais posteriores. “Essas modificações podem ter consequências perceptuais, uma vez que essas vogais se modificaram a ponto de poderem ser percebidas como outras vogais – por exemplo um ‘i’ como um ‘e’. Portanto, isso pode afetar o modo como ouvimos essas vogais no telefone”, expõe Renata.

Associado à frequência fundamental, por exemplo, foi analisado um parâmetro que chama valor de base da frequência fundamental, que é a baseline. Esse parâmetro pode ser relacionado ao modo de vibração neutra das pregas vocais e se mostrou robusto ao efeito do telefone.

Gravações

Nessa pesquisa, foram analisados dez sujeitos do sexo masculino. Para cada um deles, foram realizadas duas gravações, totalizando 20. Uma escolha interessante foi que este trabalho tomou por base informações sobre a população carcerária brasileira. “Já que queríamos fazer um estudo que se aproximasse de situações reais, nos baseamos em dados do Ministério da Justiça para compor nosso corpus. De acordo com dados de 2012, 88% da população carcerária era masculina e com faixa etária predominante de 18 a 24 anos. Nossos sujeitos foram selecionados com base nessas informações.”

Renata fez as gravações numa sala acusticamente tratada no IEL. Como ela se interessou em analisar apenas os efeitos técnicos do telefone celular, então efetuou gravações simultâneas para comparar gravações via celular com gravações diretas: enquanto os sujeitos falavam com a pesquisadora pelo celular e esta os gravava por meio de um grampo, na frente deles havia um microfone que ia gravando a sua fala natural, sem a interferência de um aparelho.

O microfone ficava colocado de forma a não atrapalhar o discurso deles. Como Renata tinha que controlar o processo, para que todos os sujeitos tivessem o mesmo protocolo experimental, ela formou um protocolo designado de “tarefa de mapa”, que consistiu em traçar um trajeto de um ponto a outro.

O ponto escolhido foi a praça Arcádia do IEL. Os locutores tinham que falar para a autora do estudo como ela iria da Arcádia ao supermercado Pão de Açúcar, de Barão Geraldo. Essa descrição partia de imagens que eles estavam vendo por meio de slides até chegar ao ponto pretendido.

Na sala em que os locutores estavam, tinha o microfone, o projetor de slides e o celular. Renata ficava em outra sala, falando pelo celular, mas gravando ao mesmo tempo.

Com as gravações em mãos, ela analisou as vogais orais do português brasileiro – em posição tônica ([a, e, ɛ, i, o, ɔ, u]) e em posição átona ([ɐ, ɪ, ʊ]). A análise consistiu em observar quais os efeitos da transmissão telefônica sobre essas dez vogais; os efeitos sobre os locutores, ou seja, se os sujeitos eram afetados diferentemente a depender do parâmetro; e sobre o espaço vocálico dos sujeitos – como as vogais de cada sujeito modificaram depois de terem sido passadas pelo telefone.

Os pares de gravação permitiram comparar o mesmo conteúdo, mas com qualidades acústicas distintas, uma com as interferências características do filtro telefônico e outra com o sinal da fala sem interferências de aparelhos externos.

Conforme a mestranda, geralmente os peritos analisam as vogais porque elas são pontos máximos de energia e pelo fato de serem mais estáveis, por serem produzidas sem obstruções no trato vocal. “Só que os parâmetros que se modificam”, diz ela, “não devem deixar de ser analisados, mas utilizados com cautela, para não serem conduzidas análises equivocadas na situação real. É muito grave afirmar que uma pessoa é culpada, sendo que ela não é”.  

Interceptação

A interceptação é feita por meio de um dispositivo usado pela polícia, que é uma espécie de grampo. Essa ferramenta acabou se tornando fundamental nas investigações ligadas ao crime organizado e ao crime financeiro. Mas apenas pode ser usada depois de esgotadas as outras formas legais de apuração dos fatos.

Renata explica que a área de fonética, em geral, está focada na pesquisa. “As nossas gravações são obtidas apenas em caráter experimental. Não temos acesso a gravações reais”, descreve. Para trabalhar em uma situação criminal, é preciso ser concursado da Polícia Federal ou da Polícia Civil.

A formação em linguística não faculta o ingresso na carreira de perito criminal. “Ressaltamos que nessa área de reconhecimento de locutor é fundamental que o profissional tenha formação em fonética acústica, por ter conhecimento de procedimentos de análise e descrição de características acústicas que auxiliem na identificação de um indivíduo”, salienta a mestranda. “A nossa expectativa é que a atuação dos foneticistas seja aceita também para o trabalho aplicado.”

Há vários estudos na Unicamp que contribuem para a área de fonética forense. No Grupo de Estudos em Prosódia da Fala, orientado pelo professor Plínio Barbosa, existem projetos sobre o telefone celular, ruídos na fala, dialetos, disfarces de fala, entre outros.

Publicação
Dissertação
: “O efeito do telefone celular no sinal da fala: uma análise fonético-acústica com implicações para a verificação de locutor em português brasileiro”
Autora: Renata Regina Passetti
Orientador: Plínio Almeida Barbosa
Unidade: Instituto de Estudos da Linguagem (IEL)
Financiamento: Fapesp

Texto: Isabel Gardenal
Fotos: Antoninho Perri
Edição de Imagens: Fabio Reis
Jornal Da Unicamp

Agenda Cultural

Workshops, palestras, seminários, conferências, congressos, shows, exposições e cursos na área Cultural

Seg Ter Qua Qui Sex Sáb Dom
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31

Parceiros

geralinks
linkirado atoananet