next up previous contents
Seguinte: Descodificação, Descompressão ou Síntese Acima: Codificação, Compressão ou Análise Anterior: Cálculo do Pitch e   Conteúdo

Cálculo do Ganho e Detecção de Início/Fim da Fala

Uma técnica para reduzir a quantidade de informação necessária e poupar largura de banda é não transmitir o silêncio visto que cerca de 50% de conversa em conversação normal é silêncio.

Sendo assim, é necessário uma medida para distinguir o silêncio do sinal de voz.

O ganho é o volume e este não é constante num sinal de voz.

Como tal, sobre cada frame calcula-se uma função de ``energia'' que dá a intensidade de som existente nessa frame, cujo valor é o ganho.

Se estiver acima de um dado valor é falado caso contrário é considerado silêncio, ou seja, energia baixa implica silêncio ou ruído de fundo e uma energia alta som ou fala.

Convém no entanto ajustar um ganho para que quando se comuta entre sons vozeados ou não vozeados haja um salto grande no volume de som.

Como cada frame é uma váriavel aleatória contínua uniforme que está entre -1 e 1, podemos escrever a função de energia como:


\begin{displaymath}
Energia = \sum_{i}^{N} E[x(k)^{2}]
\end{displaymath}

em que E é o valor esperado e $ E[x(k)^{2}] $ representa a variância.


next up previous contents
Seguinte: Descodificação, Descompressão ou Síntese Acima: Codificação, Compressão ou Análise Anterior: Cálculo do Pitch e   Conteúdo
2003-07-23