Esta es una pregunta muy interesante. La respuesta corta es AMBOS. Aquí hay una respuesta más larga.
Los sonidos de la voz humana se pueden modelar como un generador de señal de banda ancha de frecuencia variable que maneja una cadena de aproximadamente una docena de filtros resonantes de frecuencia variable. El generador produce un sonido estridente, esencialmente una serie de pulsos cortos, que es rico en frecuencias que son múltiplos de la frecuencia del pulso fundamental, también conocido como armónicos. La cadena de filtros selecciona y selecciona estos armónicos, potenciando algunos y atenuando otros. Las estructuras anatómicas que corresponden al generador de señal y la cadena del filtro son las cuerdas vocales y el tracto vocal, respectivamente.
Mientras hablamos, podemos variar en varios aspectos del proceso:
- La frecuencia fundamental de los pulsos.
- la amplitud de los pulsos
- La frecuencia pico de cada filtro resonante.
- La nitidez de cada filtro resonante.
La conclusión es que encontramos tanto modulación de amplitud como de frecuencia de varias “portadoras”, es decir, cada uno de los varios armónicos.
- ¿Hay una presión electrostática más allá de la cual la descomposición beta ya no puede ocurrir?
- ¿Pueden los estudiantes de inteligencia promedio convertirse en mejores programadores?
- ¿Cómo se determina la carga de un ion poliatómico?
- ¿Por qué cada compuesto puro en una mezcla tiende a tener puntos de fusión más bajos que si no estuvieran en una mezcla?
- ¿Las materias verbales o las carreras universitarias son más propensas a las ideas subjetivas y personales que a las ciencias y las matemáticas?
Esto plantea la pregunta, ¿cómo podemos decodificar las señales de voz? Ver:
https://www.ee.columbia.edu/~dpw…