Información Técnica sobre VoIP (Voz sobre IP)
   
Foros *
* Proximamente
Codec    
 
Codec de audio G729
  Codec de audio G723
  Codec de audio alaw y ulaw
 

GSM

Codec de audio GSM
  Codec de audio ILBC
   

Codecs

 
 

La comunicación de voz es analógica, mientras que la red de datos es digital. El proceso de convertir ondas analógicas a información digital se hace con un codificador-decodificador (el CODEC). Hay muchas maneras de transformar una señal de voz analógica, todas ellas gobernadas por varios estándares. El proceso de la conversión es complejo. Es suficiente decir que la mayoría de las conversiones se basan en la modulación codificada mediante pulsos (PCM) o variaciones.

Además de la ejecución de la conversión de analógico a digital, el CODEC comprime la secuencia de datos, y proporciona la cancelación del eco. La compresión de la forma de onda representada puede permitir el ahorro del ancho de banda. Esto es especialmente interesante en los enlaces de poca capacidad y permite tener un mayor numero de conexiones de VoIP simultaneamente. Otra manera de ahorrar ancho de banda es el uso de la supresión del silencio, que es el proceso de no enviar los paquetes de la voz entre silencios en conversaciones humanas.

A continuación se muestra una tabla resumen con los códecs más utilizados actualmente:

- El Bit Rate indica la cantidad de información que se manda por segundo.
- El Sampling Rate indica la frecuencia de muestreo de la señal vocal.(cada cuanto se toma una muestra de la señal analógica)
- El Frame size indica cada cuantos milisegundos se envia un paquete con la información sonora.
- El MOS indica la calidad general del códec (valor de 1 a 5)

Para entender mejor la formación de un codec y los parametros expresados en la tabla recomendamos leer el apartado funcionamiento de un codec donde se puede aprender como funciona detallamente el codec G.711 y que significan en su caso los parametros de la tabla.

Nombre Estandarizado Descripción Bit rate (kb/s) Sampling rate (kHz) Frame size (ms) Observaciones
MOS (Mean Opinion Score)
G.711 * ITU-T Pulse code modulation (PCM) 64 8 Muestreada Tiene dos versiones u-law (US, Japan) y a-law (Europa) para muestrear la señal
4.1
G.721 ITU-T Adaptive differential pulse code modulation (ADPCM) 32 8 Muestreada Obsoleta. S e ha transformado en la G.726.
 
G.722 ITU-T 7 kHz audio-coding within 64 kbit/s 64 16 Muestreada Divide los 16 Khz en dos bandas cada una usando ADPCM
 
G.722.1 ITU-T Codificación a 24 y 32 kbit/s para sistemas sin manos con baja perdida de paquetes 24/32 16 20  
 
G.723 ITU-T Extensión de la norma G.721 a 24 y 40 kbit/s para aplicaciones en circuitos digitales. 24/40 8 Muestreada Obsoleta por G.726. Es totalmente diferente de G.723.1.
 
G.723.1 ITU-T Dual rate speech coder for multimedia communications transmitting at 5.3 and 6.3 kbit/s 5.6/6.3 8 30 Parte de H.324 video conferencing. Codifica la señal usando linear predictive analysis-by-synthesis coding. Para el codificador de high rate utiliza Multipulse Maximum Likelihood Quantization (MP-MLQ) y para el de low-rate usa Algebraic-Code-Excited Linear-Prediction (ACELP).
3.8-3.9
G.726 ITU-T 40, 32, 24, 16 kbit/s adaptive differential pulse code modulation (ADPCM) 16/24/32/40 8 Muestreada ADPCM; reemplaza a G.721 y G.723.
3.85
G.727 ITU-T 5-, 4-, 3- and 2-bit/sample embedded adaptive differential pulse code modulation (ADPCM) var.   Muestreada ADPCM. Relacionada con G.726.
 
G.728 ITU-T Coding of speech at 16 kbit/s using low-delay code excited linear prediction 16 8 2.5 CELP.
3.61
G.729 ** ITU-T Coding of speech at 8 kbit/s using conjugate-structure algebraic-code-excited linear-prediction (CS-ACELP) 8 8 10 Bajo retardo (15 ms)
3.92
GSM 06.10 ETSI Regular­Pulse Excitation Long­Term Predictor (RPE-LTP) 13 8 22.5 Usado por la tecnología celular GSM
 
LPC10 Gobierno de USA Linear-predictive codec 2.4 8 22.5 10 coeficientes.La voz suena un poco "robotica"
 
Speex     8, 16, 32 2.15-24.6 (NB)
4-44.2 (WB)
30 ( NB )
34 ( WB )
 
 
iLBC     8 13.3 30  
 
DoD CELP American Department of Defense (DoD) Gobierno de USA   4.8   30  
 
EVRC 3GPP2 Enhanced Variable Rate CODEC 9.6/4.8/1.2 8 20 Se usa en redes CDMA
 
DVI Interactive Multimedia Association (IMA) DVI4 uses an adaptive delta pulse code modulation (ADPCM) 32 Variable Muestreada  
 
L16   Uncompressed audio data samples 128 Variable Muestreada  
 


* El codec g711 tiene dos versiones conocidas como alaw (usado en Europa) y ulaw (usado en USA y Japón). U-law se corresponde con el estandar T1 usado en Estados Unidos y A-law con el estandar E1 usado en el resto del mundo. La diferencia es el método que se utiliza para muestrear la señal. La señal no se muestrea de forma lineal sino de forma logaritmica. A-law tiene un mayor rango. Para mas información de las diferencias ver G.711 Ley A vs Ley u

** existen varias versiones del codec g729 que es interesante explicar por su extendido uso
G729: es el códec original
G729A o anexo A: es una simplificación de G729 y es compatible con G729. Es menos complejo pero tiene algo menos de calidad.
G729B o anexo B: Es G729 pero con supresion de silencios y no es compatible con las anteriores.
G729AB: Es g729A con supresión de silencios y sería compatible solo con G729B.
Aparte de esto G729 (todas las versiones) en general tienen un bit rate de 8Kbps pero existen versiones de 6.4 kbps (anexo D) y 11.4 Kbps (anexo E).