Información

Códec de audio GSM / codificador de voz

Códec de audio GSM / codificador de voz

Hay una variedad de formas diferentes de códec de audio o codificador de voz disponibles para uso general, y el sistema GSM admite varios códecs de audio específicos. Estos incluyen los códecs RPE-LPC, media tasa y AMR. El rendimiento de cada códec de voz es diferente y pueden usarse en diferentes condiciones, aunque el códec AMR es ahora el más utilizado. Además, el códec de banda ancha AMR más reciente (AMR-WB) se está introduciendo en muchas áreas, incluido GSM

La tecnología de códecs de voz ha avanzado considerablemente en los últimos años como resultado de la creciente potencia de procesamiento disponible. Esto ha significado que los códecs de voz utilizados en el sistema GSM tienen grandes mejoras desde que se introdujeron los primeros teléfonos GSM.

Conceptos básicos de codificador de voz / códec

Los codificadores de voz o códecs de voz se utilizan en muchas áreas de las comunicaciones de voz. Obviamente, el enfoque aquí está en los códecs de audio GSM o codificadores de voz, pero los mismos principios se aplican a cualquier forma de códec.

Si la voz se digitalizara de forma lineal, se requeriría una alta velocidad de datos que ocuparía un ancho de banda muy amplio. Como el ancho de banda es normalmente limitado en cualquier sistema de comunicaciones, es necesario comprimir los datos para enviarlos a través del canal disponible. Una vez a través del canal, se puede expandir para regenerar el audio de una manera lo más cercana posible al original.

Para cumplir con los requisitos del sistema de códec, la voz debe capturarse con una frecuencia de muestreo y una resolución lo suficientemente altas para permitir una reproducción clara del sonido original. Luego, debe comprimirse de tal manera que se mantenga la fidelidad del audio en un canal de transmisión inalámbrico propenso a errores con una tasa de bits limitada.

Los códecs de audio o codificadores de voz pueden usar una variedad de técnicas, pero muchos códecs de audio modernos usan una técnica conocida como predicción lineal. En muchos sentidos, esto se puede comparar con un modelo matemático del tracto vocal humano. Para lograr esto, la envolvente espectral de la señal se estima utilizando una técnica de filtro. Incluso cuando se utilizan señales con muchas señales no relacionadas armónicamente, es posible que los códecs de voz proporcionen niveles muy altos de compresión.

Se utilizan diversas metodologías de códecs diferentes para los códecs GSM:

  • CELP: El códec CELP o Code Excited Linear Prediction es un algoritmo de codificador de voz que se propuso originalmente en 1985 y proporcionó una mejora significativa con respecto a otros códecs de voz del momento. El principio básico del códec CELP se ha desarrollado y utilizado como base de otros códecs de voz, incluidos ACELP, RCELP, VSELP, etc. Como tal, la metodología del códec CELP es ahora el algoritmo de codificación de voz más utilizado. Por consiguiente, CELP se utiliza ahora como un término genérico para una clase particular de codificadores de voz o códecs de voz y no para un códec en particular.

    El principio principal del códec CELP es que utiliza un principio conocido como "Análisis por síntesis". En este proceso, la codificación se realiza optimizando perceptualmente la señal decodificada en un sistema de circuito cerrado. Una forma de lograr esto es comparar una variedad de flujos de bits generados y elegir el que produzca la mejor señal de sonido.

  • Códec ACELP: El códec de predicción lineal excitado por código algebraico o ACELP. El códec ACELP o algoritmo vocoder es un desarrollo del modelo CELP. Sin embargo, los libros de códigos de códecs ACELP tienen una estructura algebraica específica como lo indica el nombre.
  • Códec VSELP: El códec VSELP o Predicción lineal de excitación de suma vectorial. Uno de los principales inconvenientes del códec VSELP es su capacidad limitada para codificar sonidos que no son del habla. Esto significa que funciona mal en presencia de ruido. Como resultado, este códec de voz no se usa ahora tan ampliamente, siendo preferidos otros códecs de voz más nuevos y ofrecen un rendimiento muy superior.

Códecs de audio GSM / codificadores de voz

Se admiten una variedad de codificadores de voz / códecs de audio GSM. Estos se han introducido en diferentes momentos y tienen diferentes niveles de rendimiento. Aunque algunos de los primeros códecs de audio no se utilizan tanto en estos días, todavía se describen aquí ya que forman parte del sistema GSM.


Códecs de audio GSM
Nombre del códecTasa de bits
(kbps)
Tecnología de compresión
Tarifa completa13RTE-LPC
EFR12.2ACELP
Media tasa5.6VSELP
AMR12.2 - 4.75ACELP
AMR-WB23.85 - 6.60ACELP

Códec GSM Full Rate / RPE-LPC

El RPE-LPC o Regular Pulse Excited - Linear Predictive Coder. Esta forma de códec de voz fue el primer códec de voz que se usó con GSM y se eligió después de realizar pruebas para compararlo con otros esquemas de códec de la época. El códec de voz se basa en el LPC de excitación de pulso regular con predicción a largo plazo. El esquema básico está relacionado con dos códecs de voz anteriores, a saber: RELP, predicción lineal excitada residual y al MPE-LPC, LPC excitado por pulsos múltiples. Las ventajas de RELP son la complejidad relativamente baja resultante del uso de la codificación de banda base, pero su rendimiento está limitado por el ruido tonal producido por el sistema. El MPE-LPC es más complejo pero ofrece un mejor nivel de rendimiento. El códec RPE-LPC proporcionó un compromiso entre los dos, equilibrando el rendimiento y la complejidad de la tecnología de la época.

A pesar del trabajo que se llevó a cabo para proporcionar un rendimiento óptimo, a medida que la tecnología se desarrollaba más, se consideraba que el códec RPE-LPC ofrecía un nivel de calidad de voz deficiente. A medida que estuvieron disponibles otros códecs de audio de velocidad completa, estos se incorporaron al sistema.

GSM EFR: códec de velocidad completa mejorado

Más tarde, se agregó otro codificador de voz llamado Enhanced Full Rate (EFR) en respuesta a la mala calidad percibida por los usuarios del códec RPE-LPC original. Este nuevo códec proporcionó una calidad de sonido mucho mejor y fue adoptado por GSM. El uso de la tecnología de compresión ACELP proporcionó una mejora significativa en la calidad con respecto al codificador LPC-RPE original. Se hizo posible cuando la potencia de procesamiento disponible aumentó en los teléfonos móviles como resultado de niveles más altos de potencia de procesamiento combinados con su menor consumo de corriente.

Códec GSM Half Rate

El estándar GSM permite la división de un solo canal de voz de velocidad completa en dos subcanales que pueden mantener llamadas separadas. Al hacer esto, los operadores de red pueden duplicar el número de llamadas de voz que puede manejar la red con muy poca inversión adicional.

Para permitir el uso de esta función, se debe utilizar un códec de tasa media. El códec de tasa media se introdujo en los primeros años de GSM, pero ofrecía una calidad de voz muy inferior en comparación con otros códecs de voz. Sin embargo, ofrecía ventajas cuando la demanda era alta y la capacidad de la red era escasa.

El códec GSM Half Rate utiliza un algoritmo de códec VSELP. Codifica los datos en tramas de 20 ms, cada una con 112 bits para dar una velocidad de datos de 5,6 kbps. Esto incluye una velocidad de datos de 100 bps para un indicador de modo que detalla si el sistema cree que las tramas contienen datos de voz o no. Esto permite que el códec de voz funcione de manera que proporcione la calidad óptima.

El sistema de códec Half Rate se introdujo en la década de 1990, pero en vista de la mala calidad percibida, no se usó ampliamente.

Códec GSM AMR

El códec AMR, Adaptive Multi-rate es ahora el códec GSM más utilizado. El códec AMR fue adoptado por 3GPP en octubre de 1988 y se utiliza para llamadas de voz GSM y UMTS / WCDMA con conmutación de circuitos.

El códec AMR ofrece una variedad de opciones para una de las ocho velocidades de bits diferentes que se describen en la tabla siguiente. Las velocidades de bits se basan en cuadros que tienen una longitud de 20 milisegundos y contienen 160 muestras. El códec AMR utiliza una variedad de técnicas diferentes para proporcionar la compresión de datos. El códec ACELP se utiliza como base del códec de voz general, pero se utilizan otras técnicas además de esto. Se emplea la transmisión discontinua de modo que cuando no hay actividad de habla se corta la transmisión. Además, la detección de actividad de voz (VAD) se utiliza para indicar cuando solo hay ruido de fondo y no hay voz. Además, para proporcionar información al usuario de que la conexión aún está presente, se utiliza un Generador de ruido de confort (CNG) para proporcionar algo de ruido de fondo, incluso cuando no se transmiten datos de voz. Esto se agrega localmente en el receptor.

El uso del códec AMR también requiere que se utilice una adaptación de enlace optimizada para que se seleccione la velocidad de datos óptima para cumplir con los requisitos de las condiciones actuales del canal de radio, incluida su capacidad y relación señal / ruido. Esto se logra reduciendo la codificación de la fuente y aumentando la codificación del canal. Aunque hay una reducción en la claridad de la voz, la conexión de red es más robusta y el enlace se mantiene sin interrupciones. Se pueden experimentar niveles de mejora de entre 4 y 6 dB. Sin embargo, los operadores de red pueden priorizar cada estación por calidad o capacidad.

El códec AMR tiene un total de ocho tasas: ocho están disponibles a tasa completa (FR), mientras que seis están disponibles a mitad de tasa (HR). Esto da un total de catorce modos diferentes.


Velocidades de datos del códec AMR
ModoTasa de bits
(kbps)
Tarifa completa (FR) /
Media tasa (HR)
AMR 12.212.2FR
AMR 10.210.2FR
AMR 7,957.95FR / HR
AMR 7.407.40FR / HR
AMR 6,706.70FR / HR
AMR 5,905.90FR / HR
AMR 5.155.15FR / HR
AMR 4,754.75FR / HR

Códec AMR-WB

El códec Adaptive Multi-Rate Wideband, AMR-WB, también conocido bajo su designación ITU de G.722.2, se basa en el conocido códec Adaptive Multi-Rate, AMR. AMR-WB también utiliza una base ACELP para su funcionamiento, pero se ha desarrollado más y AMR-WB proporciona una calidad de voz mejorada como resultado del ancho de banda de voz más amplio que codifica. AMR-WB tiene un ancho de banda que se extiende de 50 a 7000 Hz, que es significativamente más ancho que los anchos de banda de 300 a 3400 Hz utilizados por los teléfonos estándar. Sin embargo, esto tiene el costo de un procesamiento adicional, pero con los avances en la tecnología IC en los últimos años, esto es perfectamente aceptable.

El códec AMR-WB contiene una serie de áreas funcionales: incluye principalmente un conjunto de modos de códec de canal y voz de velocidad fija. También incluye otras funciones de códec que incluyen: un detector de actividad de voz (VAD); Funcionalidad de transmisión discontinua (DTX) para GSM; y funcionalidad de tasa controlada de fuente (SCR) para aplicaciones UMTS. La funcionalidad adicional incluye señalización en banda para transmisión en modo códec y adaptación de enlace para el control de la selección del modo.

El códec AMR-WB tiene una frecuencia de muestreo de 16 kHz y la codificación se realiza en bloques de 20 ms. Hay dos bandas de frecuencia que se utilizan: 50-6400 Hz y 6400-7000 Hz. Estos se codifican por separado para reducir la complejidad del códec. Esta división también sirve para enfocar la asignación de bits en el rango de frecuencia subjetivamente más importante.

La banda de frecuencia más baja utiliza un algoritmo de códec ACELP, aunque se han incluido varias características adicionales para mejorar la calidad subjetiva del audio. El análisis de predicción lineal se realiza una vez por trama de 20 ms. Además, los libros de códigos de excitación fija y adaptativa se investigan cada 5 ms para obtener valores óptimos de los parámetros del códec.

La banda de frecuencia más alta agrega algunas de las características de naturalidad y personalidad a la voz. El audio se reconstruye utilizando los parámetros de la banda inferior y utilizando excitación aleatoria. Como el nivel de potencia en esta banda es menor que el de la banda inferior, la ganancia se ajusta en relación con la banda inferior, pero en función de la información de voz. El contenido de la señal de la banda superior se reconstruye utilizando un filtro predictivo lineal que genera información a partir del filtro de banda inferior.


Códec AMR-WB
Tasa de bits
(kbps)
Notas
6.60Ésta es la tasa más baja para AMR-WB. Se utiliza para conexiones de conmutación de circuitos para GSM y UMTS y está diseñado para utilizarse sólo temporalmente durante condiciones severas del canal de radio o durante la congestión de la red.
8.85Esto brinda una calidad mejorada con respecto a la velocidad de 6.6 kbps, pero nuevamente, su uso solo se recomienda para su uso en períodos de congestión o durante condiciones severas del canal de radio.
12.65Esta es la tasa de bits principal utilizada para GSM y UMTS con conmutación de circuitos, y ofrece un rendimiento superior al códec AMR original.
14.25Se utiliza una tasa de bits más alta para ofrecer un habla más limpia y es particularmente útil cuando los niveles de ruido de audio ambiental son altos.
15.85Se utiliza una tasa de bits más alta para ofrecer un habla más limpia y es particularmente útil cuando los niveles de ruido de audio ambiental son altos.
18.25Se utiliza una tasa de bits más alta para ofrecer un habla más limpia y es particularmente útil cuando los niveles de ruido de audio ambiental son altos.
19.85Se utiliza una tasa de bits más alta para ofrecer un habla más limpia y es particularmente útil cuando los niveles de ruido de audio ambiental son altos.
23.05No sugerido para canales GSM de tarifa completa.
23.85No se sugiere para canales GSM de velocidad completa y proporciona una calidad de voz similar a la de G.722 a 64 kbps.

No todos los teléfonos equipados con AMR-WB podrán acceder a todas las velocidades de datos; por ejemplo, es posible que las diferentes funciones del teléfono no requieran que todas estén activas. Como resultado, es necesario informar a la red sobre qué tarifas están disponibles y así simplificar la negociación entre el teléfono y la red. Para lograr esto, hay tres configuraciones diferentes de AMR-WB disponibles:

  • Configuración A: 6,6, 8,85 y 12,65 kbit / s
  • Configuración B: 6.6, 8.85, 12.65 y 15.85 kbit / s
  • Configuración C: 6.6, 8.85, 12.65 y 23.85 kbit / s

Puede verse que solo se utilizan los modos 23,85, 15,85, 12,65, 8,85 y 6,60 kbit / s. Sobre la base de las pruebas de escucha, se consideró que estos cinco modos eran suficientes para un servicio de telefonía vocal de alta calidad. Las otras velocidades de datos se conservaron y se pueden utilizar para otros fines, como mensajería multimedia, transmisión de audio, etc.

Aunque se han descrito como códecs GSM, también se utilizan en otras áreas; algunos se utilizan con la voz de conmutación de circuitos empleada en UMTS. El rendimiento del códec ha mejorado desde que se introdujeron los primeros códecs GSM: se ha mejorado la calidad de la voz junto con el ancho de banda requerido.

Temas de conectividad inalámbrica y por cable:
Conceptos básicos de comunicaciones móviles2G GSM3G UMTS4G LTE5GWiFiIEEE 802.15.4DECT teléfonos inalámbricos NFC- Comunicación de campo cercano Fundamentos de red ¿Qué es la nube? Ethernet Datos en serieUSBSigFoxLoRaVoIPSDNNFVSD-WAN
Volver a la conectividad inalámbrica y por cable

Ver el vídeo: CAJA DE INYECCIÓN DIRECTA DI - Conexiones para tener una SEÑAL DIRECTA y otra del AMPLIFICADOR (Octubre 2020).