Беспроводные технологии и их применение в промышленности. Особенности построения систем передачи речи. Часть 1


PDF версия

Данная статья состоит из двух частей и является продолжением публикаций (см. ЭК10, 12), посвященных вопросам передачи речевой информации через беспроводные персональные сети (WPAN). В этой статье рассмотрены пути снижения энергопотребления беспроводной системы передачи речи с использованием низкоскоростной ZiGBee- и скоростной ZigBee-подобной технологий.

Эти технологии предназначены для решения специальных прикладных задач при создании единой беспроводной транспортной среды для промышленных предприятий (стандарт backhaul ISA100.15, см. рис. 1).

 

Рис. 1. Общий беспроводной транспортный интерфейс для промышленных сетей

В части 1 даны общие рекомендации по применению речевых кодеков, проведена их классификация, а также обоснован оптимальный выбор алгоритмов кодирования речи в зависимости от предъявляемых требований к MOS (mean opinion score — качество речи) на заданной скорости кодирования и к энергопотреблению. В части 2 рассмотрены алгоритмы кодирования, рекомендуемые для использования в беспроводных сетях.

Введение

В настоящее время передача речевой информации осуществляется посредством телефонных сетей классического типа (общего пользования или PSTN), цифровых сетей (x25, ISDN, ATM, Frame Relay и др.), а также путем подключения обычных телефонов через шлюз к интернету или с помощью информационно-вычислительных сетей с выходом в интернет через Ethernet (VoIP). Последние достижения в области беспроводных высокоскоростных технологий сделало возможным передачу голоса через беспроводную сеть Ethernet (Wi-Fi Ethernet или VoWIP), не говоря уже о широко распространенных беспроводных мобильных решениях (например, сотовой связи 3G, 4G).
Современная цифровая телефония, которая постепенно приходит на смену устаревшей аналоговой, включает в себя программно-аппаратные средства преобразования аналогового речевого сигнала в цифровую форму, и наоборот. Это т.н. кодеки, с кодированием/ декодированием речевой информации, которое осуществляется в соответствии с форматом сжатия по определенным алгоритмам кодирования.
С появлением видеоконференцсвязи, представляющей собой не только передачу речи (в виде аудиопотока), но и видеоизображений, были разработаны общие рекомендации в виде протоколов Н.32х по использованию конкретных алгоритмов цифрового кодирования речи в зависимости от типа коммуникационной сети (см. табл. 1).

Таблица 1. Рекомендации H32X ITU-T или (Международный союз электросвязи, сектор телекоммуникаций)

Стандарт/характеристика

Н320

Н321

Пакетная сеть H.322

Пакетная сеть H.323

H.324 Телефонные сети общего пользования

Сеть мобильной связи H.324/C

H.310

Год рассмотрения/принятия

1990–1999

1995–1998

1995–1996

1996–1998

1996–1998

1998

1996

Последняя редакция

1.3

1.3

1.3

1.3

1.3

Сеть

Узкополосная ISDN-B

H320&ATM& ISDN-N

С гарантированной пропускной способностью (Frame-Relay, RadioEthernet)

С не гарантированной пропускной способностью (Ethernet)

Аналоговая телефонная система

Мобильная связь

Ш-ЦСИО, ATM, LAN

Аудио

G.711, G.722, G.728

G.711, G.722, G.728

G.711, G.722, G.728

G.711, G.722, G.723, G.728, G.729

G.723

G.723

MPEG-2, G.711, G.722, G.728

Данные

T.120

T.120

T.120

T.120

T.120

T.120

T.120

Коммуникационный интерфейс

I.400

AAL I.363 ATM I/361 PHY I.400

I.400 и TCP/IP

TCP/IP

Модем V.34

Мобильное радио

AAI I.363, ATM I.361, PHY I.432

Если в области телекоммуникационных сетей и сетей сотовой связи задача аналого-цифрового преобразования решена полностью, а вопросы по выбору алгоритмов кодирования определяются рекомендациями ITU-T и 3GPP, то в области персональных сетей WPAN, в частности, беспроводных сенсорных сетей (БСС), это направление остается малоизученным.
Особый интерес представляет передача речевой информации по беспроводным самоорганизующимся сетям (или ad-hoc-сетям) ограниченного радиуса действия (5–10 м) стандартов iEEE802.15.4 и IEEE802.15.4а, отличающихся оптимальным энергосбережением по сравнению с сотовой связью, с сетями Wi-Fi или Bluetooth (см. табл. 2).

Таблица 2. Сравнение стандартов семейств 802.15 и 802.11 для организации низкоскоростной передачи речевой информации

Стандарт

802.15.4 Низкоскоростная WPAN ZigBee

ECMA 368[802.15.3a Высокоскоростная WPAN, WiMedia (MB UWB OFDM)

802.15.4a* Высокоскоростная WPAN DS-UWB

80.2.15.а Среднескоростная WPAN UWB- Chirp Spread Spectrum (CSS)

802.11b WLAN Wi-Fi

Приложения

Мониторинг, управление, сети датчиков, домашняя/промышленная автоматика

Потоковое мультимедиа, замена кабелей аудио/видеосистем

Данные, голос, видео, LAN

Преимущества

Цена, энергосбережение, размеры сети, выбор частотных диапазонов, DSSS и PSSS

Высокая скорость, энергосбережение

Большой диапазон по скорости, DSSS

Частота

868 МГц

915 МГц

2,4 ГГц

3,1–10,6 ГГц

3,1–10,6 ГГц

2,4 ГГц; 3,1–10,6 ГГц; 3,1–5,1 ГГц Россия

2,4 ГГц

Макс. скорость (Vпередачи)

20 Кбит/с

40 Кбит/с

250 Кбит/с

53,3; 80; 106,7 Мбит/с Доп.: 160, 200, 320, 400, 489 Мбит/с

110 Мбит/с (10 м), 200 Мбит/с (4 м) (доп. 480 Мбит/с)

250 Кбит/с, 1 Мбит/с (chirped с линейной частотной модуляцией); 2,5 Мбит/с (СШП прямо-хаотическая)

1 Мбит/с
2 Мбит/с
11 Мбит/с

Выходная мощность, ном. (Pвых.)

От 0 дБм (1 мВт)

0 дБм

<100 мВт (110 Мбит/с) <250 мВт (200 Мбит/с)

<100 мкВт (–10 дБм) (СШП прямо-хаотическая)

20 дБм (100 мВт)

Дальность

1–10 м (укороченный радиус действия) 10–100 м (ограниченный радиус действия)

5–50 м

10 м (110 Мбит/с)
4 м (200 Мбит/с)
2 м (480 Мбит/с)

1-10м (chirped с линейной частотной модуляцией); 5–7м 40–60м (СШП прямо-хаотическая)

10 м –100м

Чувствительность (спецификация)

–92 дБм

–85 дБм

–75 дБм

–76 дБм

Размер стека

4–32 Кбайт

Больше 1 Мбайт

Срок службы батареи (энергосбережение)

100–1000+ дней

Нет статистики, теоретически – более 1000 дней

0,5–5 дней

Размер сети

65536 (16-битные адреса),
264 (64-битные адреса)

До 127/хост

32

Это т.н. ZigBee- и ZigBee-подобные технологии (включая ZigBee промышленного назначения, см. рис. 1). Наряду с низкоскоростными ZigBee-технологиями разных модификаций (например, SNAP), разработанных на базе стандарта IEEE 802.15.4, в России были исследованы и нашли свое применение в разработках БСС скоростные сверхширокополосные (СШП) ZigBee-подобные технологии на базе IEEE802.15.4а, где технология Ultra Wide Band (UWB) представлена на физическом уровне СШП прямо-хаотическими импульсами или импульсами с линейной частотной модуляцией (chirps) [1, 2].
Необходимость применения БСС (с использованием ZigBee- и ZigBee-подобных технологий) в качестве беспроводной транспортной среды для передачи речи взамен широко распространенной беспроводной сотовой связи или постепенно набирающей обороты связи VoWi-Fi Ethernet на рынке беспроводной телефонии возникает лишь в особых случаях, т.е. в отсутствие какой-либо альтернативы, когда имеется необходимость выполнить определенные или специальные требования, например:
1) организовать дешевую беспроводную голосовую связь на ограниченной территории с небольшим покрытием, скажем, на территории промышленного предприятия или внутри здания;
2) установить в офисе систему тайной передачи речевой информации;
3) организовать голосовую связь с помощью маломощных радиопередатчиков — трансляторов с низким энергопотреблением.
Одним из важнейших преимуществ БСС является их мобильность, т.е. способность узлов беспроводной системы работать от батарей, срок службы которых намного выше по сравнению с Wi-Fi или беспроводной сотовой связью за счет использования приемо-передатчиков и микроконтроллеров с ультранизким энергопотреблением, а также за счет специальных программных приложений по энергосбереже-нию, позволяющих оптимально управлять мощностью радиопередатчиков EIRP (equivalent isotropically radiated power) в зависимости от расстояния и использовать режим сна (sleeping mode) для узлов беспроводной сети в моменты их неактивности.
Следовательно, при проектировании БСС с использованием ZigBee- и ZigBee-подобных технологий в качестве транспортной среды для передачи речевой информации первостепенной задачей является, прежде всего, экономичный выбор программно-аппаратных средств кодирования речевой информации, а именно, аппаратного кодера/декодера (АЦП/ЦАП в сочетании с блоком программирования по выбору режимов кодирования/декодирования речи) и микроконтроллера (в ряде случаев — отдельного микропроцессора в виде дополнения к существующему микроконтроллеру), энергопотребление
(Рпотр./MГц = Vпит∙I) и производительность (МIPS/MГц — скорость исполнения набора инструкций за 1 с на 1 МГц) которых зависит от тактовой частоты fc.
С одной стороны, для обеспечения предельно низких показателей по электропитанию целесообразно использовать микроконтроллеры с меньшей тактовой частотой, а, с другой стороны, такой подход приводит к выбору контроллера с меньшей производительностью. При этом не стоит забывать, что порядок MIPS микроконтроллера должен определяться степенью сложности вычислительных функций, заложенных в алгоритме по обработке речевого сигнала кодека, от параметров которого в конечном итоге зависит качество восстановленной речи при передаче по беспроводной сети.
В настоящее время существует множество программно-аппаратных средств преобразования речевого сигнала в цифровую форму с использованием разнообразных алгоритмов кодирования, которые призваны, в первую очередь, обеспечить хорошее качество MOS при заданной скорости кодирования.
Чтобы найти рациональное зерно и не запутаться во всем многообразии существующих средств преобразования речевого сигнала в цифровую форму, а также обосновать выбор наиболее подходящих алгоритмов кодирования речи для БСС с использованием низкоскоростных ZigBee- и скоростных ZigBee-подобных технологий, все речевые кодеки следует классифицировать по определенным критериям.

Классификация речевых кодеков и их основные параметры

Основными параметрами речевого кодека являются: скорость кодирования (Vкодир.), качество восстановления речи (MOS) и удерживаемая вероятность ошибки на символ (Рош.).
Если Vкодир. и Рош. не нуждаются в дополнительных комментариях, то для MOS эти разъяснения необходимы.
MOS — это главный показатель кодека, который характеризует качество восстановленной на приемном конце речевой информации, которая измеряется по 5-балльной шкале в результате субъективной оценки человеком.
Для сравнительного анализа кодеков в последнее время применяют соотношение MOS/Vкодир., которое, в свою очередь, является показателем степени качества разных алгоритмов кодирования на заданной скорости. Vкодир. речевой информации — это, как правило, диапазон 2–64 Кбит/с.
Согласно теореме Грея-Бергера, при минимальной среднеквадратичной ошибке (Pош.) можно получить Vкодир. << 2 Кбит/с (теоретически такой предел может составлять ~100 бит/с) [3]. Но для современных высокоскоростных сетей передачи информации (включая даже низкоскоростные БСС) нет необходимости добиваться таких показателей.
Для беспроводных сетей при выборе речевого кодека помимо соотношения MOS/Vкодир. на заданной скорости необходимо установить степень сложности алгоритма кодирования, которая в конечном итоге определяет производительность микроконтроллера в MIPS, а, следовательно, и энергопотребление (см. табл. 3).

Таблица 3. Классификация речевых кодеков и их основные параметры

Формат сжатия и алгоритм кодирования

MOS (оценка качества речи)

MIPS кодирование + декодирование (на примере DSP (TI), ARM9–11 и Cortex3)

Узкополосные речевые кодеки

G.711 (PCM; 64 Кбит/c), частота дискретизации – 8 кГц
низкоэффективный алгоритм
метод сэмпла, 13 бит/сэмпл, 8 бит/отсчет, VAD-приложение 1, CNG-приложение 2

4,1–4,75

0,2 DSP; 7,1 (ARM) + 3 MIPS (VAD)

G.726 (ADPCM; 16/24/32/40 Кбит/c), G721 (32 Кбит/с), частота дискретизации – 8 кГц
эффективный алгоритм
метод сэмпла, 13 бит/сэмпл, 5, 4, 3, 2/отсчет

3,8–4,3

8,7 (32 Кбит/с)
8,8 (40 Кбит/с)

G.728 (LD-CELP; 16 Кбит/c) частота дискретизации – 8 кГц эффективный алгоритм
13 бит/сэмпл, метод кадра

3,6

40 (24 + 16) DSP

G.729 (CS-ACELP; 8 Кбит/c) частота дискретизации – 8 кГц
DTX-приложение B

3,6–4,04

10,3 (8,3 + 2,0) DSP 40,3 (30,8 + 9,5) ARM9 45,2 (35,6 + 9,5) CortexM3

G729D 6,4 Кбит/с; 8 Кбит/c
высокоэффективный алгоритм
13 бит/сэмпл, метод кадра, DTX-приложение F

3,6–4,2

17,1 (6,4 Кбит/с) DSP

G.723.1 (MP-MLQ; 6,3 Кбит/c) частота дискретизации – 8 кГц
высокоэффективный алгоритм
13 бит/сэмпл, метод кадра

3,9–4,08

11 + 2 (DSP) 26 + 2

G.723.1 (ACELP; 5,3 Кбит/c) частота дискретизации – 8 кГц
высокоэффективный алгоритм
13 бит/сэмпл, метод кадра

3,7

18 + 2

Широкополосные речевые кодеки

G.722 (sub-band ADPCM; 64 Кбит/c) 48/56/64 с возможностью передачи данных на 48/56 Кбит/с; частота дискретизации – 16 кГц
эффективный алгоритм
метод сэмпла или кадра, число бит в отсчете 6, 5, 4 (нижняя полоса), 2 (верхняя полоса), 14 бит/сэмпл

4,5 3,75/3,75/4, 5

5,2 (2,84 + 2,36) DSP 25,5 (ARM9) 41,4 (ARM11)

G.722.1 (Modulated Lapped Transform; 24/32 Кбит/c) на базе Siren частота дискретизации – 16 кГц
эффективный алгоритм
метод кадра, 16 бит/сэмпл, (VoIP)

4/3,9

12,83 (5,76 + 7,07) DSP 57 (28,9 + 28,1) CortexM3 32 Кбит/с

G.722.1 C (Modulated Lapped Transform; 24/32/48 Кбит/c) на базе Siren частота дискретизации – 16 кГц
эффективный алгоритм
метод кадра, 16 бит/сэмпл (VoIP). Нет рекомендаций ITU-T по применению VAD/DTX/CNG

< 3,9 (48 Кбит/с)

13,55 (5,91 + 7,64) DSP 48 Кбит/с

G.722.2 AMR-WB (multirate ACELP; 6,60–23,85 Кбит/c) для 3GPP или GSM-AMR-WB частота дискретизации – 16 кГц
высокоэффективный алгоритм
метод кадра, 14 бит/сэмпл, VAD/DTX/CNG, 3GWireless + VoIP

4,5 (23, 85 Кбит/с) 4,25 (12, 65 Кбит/с)

30 (24 + 6) DSP

Универсальные речевые кодеки

G.711.1 (MCDT, aLaw mLaw; 64/80/96 Кбит/c) частота дискретизации – 8/16 кГц
низкоэффективный алгоритм
метод сэмпла 16 бит/сэмпл

4,5

0,2; 7,1 (ARM)

G.729.1 (CELP, TDBWE,TDAC; 8–32 Кбит/c) 12уровней c шагом 2 Кбит/с по скорости за исключением 10 Кбит/с) частота дискретизации – 8/16 кГц
высокоэффективный алгоритм
16 бит/сэмпл метод кадра

3,6–4,04

13,2

Speex (CELP, 2–44 Кбит/c) частота дискретизации – 8/16/32/48 кГц
высокоэффективный алгоритм
метод кадра

3,84

40 DSP

IMA DVI4(ADPCM) частота дискретизации 8; 16 кГц. Упрощение G726

3,5

4

Речевые кодеки можно классифицировать по полосе частот (узкополосные, широкополосные); по алгоритму кодирования речевого сигнала (низкоэффективные, эффективные, высокоэффективные, вокодерные); по методу кодирования (сэмплирование и кадр) (см. табл. 3).
В основном все речевые кодеки, рекомендуемые для использования в телекоммуникационных сетях, можно подразделить на четыре основные группы:
– узкополосные с форматами сжатия G711, G723, G726 (G721), G728, G729 по рекомендации ITU;
– GSM-кодеки по рекомендации рабочей группы 3GPP c форматами сжатия AMR, AMR-WB, AMR-WB+, а также GSM-FR (ETSI). Для БСС, c нашей точки зрения, представляют интерес форматы сжатия AMR (Adaptive Multi-Rate) и AMR-WB (Adaptive Multi-Rate Wideband);
– широкополосные кодеки c форматами сжатия G711, G722, G722.1 по рекомендации ITU. К ним можно также соотнести GSM AMR-WB G722.2 (алгоритм кодирования ACELP), Speex (алгоритм кодирования CELP), SILK;
– кодеки определенного назначения: iLBC (с низкой скоростью кодирования для интернета), LPC-10, SILK (с переменной скоростью кодирования) и др.
В последнее время наибольшее предпочтение отдается широкополосным кодекам. Принцип их действия основан на различной чувствительности слуха к звукам, принадлежащим разным частотным полосам. Это позволяет кодировать сигналы в полосах с разной точностью. Количество полос может колебаться в пределах 2–16. Такие кодеки обладают рядом преимуществ. Одним из них является качество слоговой разборчивости, или количество правильно принятых слогов речи, которое является одним из основных показателей MOS [4].
Если полоса частот 1,25–4 кГц отвечает за разборчивость речи (слоговую и фразовую), то 5–8 кГц — это диапазон акцентирования. В целом получается, что полоса порядка 1,25–8 кГц позволяет получить высокую четкость и хорошую разборчивость речи.
Все кодеки по алгоритму кодирования (который в конечном итоге определяет степень сжатия речевой информации) можно классифицировать следующим образом:
– низкоэффективные, т.е. с низким коэффициентом сжатия и скоростью кодирования Vкодир. ≥ 32 Кбит/c. Это кодеки с алгоритмами ИКМ (РСМ) и дельта-модуляции (ДМ);
– эффективные, т.е. со средним коэффициентом сжатия и Vкодир. = = 8–32 Кбит/с. Это кодеки c ДИКМ (дифференциальной ИКМ) или ADPCM. Их основными признаками является наличие блоков линейного предсказания (состоящих из двух узлов: долговременного и кратковременного предсказателей), а также использование многоуровневого квантования (2–64);
– высокоэффективные, т.е. с высоким коэффициентом сжатия и Vкодир. = = 2–8 Кбит/с. Это кодеки с алгоритмом кодирования CELP (Code Exited Linear Prediction), у которого имеются разновидности SELP, LD-CELP, V-CELP A-CELP, MP-CELP, CS-CELP. Их появление связано с совершенствованием кодера формы для обеспечения высоких показателей качества MOS на меньших скоростях;
– высокоэффективные вокодеры с высокой степенью сжатия и с
Vкодир. < 2 Кбит/с представляют собой отдельную группу кодеков, в основе которых лежат алгоритмы анализа параметров речевого сигнала с последующим синтезом на приемном конце. В таких случаях воспроизводимая речь отличается от обыкновенной, поскольку в процессе ее синтеза она искажает­ся из-за погрешностей в математических расчетах. Следовательно, применение вокодеров в БСС c MOS < 3,5 не представляет какого-либо практического интереса.
В отличие от вокодеров (синтеза через анализ), речевые кодеки формы с показателями качества речи
MOS (3,5–4,5), использующие такие алгоритмы кодирования как ИКМ (PCM), ДМ (DM), АДИКМ (ADPCM), CELP, уже нашли применение в скоростных беспроводных Wi-Fi-сетях для организации передачи голоса (VoWIP по протоколам RTP/UDP/IP) [4]. Следовательно, для обоснования применения тех или иных алгоритмов кодирования с целью передачи речи по БССС им следовало бы также уделить особое внимание.
Немаловажной характеристикой кодеков, входящих в состав узлов беспроводной сети для передачи речевой информации, является их помехоустойчивость, которую можно представить в виде соотношения:

SNR = f(Pош.),

где SNR — отношение сигнал/шум; Рош. — вероятность ошибки на символ, или BER (Bit Error Rate).
Выражение SNR через BER является косвенной характеристикой радиоканала. Хорошо известно, что чем меньше SNR, тем больше побитовых ошибок к количеству переданных битов информации (пакету) Pош. (BER) [6]. С другой стороны, чем больше Рош., тем меньше Vпередачи за счет увеличения количества повторно переданных пакетов.
Как видно из рисунка 2, ИКМ (PCM) (низкоэффективные кодеки) имеют наихудшие показатели помехоустойчивости. Эти кодеки могут потерять работоспособность при Pош. = 10-5, тогда как эффективные кодеки CELP помехоустойчивы при Pош. = 10-5 и становятся чувствительными к помехам лишь при Pош. = 10-3. Для повышения SNR вводятся специальные меры, например, гарантия пропускной способности по радиоканалу (для PCM Vкодир. должна быть не менее 64 Кбит/с) или за счет высокой избыточности (что приводит к ужесточению требований к алгоритму кодирования). Проблема создания помехоустойчивых кодеков — это, по сути, задача согласования преобразованного в цифровую форму речевого сигнала с каналом радиосвязи. Считается, что система передачи аналогового сигнала по цифровому радиоканалу является оптимальной, когда кодек источника обеспечивает максимальную степень сжатия без потерь в качестве (MOS), а цифровой радиоканал — максимальную Vпередачи при заданной вероятности ошибки Рош. В таком случае уменьшение избыточности речевой информации осуществляется эффективным кодеком, а уменьшение Рош. (BER) — кодером радиоканала.

 

Рис. 2. Помехоустойчивость кодеков с разными алгоритмами кодирования

Снижение энергопотребления узлов БСС

Как уже было сказано, основным вопросом по оптимизации параметров беспроводной системы передачи речевой информации с использованием ZigBee- и ZigBee-подобных технологий является снижение энергопотребления за счет узлов беспроводной сети, в т.ч. за счет оптимального выбора речевого кодека.

Выбор микроконтроллера и MOS речи кодека

Практически для всех речевых кодеков (за исключением низкоэффективных кодеков с Vкодир. > 32 Кбит/с) для получения наилучшего соотношения MOS/Vкодир. на заданной скорости (см. рис. 3) разработчикам поневоле приходится усложнять алгоритмы кодирования речи. Такие алгоритмы (наряду с произвольной совокупностью простых логических и арифметических функций) представляют собой набор сложных вычислений (операций с фиксированной и плавающей точками; операций над таблицами и с логарифмическими функциями).

 

Рис. 3. Зависимость MOS от Vкодир

Для выполнения указанных задач, как правило, необходимы высокопроизводительные микроконтроллеры со встроенным ARM-ядром процессора типа ARM Cortex M3, ARM7 (fc = 36–55 МГц), ARM9 (60–200 МГц), ARM11 (200–400 МГц), причем два последних имеют встроенные инструкции DSP. В настоящее время для решения такого рода задач по обработке речевого сигнала также используются специализированные DSP-процессоры, которые могут выполнять аналогичные инструкции c меньшей производительностью в MIPS по сравнению с ARM и Cortex3. Это DSP фирм Texas Instruments, Freescale Semiconductor, Analog Devices, Phillips Semiconductor, Toshiba, DSp-Group, Intersil и др. (см. табл. 3).
Использование речевых кодеков с Vкодир. < 32 Кбит/с и с высоким качеством речи MOS для узлов БСС автоматически означает выбор сложного алгоритма кодирования и, соответственно, высокопроизводительного микроконтроллера с повышенным энергопотреблением. А применение низкоэффективного кодирования (Vкодир. > 32 Кбит/с), обеспечивающего наивысшее качество речи MOS при относительно простом вычислительном механизме сжатия (1:2 на примере PCM), позволяет выбрать контроллер с низкой производительностью и малым энергопотреблением. Однако при этом необходимо, чтобы скорость передачи по сети (Vпередачи) была не менее 64 Кбит/с, иначе качество восстановления MOS оставит желать лучшего (см. рис. 3). Следовательно, для низкоэффективных кодеков по беспроводной сети, в частности БСС, должна быть гарантирована полоса пропускания по каждому радиоканалу, либо беспроводная транспортная среда должна быть скоростной (Vпередачи ≥ ≥ 1 Мбит/с).
Исходя из таблицы 4, наилучшим соотношением Vпередачи/Pвых. радиопередатчиков среди БСС (WPAN) с укороченным радиусом действия (Рвых. передатчиков ≤ 1 мВт) являются скоростные СШП ZigBee-подобные технические решения.
В части программно-аппаратной реализации ZigBее- и ZigBee-подобных протоколов, а также МАС-протоколов стандартов IEEE 802.15.4 (802.15.4.a), как правило, используются совместные схемотехнические решения «микроконтроллер + радиопередатчики». Алгоритмы этих протоколов представляют собой программные продукты, входящие в состав библиотек специальных программ для микроконтроллеров, по которым и осуществляется управление беспроводной сенсорной сетью. Имеются также отдельные аппаратные решения к контроллеру, например: реализация МАС-протоколов в виде PLM (программируемой логической матрицы), а также радиопередатчиков (например, Chipcon CC2420, Ember 2420, Motorola 13193 и др.). Показательным примером в части использования PLM для аппаратной реализации MAC-протокола в беспроводном узле является российская разработка СШП сенсорной сети ППС40-ППС50 [3]. Несмотря на то что все схемотехнические решения БСС с использованием низкоскоростных ZigBee- и скоростных ZigBee-подобных технологий могут быть самими разнообразными, все они имеют единую структуру (см. рис. 4), позволяющую решить главную цель — достичь минимального энергопотребления не только за счет оптимальной мощности потребления радиопередатчиков (Рвых. передатчиков, см. табл. 4), но и благодаря применению среднепроизводительных (20–32 MIPS) микроконтроллеров (в основном, 8-разрядных), например, ATMega (128L, 168L) фирмы Аtmel; MSP430 Texas Instruments; PIC-микроконтроллеров Microchip, Ember 2420 (XAP2b) фирмы Ember и др.

Таблица 4. Основные параметры радиоканалов

ZigBee (WPAN)

Bluetooth (WPAN)

ZigBee-подобные с ультранизким энергопотреблением (WPAN)

IEEE802.15.4
250 Кбит/с
Рвых. = 1 мВт

IEEE 802.15.1 версия 1.2
1 Мбит/с
Рвых =1 мВт

IEEE 802.15.4a Chirps
0,1–2,5 Мбит/с
Рвых. = 0,01–0,1 мВт

Удаленное управление и мониторинг

Telecom Audio, Small file Xfer

Аудио, удаленное управление и мониторинг (разрабатывается в России)

Ad-Hoc: точка-точка, точка-многоточка, mesh-сеть

Ad Hoc точка-точка, точка-многоточка, piconet, scatternet

Ad Hoc точка-точка, точка-многоточка, mesh-сеть

Возможно управление мощностью ERP Tx-передатчика

Управление ERP Тх-передатчика реализовано для классов 1, 2 (4…20 дБм). Не реализовано (–30…1 дБм)

Возможно управление мощностью ERP Тх (–27…–16 дБм )

Таким образом, при передаче речи по БСС наряду с оптимальным выбором параметров узлов беспроводной транспортной среды необходимо одновременно решать вопрос об энергопотреблении речевого кодека (аппаратного кодера/декодера (12-16-разрядного) и производительного микроконтроллера (16–32-разрядного) под программное обеспечение алгоритма), т.е. искать компромисс между MOS/Vкодир. на заданной скорости и степенью сложности алгоритма кодирования. Все эти требования в своей совокупности определяют окончательный выбор микроконтроллера по производительности (в MIPS или WMOS), а, следовательно, общее энергопотребление узла беспроводной сети. Таким образом, при выборе кодека речи для узла БСС необходимо учитывать следующее.
– Если поставлена цель добиться минимального энергопотребления системы, но требования к MOS высоки, целесообразно использовать низкоэффективные кодеки или схожие с ними эффективные кодеки. В данном случае производительность микроконтроллера, а, следовательно, и его энергопотребление сводится к минимуму (см. табл. 3). С целью миниатюризации системы («контроллер + радиопередатчик + кодек») и минимального энергопотребления предпочтительно использовать СнК. Наглядным примером может быть ZIC2410/ZigBee фирмы CaliforniaLab (алгоритм кодирования РСМ/АDPCM, элементная база — СнК, микроконтроллер, совместимый с 8051, кодек и радиопередатчики c низким энергопотреблением). Однако не следует забывать, что при использовании низкоэффективных кодеков беспроводная сеть должна обеспечивать гарантированную пропускную способность либо быть скоростной. Поэтому в случае с Сalifornia Lab Vпередачи была увеличена до 1 Мбит/с.
– Если накладываются жесткие ограничения по энергопотреблению системы, но требования к MOS занижены по сравнению с нормой (MOS << 4,3, что является эталоном для телефонии), то используются эффективные кодеки с упрощенным алгоритмом кодирования. По этому пути пошла организации IMA (Interactive Multimedia Association), упростив стандарт G726 (ADPCM) за счет меньшего числа предсказателей для алгоритма кодирования (формат сжатия DVI4). Это позволило использовать менее производительные контроллеры (например, PIC-микроконтроллеры, начиная с PIC12 компании Microchip) [7]. В случае эффективных кодеков, менее чувствительных к скорости, возникает возможность их использования в сети с негарантированной пропускной способностью (см. рис. 3).
– Если требования к MOS высокие, а БСС представляет собой сеть с негарантированной пропускной способностью, то предпочтительнее использовать эффективные кодеки (см. рис. 3). Это значит, что следует искать компромисс между MOS/Vкодир. на заданной скорости и степенью сложности алгоритма кодирования (см. табл. 3). По оптимальному пути применения эффективных речевых кодеков пошла компания Jennic (алгоритм кодирования ADPCM, частота дискретизации 8/16 кГц, 32-разрядный (32 MIPS) RISC-микроконтроллер JN5139 + радиопередатчики, низкое энергопотребление (34 мА × 3,6 В), Рвых. радиопередатчика: +3 дБм; Vкодир./Fдискр.: 24 Кбит/с/6 кГц; 32 Кбит/с/8 кГц; 64 Кбит/с/16 кГц).

Выводы

Беспроводные системы связи с использованием низкоскоростных ZigBee- и скоростных UWB (ZigBee-подобных) технологий, которым в соответствии с промышленным стандартом ISA 100.15 отведена вполне определенная роль для решения специальных задач, можно рассматривать как беспроводную транспортную среду для передачи речевой информации на малых расстояниях. Их неоспоримое преимущество по сравнению с мобильными беспроводными системами сотовой связи, Wi-Fi или Bluetooth — небольшая мощность излучения Рвых., а также малое энергопотребление. Таким образом, при использовании средств преобразования речевого сигнала для передачи речи посредством БСС необходимо, прежде всего, оптимизировать их энергопотребление, исходя из требований к качеству речи MOS/Vкодир. на заданной скорости с учетом степени сложности алгоритма.

Литература
1. А.С. Дмитриев, Е.В. Ефремова и др. Сверхширокополосная беспроводная связь и сенсорные сети. Радиотехника и электроника. 2008. Т. 53 №10. С. 1278–1289.
2. Г.Ф. Гайкович. Беспроводные технологии и их применение в промышленности. Передача речевой информации через WPAN. Электронные компоненты. №12. С. 57. 2010.
3. М.Ф. Бондаренко, А.В. Работягов, С.В. Щепковский. Современные методы кодирования речевого сигнала. Бионика интеллекта. 2 (69). С. 106–114. 2008.
4. ГОСТ Р 51061-97. Системы низкоскоростной передачи речи по цифровым каналам//www.polyset.ru/GOST/all-doc/GOST/GOST-R-51061-97.
5. D-Link. Introduction to Voice over Wireless WLAN (VoWLAN).
6. Г.Ф. Гайкович. Беспроводные технологии и их применение промышленности. Сосуществование разных радиосистем. Электронные компоненты. №10. С. 21. 2010.
7. А. Сафонов. Использование микроконтроллеров Microchip в задачах вопросах воспроизведения звука. Компоненты и технологии. №2. С. 28–30. 2004.
8. 6LoWPAN IPv6 over Low power WPAN (6lowpan) http://www.ietf.org/download/id-abstract.txt
9. В.Е. Дементьев, Д.А. Капустин. Разработка и исследование протоколов повышенной надежности передачи данных в сетях ZigBee. Передача голоса в сетях ZigBee//www.confpubs.ru/nfs_2010.php?id=32.
10. Analysis of Audio Streaming Capability of ZigBee Networks 2 Publications|HiPEAC.
11. RTP Profile for Audio and Video Conferences with Minimal Control//http://tools.ietf.org/html/rfc1890.

Оставьте отзыв

Ваш емейл адрес не будет опубликован. Обязательные поля отмечены *