IP-телефония — это технология передачи голоса через интернет. В отличие от классических телефонных сетей (PSTN), где сигнал идет по медным проводам, здесь голос оцифровывается, разбивается на пакеты и передается через IP-сети. В статье расскажем про IP-телефонию: как работает для «чайников».
IP-телефония: объясняем принцип работы для «чайников»
IP-телефония превращает живой голос в цифровой поток, который преодолевает тысячи километров за доли секунды. В основе — многоступенчатая обработка сигнала, где каждый этап гарантирует четкость связи даже при нестабильном интернете.
Разберем, как это происходит:
- Оцифровка голоса. Голосовой сигнал преобразуется в цифровые данные с помощью аудиокодеков (например, G.711 для высококачественного звука или G.729 для сжатия с минимальной потерей качества).
- Разбиение на пакеты. Цифровые данные делятся на небольшие пакеты размером 20-30 мс. Каждый пакет содержит метку времени и порядковый номер для синхронизации на стороне получателя.
- Маршрутизация. Пакеты отправляются через интернет по оптимальному пути, который выбирается динамически. Это позволяет избегать перегруженных узлов сети.
- Сборка и декодирование. На устройстве адресата пакеты собираются в правильной последовательности, декодируются и преобразуются обратно в аналоговый сигнал.
Пример. Когда вы звоните через WhatsApp, ваш голос кодируется в пакеты, которые передаются через интернет. Даже при скорости 100 Кбит/с задержка не превышает 150 мс — это в 3 раза быстрее, чем моргает человеческий глаз. Технология RTP (Real-Time Transport Protocol) синхронизирует аудиопоток, а сквозное шифрование защищает разговор от перехвата.
Такая архитектура делает IP-телефонию не только быстрой, но и устойчивой к помехам: если часть пакетов теряется, алгоритмы восстанавливают пропуски или маскируют их, сохраняя разборчивость речи.
Чем IP-телефония отличается от традиционной
Критерий |
IP-телефония |
Традиционная телефония (PSTN) |
Среда передачи |
Интернет (IP-пакеты) |
Медные линии, аналоговые сигналы |
Стоимость |
Ниже (нет платы за междугородные звонки) |
Выше (тарификация по минутам) |
Масштабируемость |
Легко добавить новые линии |
Требует физического подключения |
Дополнительные функции |
Видеозвонки, чаты, интеграция с CRM |
Только голос |
Уровни организации соединения в IP-телефонии
Для передачи голоса используются уровни сетевой модели OSI. Вот как это работает:
- Физический уровень (Physical Layer)
Обеспечивает передачу битов через физические носители: кабели (Ethernet, оптоволокно), Wi-Fi, 4G/5G.
Пример: IP-телефон подключается к роутеру через Ethernet-кабель.
- Канальный уровень (Data Link Layer)
Отвечает за передачу данных между соседними узлами сети. Использует MAC-адреса и протоколы (например, Ethernet, PPP).
Пример: Коммутатор в локальной сети направляет пакеты от IP-телефона к маршрутизатору.
- Сетевой уровень (Network Layer)
Маршрутизирует пакеты через интернет с использованием IP-адресов. Основной протокол — IP (IPv4/IPv6).
Пример: Маршрутизатор определяет оптимальный путь для пакетов до сервера оператора.
- Транспортный уровень (Transport Layer)
Управляет доставкой данных. В IP-телефонии чаще используется UDP и RTP вместо TCP:
- UDP: Быстрая передача без подтверждения доставки (меньше задержек).
- RTP (Real-Time Protocol): Добавляет временные метки и порядковые номера пакетов для синхронизации аудио.
Пример: Голосовые пакеты передаются по RTP поверх UDP, чтобы минимизировать задержку.
- Уровни данных (Data Layers)
Включают прикладные протоколы для установки и управления звонками:
- SIP (Session Initiation Protocol): Стандарт для инициирования, изменения и завершения сеансов связи.
- 323: Устаревший протокол для мультимедийной связи, чаще используется в корпоративных решениях.
Пример: При звонке через WhatsApp SIP-сообщения согласуют параметры вызова, а RTP передает аудио.
Протоколы IP-телефонии: H.323 и SIP
IP-телефония опирается на стандарты, которые управляют установкой, поддержкой и завершением сеансов связи. Два ключевых протокола — H.323 и SIP — решают эти задачи, но делают это по-разному.
H.323: комплексный стандарт для корпоративных сетей
Разработанный в 1996 году протокол H.323 (рекомендация ITU-T) изначально создавался для мультимедийной связи в локальных сетях. Его архитектура включает четыре компонента:
- Терминал (H.323 Terminal)
Устройство конечного пользователя: IP-телефон, видеоконференц-система или софтфон (например, приложение Avaya). Поддерживает аудио/видеокодеки и передачу данных. - Шлюз (Gateway)
Обеспечивает совместимость между IP-сетями и традиционными телефонными линиями (PSTN). Конвертирует сигналы и форматы данных.
Пример: Шлюз Cisco CUBE соединяет офисную IP-АТС с городской телефонной сетью. - Контроллер зоны (Gatekeeper)
Управляет вызовами в пределах «зоны» (группы терминалов): маршрутизация, аутентификация, контроль пропускной способности. - Сервер многосторонней конференции (MCU)
Организует групповые звонки, смешивая аудио- и видеопотоки.
Где применяется: В закрытых корпоративных сетях, системах видеоконференцсвязи..
SIP: гибкий протокол для интернета
Session Initiation Protocol (SIP, RFC 3261) — это легковесный текстовый протокол, похожий на HTTP. В отличие от H.323, он не привязан к конкретным типам данных и легко интегрируется с веб-сервисами.
Как работает SIP:
- Использует методы INVITE (начало вызова), ACK (подтверждение), BYE (завершение сеанса).
- Для передачи голоса применяет RTP (Real-Time Transport Protocol), для настройки параметров — SDP (Session Description Protocol).
- Поддерживает сквозное шифрование (SRTP, ZRTP).
Пример использования:
При звонке через Microsoft Teams:
- SIP-запрос INVITE отправляется на сервер с деталями сеанса (кодеки, IP-адрес).
- Устройство получателя подтверждает вызов (200 OK).
- Аудиопоток передается через RTP.
Преимущества SIP:
- Совместим с облачными сервисами (например, Google Meet).
- Позволяет переносить номера между операторами (SIP Trunking).
- Поддерживает интеграцию с CRM через API.
Сравнение H.323 и SIP
Критерий |
H.323 |
SIP |
Архитектура |
Монолитная, сложная |
Модульная, простая |
Формат сообщений |
Бинарный (ASN.1) |
Текстовый (HTTP-like) |
Масштабируемость |
Ограничена зонами |
Высокая (облачные решения) |
Безопасность |
Редко поддерживает шифрование |
Шифрование на уровне SIP и RTP |
Кодеки IP-телефонии: как звук становится цифрой
Кодеки (кодеры-декодеры) — это алгоритмы, которые сжимают голосовой сигнал для передачи через интернет и восстанавливают его на стороне получателя. От выбора кодека зависят качество звука, задержка и расход трафика. Разберем популярные варианты.
- G.711 (PCM)
- Битрейт: 64 Кбит/с.
- Особенности:
- Использует импульсно-кодовую модуляцию (ИКМ) без сжатия.
- Обеспечивает качество, идентичное традиционной телефонии (PSTN).
- Плюсы: Низкая задержка (< 1 мс), простота обработки.
- Минусы: Высокий расход трафика, не подходит для медленного интернета.
- Где применяется: Офисные IP-АТС (Cisco, Avaya), звонки через SIP-телефонию.
- G.729
- Битрейт: 8 Кбит/с.
- Особенности:
- Сжимает голос в 8 раз сильнее, чем G.711, за счет алгоритма CS-ACELP.
- Сохраняет приемлемую разборчивость речи.
- Плюсы: Экономит трафик, работает на слабых каналах.
- Минусы: Заметное ухудшение качества при фоновых шумах.
- Где применяется: Мобильные приложения (например, мобильные клиенты VoIP), call-центры.
- Opus
- Битрейт: 6–510 Кбит/с (адаптивный).
- Особенности:
- Поддерживает широкополосный звук (до 48 кГц) и музыку.
- Динамически подстраивается под качество сети.
- Плюсы: Лучшее качество среди открытых кодеков, низкая задержка (26.5 мс).
- Минусы: Требует больше вычислительных ресурсов.
- Где применяется: WhatsApp, Zoom, Discord, WebRTC-сервисы.
- SILK
- Битрейт: 6–40 Кбит/с.
- Особенности:
- Разработан Skype для работы в условиях потери пакетов.
- С 2017 года интегрирован в кодек Opus.
- Плюсы: Устойчивость к помехам, плавное изменение битрейта.
- Минусы: Закрытый кодек (используется только в продуктах Microsoft).
Как начать работу с IP-телефонией и настроить ее в офисе
Проверьте интернет
— Скорость: от 100 Мбит/с для стабильных звонков.
— Тип подключения: оптоволокно надежнее медных кабелей.
— Тест связи: убедитесь, что нет разрывов и высокого джиттера.
Выберите провайдера
Ключевые критерии: стоимость (тарифы, интеграция с CRM, запись разговоров), распределение звонков (многоканальные линии, конференции), дополнительные функции (API, коллтрекинг).
Клиентам MANGO OFFICE доступны широкие возможности кастомизации виртуальной АТС и интеграции с другими бизнес-приложениями (CRM, CMS, ERP, офисными приложениями и др.).
Подберите оборудование
— IP-телефоны (подключение через Ethernet/Wi-Fi).
— Софтфон (приложение для ПК/смартфонов + гарнитура).
— Дополнительное оборудование (коммутаторы, шлюзы) настраивает провайдер.
Подключите услугу
— Оставьте заявку на сайте, согласуйте тариф и функции.
— Настройте базовые параметры в личном кабинете (добавочные номера, голосовое меню).
— Для сложных задач (переадресация, интеграции) обратитесь к техническим специалистам провайдера.
Настройку лучше доверить профессионалам — это гарантирует стабильность связи и защиту от ошибок.
Подробная инструкция с примерами — в статье:
Как организовать IP-телефонию в офисе.
Как защитить IP-телефонию
Шифрование данных
- SIP over TLS. Защищает сигнальный трафик (установку/завершение вызовов).
- SRTP (Secure RTP). Шифрует голосовые пакеты. Поддерживается большинством VoIP-провайдеров (например, Mango Office).
- Сквозное шифрование для приложений (Signal, WhatsApp).
Аутентификация и авторизация
- SIP-авторизация
Используйте сложные пароли для SIP-аккаунтов (например, «x34!kL9#Q» вместо «1234»). - Двухфакторная аутентификация (2FA)
Обязательна для доступа к панели управления провайдера. - Ограничение прав доступа
Сотрудники получают только необходимые функции (например, запрет на международные звонки).
Защита сети
- Создает зашифрованный туннель для удаленных сотрудников.
- VLAN для VoIP. Изолирует голосовой трафик от общего интернета.
- Firewall с поддержкой VoIP. Фильтрует подозрительные SIP-пакеты и блокирует DDoS-атаки.
Главное: как работает IP-телефония
IP-телефония заменяет аналоговые линии передачи голоса цифровыми технологиями, используя интернет как среду связи. Устройство IP-телефонии строится на многоуровневой архитектуре: от оцифровки голоса через кодеки (G.711, Opus) до маршрутизации пакетов по протоколам SIP или H.323.
Технология обеспечивает низкую стоимость звонков, интеграцию с бизнес-инструментами и гибкость масштабирования, но требует стабильного интернета и защиты данных через шифрование (SRTP, VPN). Для бизнеса это переход от «медных проводов» к умным коммуникациям, где голос, видео и данные объединены в единый поток.
< читать Журнал