0 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Вокодеры и синтезаторы речи

Вокодеры и синтезаторы речи

Самостоятельная работа по теме: «Исследование работы речевых вокодеров для систем подвижной радиосвязи»

Цель работы: исследование существующих вокодеров для кодирования и передачи речи в сжатом виде.

Речь – это один из самых сложных сигналов из всех существующих в природе. Речевой сигнал – это процесс передачи речевого сообщения (акустические, электрические, механические и другие процессы). Для кодирования-декодирования речевого сигнала и его передачи по каналу связи существуют такие устройства, как вокодеры. Современные вокодеры широко применяются в цифровой телефонной связи, в том числе – Internet-телефонии. Причиной тому – высокая степень сжатия информации.

Для достижения приемлемого качества речевой связи необходимо сохранить все кратковременные спектры мощности речевого сигнала. Основная задача вокодера заключается в минимизации суммарного количества информации о сигнале речи, необходимого для воспроизведения разборчивой речи, с использованием меньшего числа бит, чем это необходимо при обычном кодировании и декодировании. Вокодеры обычно воспроизводят ненатуральное звучание речи и поэтому использовались для записи такой информации, как сообщение «неправильно набран номер», шифрования речи для передачи по аналоговым телефонным каналам, а также в компьютерах. Но работа современных вокодеров стремится к моделированию человеческой речи с учетом всех ее характерных особенностей. Тут появляются новые проблемы, одной из которых является определение частоты основного тона.

В настоящее время применение речевого сигнала быстро увеличивается. Наиболее популярными являются такие технологии, как: распознавание речевых команд, преобразование речи в текст, распознавание и верификация дикторов. Поэтому совершенствование таких устройств, как речевые вокодеры, является актуальной задачей перед исследователями, занимающимися кодированием речи.

Вокодеры разделяют на две группы: речеэлементные и параметрические. В речеэлементных вокодерах при кодировании распознаются произносимые элементы речи и на выход кодера подаются только их номера. В декодере эти элементы создаются по правилам речеобразования или берутся из памяти декодера. В таких вокодерах приходится решать задачу распознавания элементов речи.

Параметрические вокодеры можно подразделить на:

  • полосовые (канальные);
  • формантные
  • ортогональные
  • корреляционные
  • гомоморфные
  • липредеры

Такие вокодеры выделяют из речевого сигнала два вида параметров: параметры, характеризующие спектральную огибающую сигнала (фильтровую функцию), и параметры, характеризующие сам источник речевого сигнала (генераторную функцию).

Рисунок 1 – Блок-схема параметрического вокодера

На схеме: А – анализатор входного сигнала, который на основе сегмента входной реализации речевого сигнала находит параметры, подлежащие передаче. Устройство Т-Ш (обнаружитель «Тон-шум») осуществляет различение типа сегмента сигнала – вокализованный он, или фрикативный, а ДОТ – детектор основного тона (блок оценки параметров основного тона) в случае, если сегмент относится к вокализованному типу. УО – устройство объединения сигналов для передачи через канал связи, УР – устройство разделения сигналов, переданных через канал. На приёмной стороне на основе принятых параметров происходит синтез речевого сигнала. Для этого используются ГОТ – генератор основного тона, ГШ – генератор шума, К – ключ. С – синтезатор, в котором воссоздаётся речевой сигнал.

1. Полосовой вокодер

В полосовых вокодерах спектр речи делится на 7-20 полос (каналов) с помощью полосовых фильтров. Анализатор определяет величину средней интенсивности речевого сигнала в каждой полосе. Эти величины передаются через канал связи. Чем большее число каналов используется в вокодере, тем больше натуральность и разборчивость речи. Блок-схема полосного вокодера изображена на рисунке 2:

Рисунок 2 – Блок-схема полосового вокодера

В полосовых вокодерах спектр речи делится на 7-20 полос (каналов) с помощью полосовых фильтров. Анализатор определяет величину средней интенсивности речевого сигнала в каждой полосе. Эти величины передаются через канал связи. Чем большее число каналов используется в вокодере, тем больше натуральность и разборчивость речи. Но чем больше информации о частотных полосах, тем больше придется передавать информации по цифровому тракту.

Полосовой вокодер представляет собой совокупность двух основных частей – анализирующей (передающая сторона) и синтезирующей (принимающая сторона), которые содержат идентичные наборы (гребенки) полосовых фильтров, перекрывающих определенный частотный интервал. Фильтры блока анализа обеспечивают тональное разделение спектра сигнала. Детектор и фильтр НЧ в каждом канале выделяют огибающую сигнала данного канала, и каждая из них характеризует энергию речевого спектра в соответствующей полосе частот для фрагмента речи. Для более компактной передачи выходы каждого из каналов могут логарифмироваться и кодироваться с помощью дельта-импульсной кодовой модуляции (ДИКМ).

К основным недостаткам полосных вокодеров, ухудшающим разборчивость синтезированной речи, относят появление больших интерференционных искажений огибающей спектра, возникающих из-за несогласованности ФЧХ полосных фильтров, а также искажения спектральной картины в формантной области, связанные с попаданием форманты в межфильтровую зону.

2. Ортогональный вокодер

Принцип действия ортогональных вокодеров базируется на возможности представления спектральной огибающей речевого сигнала в виде суммы ортогональных функций. В этих случаях, в отличие от других вокодеров, спектральная огибающая на приёме воспроизводится не по отдельным ординатам, а в виде суммы тех же ортогональных функций.

Проще говоря, ортогональные вокодеры отличаются от полосовых тем, что функции фильтров выполняются с помощью цифровых методов. Это либо быстрое преобразование Фурье, либо ортогональные функции Уолша (периодические дискретные функции, принимающие значения 0 или 1).

В ортогональных вокодерах, в отличие от .полосных, сигнал-параметры неравнозначны и некоррелированы друг с другом. Поэтому искажение одного из них иногда приводит к значительным искажениям передачи. Особенно заметно это свойство ортогональных вокодеров сказывается на качестве – передачи речи при небольшом числе передаваемых параметров. Другим недостатком гармонических вокодеров, также проявляющимся при небольшом числе передаваемых параметров, является искажение формы формантных кривых: вместо резонансных получаются кривые синусоидальной формы и появляются дополнительные максимумы – ложные форманты, как показано на рисунке 3:

Рисунок 3 – Искажение формы формантных кривых

Появление таких искажений придает звучанию синтезированной речи назальность. Чтобы приблизить форму спектральной огибающей к типичной формантной структуре, можно использовать квадратичный ортогональный (гармонический) вокодер (рис. 4):

Рисунок 4 – Блок-схема квадратичного ортогонального вокодера

На приемной стороне сигнал-параметры управляют двумя синтезаторами линейного типа. На вход линии задержки первого синтезатора подается сигнал от источника речевых колебаний, т. е. от генератора ОТ или генератора шума, а на вход линии задержки второго синтезатора подается сигнал с выхода первого синтезатора. В результате этой операции происходит «квадрирование» огибающей спектра, получаемая спектральная огибающая становится близкой к исходной как по формантным кривым, так и вследствие устранения ложных формант. Экспериментально доказано, что в данном случае разборчивость лучше по сравнению с линейным вокодером.

3. Липредеры (вокодеры с линейным предсказанием)

Вокодеры с линейным предсказанием являются самыми распространёнными в современных системах передачи речи. Именно метод кодирования с линейным предсказанием и применяются в сотовой связи. Суть метода в том, что для прогноза текущего отсчета речевого сигнала можно использовать линейно взвешенную сумму предшествующих отсчетов, то есть предсказываемый отсчет. При кодировании (на передаче) производится оценка параметров ФЛП и параметров сигнала возбуждения, а при декодировании (на приеме) — сигнал возбуждения пропускается через фильтр-синтезатор, на выходе которого получается восстановленный сигнал речи. Этот метод становится доминирующим при оценке основных параметров речевого сигнала, таких, как период основного тона, форманты, спектр, а также при сокращенном представлении речи с целью ее низкоскоростной передачи и экономного хранения. Важность метода обусловлена высокой точностью получаемых оценок и простотой вычислений. Рассмотрим сначала модель речевого тракта, которая позволяет использовать методы линейного предсказания для анализа и синтеза речевого сигнала:

Рисунок 5 – Блок-схема модели речеобразования

Рассмотрим структурную схему вокодера с линейным предсказанием (рис. 6):

Рисунок 6 – Структурная схема липредера

На подготовительном этапе выполняют аналого-цифровое преобразование речевого сигнала и сегментацию цифрового потока: для последующей обработки выбирают отсчеты сигнала на интервале длительностью 20 мс, что при частоте дискретизации 8 кГц обеспечивает в каждом сегменте 160 обрабатываемых отсчетов. После сегментации отсчетов речевого сигнала в кодере последовательно выполняются следующие три процедуры:

1) кратковременный (формантный) анализ с использованием процедуры линейного предсказания, в результате чего получают первый остаточный сигнал;

2) долговременный анализ с использованием линейного предсказания для определения параметров основного тона, в результате чего получают второй остаточный сигнал , близкий по своим характеристикам к шумовому, поскольку между отсчетами этого сигнала корреляция мала;

3) аппроксимация второго остаточного сигнала с целью формирования сигнала возбуждения.

Восстановленный сигнал достаточно близок к исходному сигналу на входе кодера . Выполнив цифро-аналоговое преобразование и пропустив сигнал через ФНЧ, получают восстановленный аналоговый сигнал. Все процедуры обработки сигнала в кодере и декодере выполняются цифровыми методами. Показанные на рис. 6 модули липредера фактически являются блоками программного обеспечения.

4. Формантные вокодеры

В формантных вокодерах спектральная огибающая речевого сигнала аппроксимируется комбинацией нескольких простых резонансных кривых. Принципы построения форматного вокодера во многом аналогичны принципам естественного речеобразования и приёма речи. Поскольку речевой тракт представляет собой комплекс резонаторов, резонансные частоты и добротности которых изменяются в процессе речи в соответствии с сигналами, идущими из центральной нервной системы, то и в формантном вокодере происходит выделение из речевого сигнала управляющих сигналов (сигнал-параметров), которые на приёме воздействуют на резонансные контуры и воспроизводят требуемую огибающую спектра.

Структурная схема формантного вокодера:

Рисунок 7 – Структурная схема формантного вокодера

На передающей стороне в анализаторе вокодера выделяются структурные сигналы-параметры первых трех формант, а также интонационные параметры. В качестве оценки амплитуды форманты используется её усредненный уровень, выделяемый с помощью полосовых фильтров, выпрямителей и ФНЧ. Для выделения формантных частот применяются метод ро-метра, а также методы дискриминаторный и фильтрационный. Синтезатор формантного вокодера состоит из трех управляемых резонансных контуров (УК) с плавной перестройкой их частоты под приходящий параметр. На модуляторах происходит взаимодействие резонансного и колебательного процессов в зависимости от уровня соответствующего сигналапараметра . Считается, что с помощью формантного вокодера можно получать достаточно высококачественный синтез речи, как по разборчивости, так и по натуральности — даже при скорости цифрового потока порядка 1200 бит/с. При этом коэффициент компрессии формантного вокодера не менее чем вдвое выше, чем полосного.

На вторую часть учебно-исследовательской работы поставлены задачи моделирования полосового вокодера в программной среде Matlab и исследование работы детектора основного тона, находящегося в составе модели.

Так как моя учебно-исследовательская работа оказалась очень масштабной, в размещенном выше сообщении я указала основные виды вокодеров и описания их работы. По факту их теоретические исследования проведены намного основательнее. Для подтверждения сказанного прикрепляю файл с защищенной УИР.

6 отличных вокодеров, которые стоит попробовать! (vocoder vst)

10 августа , 2019

Ранее мы рассматривали, что такое вокодер , где его применяют и некоторые исторические факты. По сегодняшний день вокодер остается художественным инструментом для создания роботизированных синтезируемых речей в аудио и кино-производстве. Мы подобрали 6 отличных плагинов, которые стоит добавить в свою коллекцию!

EVOC 20 PS от Apple

Входит в комплект Logic Pro X. Цена: 199$.

Это вокодер и полифонический синтезатор, который поставляется с превосходным набором виртуальных инструментов Logic Pro. Интерфейс доступен и хорошо организован — как только будут поняты три режима (Анализ, Синтез, Вокодер) и настроен вход боковой цепи, вы сразу же получите результаты. Синтезированная секция может представлять собой смесь двух сигналов или FM-модулированной волны. Встроенная модуляция, генерация шума, встроенные эффекты и классная функция Freeze (которая замораживает текущий вокодированный звук) — это хорошие дополняющие функции.

Читать еще:  Цифровое фото. Итоги 2011 года

Vocal Synth 2 от iZotope

Цена: 199 долларов

Этот плагин от iZotope чрезвычайно мощный и звучит великолепно с самого первого запуска. Он потребует времени на изучение, поскольку имеет крайне расширенные функции. Есть три основных режима, о которых нужно знать вне очереди:

  • AUTO: внутренний синтезатор, используется для генерации звука. Вставьте его на звуковую дорожку и нажмите кнопку воспроизведения.
  • MIDI: в этом режиме вы можете управлять гармониями, генерируемыми с помощью MIDI-контроллера (например, клавиатуры).
  • SIDECHAIN: В этом режиме вы можете управлять другим синтезатором, гитарой или другими источниками звука через модули Vocal Synth. На экранах справки приведены четкие и краткие инструкции по настройке для каждого режима.

Помимо модуля Vocoder, есть еще четыре — Biovox, Compuvox, Talkbox и Polyvox. Интерфейс использует приятную графику для отображения относительного влияния каждого из них.

Существует также множество звуковых эффектов, которые можно легко перетащить в любую пользовательскую конфигурацию. В частности, модуль Shred создает эффект гранулированного заикания.

MVocoder от Melda Production

Цена: $ 57

MVocoder — это многофункциональное устройство, которое поставляется с исчерпывающим 102-страничным руководством и позволяет манипулировать/модулировать каждый возможный параметр. Четыре секции модулятора включают в себя формы, конверты и многое другое. Разделы Band Graph и Band Matrix делают это мощным инструментом. Есть бортовая секция повышения частоты дискретизации и возможность mid/side обработки.

Чем больше времени мы прободили с ним, тем больше он нам нравился. Мы продолжали открывать новые функциональные возможности, графические интерфейсы и удивительные уровни управления, которые приводили к нюансам и экстремальным звуковым вариациям. Он даже имеет 11 стилей интерфейса с пользовательскими цветами для удовлетворения вашего эстетического вкуса. MVocoder предназначен для тех, кто хочет глубже изучить вокодинг с тщательным контролем и программируемостью на каждом шагу.

Vocalizer Pro от Sonivox

Цена: 199 долларов

Vocalizer Pro имеет потрясающий, хотя и изначально пугающий интерфейс, и предоставляет доступ к четырем идентичным модулям спектрального синтеза с настраиваемой возможностью маршрутизации. Модули включают в себя различные методы синтеза, огибающие, многомодовые фильтры и LFO. Существует встроенная вкладка «Эффекты» для эквалайзера, хоруса, дилею и реверу, а также превосходная система браузера, основанная на стилистике. Восемь пэдов Snapshot позволяют на лету получать доступ к пользовательским пресетам, а восемь пэдов Chord будут вызывать ноты и аккорды клавиатуры. Как только вы поймете один модуль и влияние различных методов синтеза, вы готовы к работе.

Lector Vocoder от Waldorf

Lector Vocoder — это интерфейс с одним окном, который включает в себя четыре основных раздела: управление входным сигналом с неявным обнаружением для разборчивости, синтезатор (2 секции генератора, фильтр и усилитель), банк фильтров Vocoder с модулями управления и анализа, а также встроенный раздел Effects, который включает в себя: овердрайв, хор, задержку и реверберацию. Потребовалось некоторое время, чтобы заставить это устройство делать то, что нам хотелось, но результаты были достаточно хорошими. Мы рекомендуем внимательно прочитать руководство, чтобы избежать разочарований. Звуковой движок Waldorf хорошо известен, уважаем и обеспечивает прочную основу для вокодирования в этом плагине.

Orange Vocoder IV by Zynaptiq

Цена: 189 $ (цена старой версии)

Orange Vocoder IV — это последнее предложение от инновационных разработчиков Zynaptiq, которое еще не выпущено. Сказать какие-либо личные комментарии сложно, потому возьмем официальную информацию.

Первоначально разработанный Prosoniq в 1998 году, ORANGE VOCODER развивался благодаря многочисленным итерациям, и всегда оставался востребованным вплоть до сегодняшнего дня. Он имеет репутацию прибора с наиболее прозрачным звучанием и гибкими настройками. Под капотом 32-голосовых синтезатора, восемь алгоритмов вокодера (начиная от аналоговых схем и заканчивая цифровыми режимами), фильтром, отражениями, реверберацией, 10-полосным эквалайзером и многим другим!

Вокодирование — это не только искажение голоса или роботизация; Это уникальная форма кросс-синтеза, которая хорошо работает с различными исходными материалами и живым звуком. Если вы не экспериментировали с вокодерами в прошлом, сейчас самое подходящее время. Может быть, именно это вдохновит вас на новые направления в творчестве.

Снисарь Николай Александрович

Тема магистерской работы:

Передача данных посредством голосового канала GSM сети в системах коммерческого учета электроэнергии.

Источник: Лекция «Цифровая обработка речевых сигналов. Часть 2. Параметрическое кодирование речи (вокодеры)».
Сайт: http://aprodeus.narod.ru/teaching.htm

Параметрическое кодирование речи (вокодеры)

Вокодеры – это системы параметрического кодирования речи, широко применяемые в современной цифровой телефонной связи, в том числе – Internet-телефонии [1,2]. Причиной тому – высокая степень сжатия информации, а также хорошая согласованность вокодеров с системами канального кодирования и шифрования, в результате чего сравнительно легко обеспечивается высокая защищенность систем связи от помех и утечки информации. Недостатком вокодеров является невысокое качество речи, поэтому они применяются главным образом в военной связи, где главное – не натуральность речи, а ее высокая степень сжатия и хорошая разборчивость. В коммерческих системах связи, где ценится натуральность звучания речи, обычно применяют полувокодеры (гибридные вокодеры), сочетающие принципы непараметрического и параметрического методов кодирования. Иные области применения вокодеров – автоматизированная стенография, озвучивание текста, человеко-машинный диалог, биометрия (идентификация диктора) [3].
Знакомясь с современным состоянием вокодерных технологий по литературным источникам и ресурсам Internet [4-8], можно видеть, что помимо программных и программно-аппаратных разработок вокодеров для промышленного, военного и бытового применения, существует еще несколько интересных и перспективных направлений:

  • программные вокодеры-игрушки;
  • лекции и лабораторные работы для желающих ознакомиться с базовыми принципами вокодерных технологий.

Перспективность этих направлений, по нашему мнению, состоит в возможности их объединения с целью создания соответствующих практикумов. Элементы таких практикумов уже сегодня можно встретить на страницах Internet, однако эта информацию разрозненна, неполна, и изложена преимущественно на английском языке.
В данной лекции мы рассмотрим несколько простейших программных модулей для среды Matlab, позволяющих как бы «изнутри» взглянуть на базовые принципы и алгоритмы параметрического кодирования речевых сигналов.

2. Кратко о видах вокодеров

Первый вокодер, полосный, был предложен в 1939 году Гомером Дадли [9]. Анализатор и синтезатор этого вокодера содержали гребенки полосовых фильтров, с помощью которых осуществлялось моделирование резонансных свойств речевого тракта человека. С развитием средств цифровой вычислительной техники полосные вокодеры стало удобным реализовывать на базе алгоритма быстрого преобразования Фурье (БПФ). Впоследствии были разработаны иные типы цифровых вокодеров, моделирующих резонансные свойства речевого тракта – гомоморфные, с линейным предсказанием, формантные [10,11].
В 1966 Фланаганом и Голденом [12] предложен иной тип вокодеров — фазовые вокодеры, в которых речевой сигнал аппроксимируют суммой узкополосных процессов, представляемых в виде гармоник, модулированных по амплитуде и частоте. Таким образом, в фазовых вокодерах реализуется идея «разделения» временных и спектральных свойств сигнала: информация о временных свойствах сигнала содержится в модулирующих сигналах в виде переменной амплитуды и фазы, а информация о частотных свойствах содержится в модулируемых сигналах, генерируемых осцилляторами [13]. Фазовые вокодеры позволяют сравнительно легко реализовывать такие эффекты как изменение темпа или высоты речевого сигнала.
В речеэлементных вокодерах [10,11], в отличие от двух предыдущих групп вокодеров, на этапе анализа осуществляется распознавание звуков речи. Это наиболее сложный в техническом отношении тип вокодеров, поскольку одни и те же слова и звуки разными людьми произносятся по-разному. Вместе с тем, такие вокодеры весьма перспективны, позволяя, в принципе, автоматически преобразовывать речь в текст и наоборот, текст — в речь. Одна из наиболее глубоко проработанных технологий такого рода – технология Microsoft Agent [14], элементы которой знакомы практически всем пользователям среды Microsoft Office.

3. Вокодер как цифровая модель речевого тракта

Ядром вокодера, — цифровой модели речевого тракта, — является цифровой фильтр с переменными параметрами, АЧХ которого изменяется во времени, отражая изменение резонансных свойствах речевого тракта. В анализаторе вокодера измеряются характеристики этого фильтра, а в синтезаторе фильтр воссоздается по результатам этих измерений (рис.1).

Рис.1. Обобщенная структурная схема полосного вокодера

Рис.2. Структура программных модулей анализатора и синтезатора

Кроме того, в анализаторе определяется, какой звук имеет место в данный момент времени – гласный или согласный, а также измеряется частота основного тона гласного звука. В синтезаторе на основе этой информации формируется возбуждающий сигнал: для согласных звуков это шум, для гласных – периодическая последовательность импульсов с периодом, равным периоду основного тона. Структура программных модулей анализатора и синтезатора приведена на рис.2.
Подчеркнем, что решающую роль в разборчивости синтезированного речевого сигнала играет информация о резонансных свойствах речевого тракта. Так, возбуждая фильтр синтезатора только шумом либо только периодической последовательностью импульсов, можно получить вполне разборчивую речь. Отличие лишь в том, что в первом случае мы услышим шепот, во втором — «голос робота».

3. Анализ: измерение параметров фильтра
Рассмотрим несколько конкретных примеров измерения параметров фильтра в полосных и гомоморфных вокодерах, а также в вокодерах с линейным предсказанием (липредерах). При этом учтем, что интервал стационарности речевого сигнала близок величине 10-30 мс [10].
Полосной вокодер. Измерения АЧХ фильтра с переменными параметрами в полосном вокодере удобно производить, используя кратковременный спектральный анализ и алгоритм БПФ. В приведенном ниже примере речевой сигнал нарезается на неперекрывающиеся сегменты протяженностью 128 выборок (11.6 мс при частоте дискретизации Fs=11025 Гц), для каждого сегмента вычисляется непараметрическая оценка спектра мощности (периодограмма). Спектры смежных сегментов попарно усредняются, в результате чего получается спектрограмма с разрешением по времени 23.2 мс и разрешением по частоте примерно 100 Гц (рис.3).
Листинг соответствующей программы имеет следующий вид:

% ============= analys_bandvoc.m ===================
% Полосный вокодер — анализ АЧХ голосового тракта
% x — анализируемый (речевой) сигнал
% nfft — параметр БПФ
% fs — частота дискретизации
% window — окно
% numoverlap — величина перекрытиЯ окон
% Bamp — спектрограмма
% ==================================================
% === задание параметров обработки ===
nfft = 128; fs = 11025;
window = rectwin(nfft); numoverlap = 0;

% ==== вычислениеспектрограммы =====
[B,f,t] = specgram(x,nfft,fs,window,numoverlap);
Bamp = abs(B);

% ==== усреднение двух смежных спектров =====
it=1; It=size(Bamp,2);
while it

Рис.3. Исходный речевой сигнал и его спектрограмма

© ДонНТУ, Снисарь Николай Александрович, 2008

Вокодеры и синтезаторы речи

Самостоятельная работа по теме: «Исследование работы речевых вокодеров для систем подвижной радиосвязи»

Цель работы: исследование существующих вокодеров для кодирования и передачи речи в сжатом виде.

Речь – это один из самых сложных сигналов из всех существующих в природе. Речевой сигнал – это процесс передачи речевого сообщения (акустические, электрические, механические и другие процессы). Для кодирования-декодирования речевого сигнала и его передачи по каналу связи существуют такие устройства, как вокодеры. Современные вокодеры широко применяются в цифровой телефонной связи, в том числе – Internet-телефонии. Причиной тому – высокая степень сжатия информации.

Для достижения приемлемого качества речевой связи необходимо сохранить все кратковременные спектры мощности речевого сигнала. Основная задача вокодера заключается в минимизации суммарного количества информации о сигнале речи, необходимого для воспроизведения разборчивой речи, с использованием меньшего числа бит, чем это необходимо при обычном кодировании и декодировании. Вокодеры обычно воспроизводят ненатуральное звучание речи и поэтому использовались для записи такой информации, как сообщение «неправильно набран номер», шифрования речи для передачи по аналоговым телефонным каналам, а также в компьютерах. Но работа современных вокодеров стремится к моделированию человеческой речи с учетом всех ее характерных особенностей. Тут появляются новые проблемы, одной из которых является определение частоты основного тона.

В настоящее время применение речевого сигнала быстро увеличивается. Наиболее популярными являются такие технологии, как: распознавание речевых команд, преобразование речи в текст, распознавание и верификация дикторов. Поэтому совершенствование таких устройств, как речевые вокодеры, является актуальной задачей перед исследователями, занимающимися кодированием речи.

Вокодеры разделяют на две группы: речеэлементные и параметрические. В речеэлементных вокодерах при кодировании распознаются произносимые элементы речи и на выход кодера подаются только их номера. В декодере эти элементы создаются по правилам речеобразования или берутся из памяти декодера. В таких вокодерах приходится решать задачу распознавания элементов речи.

Параметрические вокодеры можно подразделить на:

  • полосовые (канальные);
  • формантные
  • ортогональные
  • корреляционные
  • гомоморфные
  • липредеры
Читать еще:  12 полезных AI-сервисов, на которые стоит обратить внимание

Такие вокодеры выделяют из речевого сигнала два вида параметров: параметры, характеризующие спектральную огибающую сигнала (фильтровую функцию), и параметры, характеризующие сам источник речевого сигнала (генераторную функцию).

Рисунок 1 – Блок-схема параметрического вокодера

На схеме: А – анализатор входного сигнала, который на основе сегмента входной реализации речевого сигнала находит параметры, подлежащие передаче. Устройство Т-Ш (обнаружитель «Тон-шум») осуществляет различение типа сегмента сигнала – вокализованный он, или фрикативный, а ДОТ – детектор основного тона (блок оценки параметров основного тона) в случае, если сегмент относится к вокализованному типу. УО – устройство объединения сигналов для передачи через канал связи, УР – устройство разделения сигналов, переданных через канал. На приёмной стороне на основе принятых параметров происходит синтез речевого сигнала. Для этого используются ГОТ – генератор основного тона, ГШ – генератор шума, К – ключ. С – синтезатор, в котором воссоздаётся речевой сигнал.

1. Полосовой вокодер

В полосовых вокодерах спектр речи делится на 7-20 полос (каналов) с помощью полосовых фильтров. Анализатор определяет величину средней интенсивности речевого сигнала в каждой полосе. Эти величины передаются через канал связи. Чем большее число каналов используется в вокодере, тем больше натуральность и разборчивость речи. Блок-схема полосного вокодера изображена на рисунке 2:

Рисунок 2 – Блок-схема полосового вокодера

В полосовых вокодерах спектр речи делится на 7-20 полос (каналов) с помощью полосовых фильтров. Анализатор определяет величину средней интенсивности речевого сигнала в каждой полосе. Эти величины передаются через канал связи. Чем большее число каналов используется в вокодере, тем больше натуральность и разборчивость речи. Но чем больше информации о частотных полосах, тем больше придется передавать информации по цифровому тракту.

Полосовой вокодер представляет собой совокупность двух основных частей – анализирующей (передающая сторона) и синтезирующей (принимающая сторона), которые содержат идентичные наборы (гребенки) полосовых фильтров, перекрывающих определенный частотный интервал. Фильтры блока анализа обеспечивают тональное разделение спектра сигнала. Детектор и фильтр НЧ в каждом канале выделяют огибающую сигнала данного канала, и каждая из них характеризует энергию речевого спектра в соответствующей полосе частот для фрагмента речи. Для более компактной передачи выходы каждого из каналов могут логарифмироваться и кодироваться с помощью дельта-импульсной кодовой модуляции (ДИКМ).

К основным недостаткам полосных вокодеров, ухудшающим разборчивость синтезированной речи, относят появление больших интерференционных искажений огибающей спектра, возникающих из-за несогласованности ФЧХ полосных фильтров, а также искажения спектральной картины в формантной области, связанные с попаданием форманты в межфильтровую зону.

2. Ортогональный вокодер

Принцип действия ортогональных вокодеров базируется на возможности представления спектральной огибающей речевого сигнала в виде суммы ортогональных функций. В этих случаях, в отличие от других вокодеров, спектральная огибающая на приёме воспроизводится не по отдельным ординатам, а в виде суммы тех же ортогональных функций.

Проще говоря, ортогональные вокодеры отличаются от полосовых тем, что функции фильтров выполняются с помощью цифровых методов. Это либо быстрое преобразование Фурье, либо ортогональные функции Уолша (периодические дискретные функции, принимающие значения 0 или 1).

В ортогональных вокодерах, в отличие от .полосных, сигнал-параметры неравнозначны и некоррелированы друг с другом. Поэтому искажение одного из них иногда приводит к значительным искажениям передачи. Особенно заметно это свойство ортогональных вокодеров сказывается на качестве – передачи речи при небольшом числе передаваемых параметров. Другим недостатком гармонических вокодеров, также проявляющимся при небольшом числе передаваемых параметров, является искажение формы формантных кривых: вместо резонансных получаются кривые синусоидальной формы и появляются дополнительные максимумы – ложные форманты, как показано на рисунке 3:

Рисунок 3 – Искажение формы формантных кривых

Появление таких искажений придает звучанию синтезированной речи назальность. Чтобы приблизить форму спектральной огибающей к типичной формантной структуре, можно использовать квадратичный ортогональный (гармонический) вокодер (рис. 4):

Рисунок 4 – Блок-схема квадратичного ортогонального вокодера

На приемной стороне сигнал-параметры управляют двумя синтезаторами линейного типа. На вход линии задержки первого синтезатора подается сигнал от источника речевых колебаний, т. е. от генератора ОТ или генератора шума, а на вход линии задержки второго синтезатора подается сигнал с выхода первого синтезатора. В результате этой операции происходит «квадрирование» огибающей спектра, получаемая спектральная огибающая становится близкой к исходной как по формантным кривым, так и вследствие устранения ложных формант. Экспериментально доказано, что в данном случае разборчивость лучше по сравнению с линейным вокодером.

3. Липредеры (вокодеры с линейным предсказанием)

Вокодеры с линейным предсказанием являются самыми распространёнными в современных системах передачи речи. Именно метод кодирования с линейным предсказанием и применяются в сотовой связи. Суть метода в том, что для прогноза текущего отсчета речевого сигнала можно использовать линейно взвешенную сумму предшествующих отсчетов, то есть предсказываемый отсчет. При кодировании (на передаче) производится оценка параметров ФЛП и параметров сигнала возбуждения, а при декодировании (на приеме) — сигнал возбуждения пропускается через фильтр-синтезатор, на выходе которого получается восстановленный сигнал речи. Этот метод становится доминирующим при оценке основных параметров речевого сигнала, таких, как период основного тона, форманты, спектр, а также при сокращенном представлении речи с целью ее низкоскоростной передачи и экономного хранения. Важность метода обусловлена высокой точностью получаемых оценок и простотой вычислений. Рассмотрим сначала модель речевого тракта, которая позволяет использовать методы линейного предсказания для анализа и синтеза речевого сигнала:

Рисунок 5 – Блок-схема модели речеобразования

Рассмотрим структурную схему вокодера с линейным предсказанием (рис. 6):

Рисунок 6 – Структурная схема липредера

На подготовительном этапе выполняют аналого-цифровое преобразование речевого сигнала и сегментацию цифрового потока: для последующей обработки выбирают отсчеты сигнала на интервале длительностью 20 мс, что при частоте дискретизации 8 кГц обеспечивает в каждом сегменте 160 обрабатываемых отсчетов. После сегментации отсчетов речевого сигнала в кодере последовательно выполняются следующие три процедуры:

1) кратковременный (формантный) анализ с использованием процедуры линейного предсказания, в результате чего получают первый остаточный сигнал;

2) долговременный анализ с использованием линейного предсказания для определения параметров основного тона, в результате чего получают второй остаточный сигнал , близкий по своим характеристикам к шумовому, поскольку между отсчетами этого сигнала корреляция мала;

3) аппроксимация второго остаточного сигнала с целью формирования сигнала возбуждения.

Восстановленный сигнал достаточно близок к исходному сигналу на входе кодера . Выполнив цифро-аналоговое преобразование и пропустив сигнал через ФНЧ, получают восстановленный аналоговый сигнал. Все процедуры обработки сигнала в кодере и декодере выполняются цифровыми методами. Показанные на рис. 6 модули липредера фактически являются блоками программного обеспечения.

4. Формантные вокодеры

В формантных вокодерах спектральная огибающая речевого сигнала аппроксимируется комбинацией нескольких простых резонансных кривых. Принципы построения форматного вокодера во многом аналогичны принципам естественного речеобразования и приёма речи. Поскольку речевой тракт представляет собой комплекс резонаторов, резонансные частоты и добротности которых изменяются в процессе речи в соответствии с сигналами, идущими из центральной нервной системы, то и в формантном вокодере происходит выделение из речевого сигнала управляющих сигналов (сигнал-параметров), которые на приёме воздействуют на резонансные контуры и воспроизводят требуемую огибающую спектра.

Структурная схема формантного вокодера:

Рисунок 7 – Структурная схема формантного вокодера

На передающей стороне в анализаторе вокодера выделяются структурные сигналы-параметры первых трех формант, а также интонационные параметры. В качестве оценки амплитуды форманты используется её усредненный уровень, выделяемый с помощью полосовых фильтров, выпрямителей и ФНЧ. Для выделения формантных частот применяются метод ро-метра, а также методы дискриминаторный и фильтрационный. Синтезатор формантного вокодера состоит из трех управляемых резонансных контуров (УК) с плавной перестройкой их частоты под приходящий параметр. На модуляторах происходит взаимодействие резонансного и колебательного процессов в зависимости от уровня соответствующего сигналапараметра . Считается, что с помощью формантного вокодера можно получать достаточно высококачественный синтез речи, как по разборчивости, так и по натуральности — даже при скорости цифрового потока порядка 1200 бит/с. При этом коэффициент компрессии формантного вокодера не менее чем вдвое выше, чем полосного.

На вторую часть учебно-исследовательской работы поставлены задачи моделирования полосового вокодера в программной среде Matlab и исследование работы детектора основного тона, находящегося в составе модели.

Так как моя учебно-исследовательская работа оказалась очень масштабной, в размещенном выше сообщении я указала основные виды вокодеров и описания их работы. По факту их теоретические исследования проведены намного основательнее. Для подтверждения сказанного прикрепляю файл с защищенной УИР.

Наверное самый лучший синтез речи на данный момент

Всем привет, возможно это уже было, сильно не кидайтесь камнями(мой первый пост), хочу поделится отличным синтезатором речи в Телеграмме. Выполнен в виде бота, который можете добавлять в свои чаты с друзьями, есть настройки и несколько типов речи. Основан на апи яндекса SpeechKit. Это лучший синтезатор который я слышал. С друзьями кидали кучи разного текста, отрывки из книг, и синтезирует так что почти неотличимо от настоящего человека, как будто зачитывает диктор. Конечно бывают косяки, но издалека, очень хорошо звучит.Особенно если поиграться с настройками. Мы вывели что голос Женек с эмоцией злой звучит лучше всего.Бот не мой, просто нашли. И почему то у него до сих пор нет популярности.

Не знаю можно ли делится тут ссылками, но вот: https://t.me/Maksobot

Подтверждаю, самый лучший. «Александр» и в подметки не годится — я с разными синтезаторами дело имел, делая для себя аудикниги из просто книг, и это самый натуральный голос из всех.

Значит уже и хорошей штукой поделится нельзя. Понятно все с вашим пикабу, сразу везде рекламу видят.

Все нормально, бро, штука хорошая и мне, например, пригодится.

пост уже удалили.

Телеграм-бот, помогающий оформить фото на документы

Возникла у меня тут в очередной раз задача сделать фото для документов. Обычно, я в таком случае фотографируюсь на фоне холодильника на телефон, в ФШ поворачиваю, кадрирую и вырезаю фон. В этот раз мне даже на бумаге печатать фото было не нужно. Но блин, 2020 на дворе, нейросети там и AI, неужели я должен как 10 лет назад это делать руками? Иду в интернет, и что я там вижу: все сервисы подобного рода делятся на 3 типа:

1) Не вырезает фон впринципе, предлагает кадрировать и цвет покрутить

2) Предлагает вырезать фон руками в браузере инструментом аля MS Paint

3) Делает все как я хочу, но просит за одно фото 300р (. )

Приложения в Google Play примерно такие же.

Короче пришлось делать на коленке, самому. Находясь в короновирусной самоизоляции, освободилось прилично времени для таких вот проектов. Родилось вот что: https://t.me/PassportPhoto_bot

Пока что бот имеет довольно скромный функционал: на первом этапе распознаются глаза, подбородок и макушка, кадр поворачивается и зумится так, чтобы выполнялись требования большинства ведомств (ориентировался на шенген, но на загранник или паспорт РФ тоже должно проканать). Далее, нейросетью обрезается фон, и фото готово для скачивания. Элементов управления — по минимуму. Сейчас бот живет на довольно скромном железе, поэтому чутка задумчивый 🙂 Гора возможных улучшений поселилась в беклоге, буду дорабатывать по мере появления времени.

Никаких денег за работу бот не берет, только добровольные донаты 🙂

Противникам голосовых сообщений

Никто не любит получать аудиосообщения. Но у всех есть друг, который общается только голосовыми сообщениями. Мне захотелось раз и навсегда решить эту проблему, и я написал бота для Telegram, который преобразовывает голосовые сообщения в текст.

Вы можете добавить бота в чат, и бот будет автоматически реагировать на голосовые сообщения:

Если не хотите добавлять бота в чат, то можете просто пересылать ему голосовые сообщения, а в ответ бот пришлет текст:

Добавить бота себе можно по ссылке — https://t.me/VoiceMsgBot

Отзывы и пожелания по функционалу приветствуются.

Яндекс работа

Решил проверить тоже

Только с адресом опечатался, но думаю результат сильно бы не изменился.

Ироничный яндекс

Наткнулась случайно на сервис Таланты.Яндекс. Ради любопытства решила узнать, что мне предложит бот. Он задает различные непринужденные вопросы про имя, возраст, район поиска, место и стаж предыдущей работы. На основе таких данных он подбирает вакансии. Однако я и подумать не могла, что все мои навыки научного сотрудника в НИИ пригодятся в работе такси.

Читать еще:  Цифровая Full HD видеокамера Panasonic HDC-SD800

Lovebot — обновление 0.9

Наконец обновление дописано и выложено! )

Сразу и по порядку:

1) Изменена регистрация:

Теперь она намного удобнее и очевиднее!

Достаточно просто отправить команду(или проследовать по подсказкам бота, если Вы в первый раз зашли), а дальше по инструкции. Главное отправить фото, как фото, а не как файл 😉

2) Время отдачи анкеты

Раньше, в самой первой версии, на выдачу анкеты тратилось около 2х секунд. Теперь же цифры совершенно иные:

То есть в среднем около 0,003 на поиск.

Тут даже нет смысла расписывать )

3) Появился поиск

Который тоже, надеюсь, удобен и очевиден.

Так же его можно досрочно закончить, просто нажав «Начать поиск»!

Спасибо больше тем 175 пользователям бота, которые не дали просто забросить работу и мотивировали работать дальше.

P.s. из-за появления поиска, старые анкеты пришлось удалить, сразу прошу за это прощения и обещаю, что такое больше не повториться.

Тариф День Рождения от РЖД или как экономить от 40% до 80% на билеты Сапсан. Личный опыт.

В начале этого года я столкнулся с проблемой найти среди своих коллег человека, кто был бы не против воспользоваться Сапсаном и в нужные мне даты съездить со мной в Москву из СПб и обратно (или только в одну сторону). Мне было важно найти не просто попутчика, а пассажира, чья дата рождения совпадала или лежала в интервале 14 дней с предполагаемой датой моей поездки для того, чтобы мы могли вмести купить в кассе РЖД билеты на поезд Сапсан со скидкой в 50% для каждого. Я не смог осуществить задуманное, но задумался, что если бы я не ограничивался стенами офиса, то мог бы купить билет со скидкой и поехать с кем-то еще, возможно, даже с незнакомым мне человеком.

После этого я создал бота в Телеграм T.me/Allo812Bot, который помогает регулярно пользоваться льготным тарифом «День рождения» для проезда в поездах «Сапсан».

T.me/Allo812Bot ищет людей, которые могут применить тариф День Рождения от РЖД и помогает найти пассажиров-попутчиков, чтобы купить билет со скидкой от 60% до 80%.

С его помощью можно также найти пассажира-именинника и каждый раз при покупке билетов на скоростной поезд Сапсан экономить 40% от их общей стоимости

(см. раздел Правила в T.me/Allo812Bot).

Одна из решенных технических проблем

После блокировки Телеграм в апреле встал вопрос, как технически организовать оплату, потому что SberbankPaymentBot, платежный бот Яндекс.Касса, иностранные платежные сервисы не позволяли подключить эквайринг к боту в Телеграм. Последовательно осуществлялись попытки подключить каждую из них. Одновременно придумал альтернативное техническое решение, которое позволяет принимать платежи пользователей, сохранив эквайринг от Сбербанк. Я изучал опыт других каналов и ботов, мое решение по приему платежей оказалось в чем-то техническим ноу-хаю в текущей ситуации с блокировкой.

Я хочу узнать мнение у аудитории Pikabu на мой сервис, хочу предложить вам присоединиться к нему T.me/Allo812Bot и пополнить таким образом сообщество (сейчас оно n-тысяч), чтобы каждый мог регулярно экономить деньги и планировать поездки по маршрутам следования Сапсанов.

Если у вас есть идеи или советы, как правильно продвигать этот бот онлайн/оффлайн, мне будет тоже интересно это услышать. Спасибо

Игра Bastion Siege – новое творение

Доброго времени суток, Пикабу. Сегодня хочу представить вам своего второго бота, который по совместительству является многопользовательской текстовой стратегией. Встречайте – Bastion Siege.

Суть игры не на много сложнее предыдущей, опубликованной мною здесь полтора месяца назад. Строим, улучшаем, копим ресурсы и бьем стекла на очках врагам. Друзьям тоже можно помять оправу, впрочем все это полностью на ваше усмотрение.

На данный момент игра состоит из примитивов, которых по общему мнению было достаточно, чтобы запустить первую версию.

Игроку предоставляются владения в которых он может строить конкретные здания и улучшать их.

Изначально уже построены ратуша и дома. Ратуша отвечает за налоги и казну, дома необходимы для расселения новых жителей, которые в свою очередь являются источником рабочей силы, доходов казны, а так же необходимы для строительства личной армии. Чем больше свободных жителей (свободные жители – жители которые не работают и не состоят на службе, отображаются в информации главного меню), тем больше дохода в казну. Однако их в свою очередь нужно кормить. Голодные жители платят вдвое меньше. А если еды нет вовсе, приток жителей останавливается. Чтобы этого не случилось, вашим владениям понадобится ферма.

Ферма производит еду, необходимую для обеспечения жителей каждый игровой день (одна минута), а так же для организации военных походов. Но мало просто производить еду. Её еще необходимо доставить на основной склад, откуда уже и начнется потребление.

Склад является основным хранилищем таких ресурсов как еда, камень и дерево. Чтобы произведенные ресурсы доставлялись на склад, нужно нанять в нем рабочих, каждый из которых за игровой день будет посещать каждое производственное здание и доставлять на склад по единице ресурсов.

Здесь возникает самая частая проблема с едой, а точнее почему она не копится, а жители голодают. Чтобы полностью отгружать еду на склад, нужно чтобы рабочих на складе было больше или равно производству на ферме, ну а потребление жителями еды не превышало доставку на склад. Наверное это самая сложная истина в игре.

С деревом и камнем, в принципе, тоже самое. Рабочие доставляют на склад ресурсы и только тогда вы сможете улучшать ваши постройки.

Сезон и погода пока формальны и просто создают атмосферу для фантазии игроков. Но в дальнейшем на эти два параметра есть некоторые планы.

Наверное самая первостепенная цель игры – воевать с другими игроками за территорию и золото. Для этого понадобятся казармы. Изначально их у игрока нет. Это не позволяет атаковать, но так же защищает от возможности быть атакованным, что в свою очередь позволяет тихо, мирно разобраться в игре, почитать описание разделов.

Но как только игрок обзаведется казармами, о спокойно жизни можно забыть. Атаковать других игроков можно не чаще чем раз в 10 минут. Быть атакованным – раз в 30 минут. Бои длятся в зависимости от количества войск с обоих сторон. В текущей реализации у топовых игроков это время достигает до получаса. Бой происходит следующим образом – каждую секунду сталкиваются в поединке два воина каждой армии. Если армии равны по численности, то у каждого из воинов шанс убить другого равняется 45%. 10% остается на ситуацию, когда они убивают друг друга. При разнице количества войск процентное соотношение сдвигается на 5% (в отрицательную у меньшего войска и в положительную у большего). Побеждает тот игрок, чья армия выживет. В награду он получает часть казны и территории врага. И конечно же увеличивает счетчик побед.

Чтобы не повергать игроков в вечное ожидание ресурсов для апгрейдов, в игре есть возможность их покупать (или продавать излишки).

Также в игре есть примитивные рейтинги, чтобы хоть как-то оценить достижения игроков. Будут безусловно добавляться новые и перерабатываться старые, но на сегодняшний день текущих рейтингов более чем достаточно.

Это пока примерно полный перечень всего функционала игры. В ближайшем будущем планируется добавить осадные и защитные сооружения, которые будут влиять на вероятности побед в боях, а так же науку, которая в свою очередь так же будет улучшать некоторые аспекты игры, но конечно же не бесплатно (речь об игровых ценностях). Будет разработана систему случайных событий и квестов. Ну а о дальнейших планах разработка пока умалчивает.

Игра реализована на языке Go и до первого запуска на боевом окружении было потрачено примерно месяц вечеров разработки. Многие вещи в игре слабо освещены, есть некоторые неточности в описаниях, но со временем это будет исправлено и дополнено (я искренне надеюсь).

До сегодняшнего дня не было никакой рекламы бота, кроме внутренних кругов, но игровая реферальная программа сделала свое дело и в игре уже сложилось небольшое сообщество, которое вполне активно помогает в официальном чате новичкам осваиваться в игре.

Ключевой параметр в конце ссылки даст вам в подарок немного золота. 🙂

Ну а игровой чат, если он вам понадобится, вы найдете внутри игры без особого труда.

Вокодеры и синтезаторы речи

Вокодер (англ. voice coder — кодировщик голоса) — электронный музыкальный инструмент, устройство синтеза речи на основе произвольного сигнала с богатым спектром.

Изначально вокодеры были разработаны в целях экономии частотных ресурсов радиолинии системы связи при передаче речевых сообщений. Экономия достигается за счет того, что вместо собственно речевого сигнала передают только значения его определенных параметров, которые на приемной стороне управляют синтезатором речи.


Основу синтезатора речи составляют три элемента: генератор тонального сигнала для формирования гласных звуков, генератор шума для формирования согласных и система формантных фильтров для воссоздания индивидуальных особенностей голоса. После всех преобразований голос человека становится похожим на голос робота, что вполне терпимо для средств связи и интересно для музыкальной сферы.

Вокодер как необычный эффект был взят на вооружение электронными музыкантами и в последствии стал полноценным эффектом благодаря фирмам-изготовителям музыкального оборудования, которые придали ему форму и удобство музыкального эффекта.

Вокодер как музыкальный эффект позволяет перенести свойства одного (модулирующего) сигнала на другой сигнал, который называют носителем. В качестве сигнала-модулятора используется голос человека, а в качестве носителя — сигнал, формируемый музыкальным синтезатором или другим музыкальным инструментом. Так достигается эффект «говорящего» или «поющего» музыкального инструмента.

Помимо голоса модулирующий сигнал может быть и гитарой, клавишными, барабанами и вообще любым звуком синтетического и «живого» происхождения. Так же нет ограничений и на несущий сигнал. Экспериментируя с моделирующим и несущим сигналом можно получать совершенно разные эффекты — говорящая гитара, барабаны со звуком пианино, гитара звучащая как ксилофон.

Современные вокодеры можно поделить на аппаратные (с которых все и началось) и виртуальные (появились гораздо позже с развитием компьютерных технологий создания музыки). В практике компьютерного музыканта значительно чаще используются вокодеры виртуальные, реализованные в виде VST-плагинов (VST-pugins), так как они более гибкие в настройке.

Применяются подобные решения вокодеров не сами по себе, а совместно с программой-хостом. В качестве таковой может быть использована любая виртуальная студия, поддерживающая технологию VST, например, Cakewalk SONAR, Steinberg Cubase или Fruity Loops Studio. Программа хост позволяет подключать собственно сам вокодер, и выбирать откуда будет поступать несущий и модулирующий сигнал (некоторые вокодеры имеют встроенный синтезатор несущего сигнала) — с синтезаторов и семплеров (которые, кстати, имеют тоже формат VST), или c микрофонов и других подключенных к звуковой карте инструментов. А управление несущим сигналом осуществляется посредством MIDI команд, поступающих из MIDI-секвенсора или MIDI-клавиатуры в VST-плагин (синетзатор или сэмплер).

Примером виртуальных вокодоров могут служить VST плагины такие как — Steinberg Vocoder, Fruity Vocoder, Akai DC Vocoder, Voctopus, AC vocoder, Formulator, Lpc-vocoder, Darkoder, Cylonix (как работающий самостоятельно (standalone). Любой, знакомый с его принципиальным устройством, может собрать собственный вокодер в любой модульной програме типа NI Reactor/Generator, Max MSP, Buzz Composer.Примером аппаратного вокодера могут служить Электроника ЭМ-26 со встроенным синтезатором, Korg KAOSS PAD 3 (цифровой), Korg VC-10 Vocoder, Boss Vt1-Vocoder, Sennheiser Vocoder, Korg R3 Synth & Vocoder, KORG MicroKORG SYNTHESIZER & VOCODER, MAM VF11 Vocoder, Analog Lab Vocoder X32, Roland VP-330 Vocoder Plus, EMS Vocoder.

Видео: Вокодер на видео + звучание

Благодаря этим видео Вы можете ознакомиться с инструментом, посмотреть реальную игру на нём, послушать его звучание, ощутить специфику техники:

Ссылка на основную публикацию
Статьи c упоминанием слов:
Adblock
detector