Разработка низкоскоростного вокодера

  • автор:
  • специальность ВАК РФ: 01.04.13
  • научная степень: Кандидатская
  • год, место защиты: 1999, Москва
  • количество страниц: 150 с.
  • автореферат: нет
  • стоимость: 240,00 руб.
  • нашли дешевле: сделаем скидку
  • формат: PDF + TXT (текстовый слой)
pdftxt

действует скидка от количества
2 диссертации по 223 руб.
3, 4 диссертации по 216 руб.
5, 6 диссертаций по 204 руб.
7 и более диссертаций по 192 руб.
Титульный лист Разработка низкоскоростного вокодера
Оглавление Разработка низкоскоростного вокодера
Содержание Разработка низкоскоростного вокодера
Вы всегда можете написать нам и мы предоставим оригиналы страниц диссертации для ознакомления

СОДЕРЖАНИЕ

ВВЕДЕНИЕ
ГЛАВА 1 СИСТЕМА КОДИРОВАНИЯ РЕЧИ И ВОКОДЕР.
ОБЗОР ЛИТЕРАТУРЫ; ПОСТАНОВКА ЗАДАЧИ
1.1 Акустические особенности речевого сигнала
1.2 Модель системы обработка речевых сигналов
1.3 Критерии оценки характеристики кодирования речевого сигнала
1.4 Основные пути повышения качества кодирования речи
1.5 Постановка задачи
1.6 Выводы
ГЛАВА 2 ЛИНЕЙНОЕ ПРЕДСКАЗАНИЕ И ЕГО РЕШЕНИЕ
2.1 Модель линейного предсказания
2.2 Решения уравнений линейного предсказания
2.3 Рекурсивные алгоритмы автокорреляционного решения
2.4 Выбор частоты дискретизации , интервала анатиза , порядка
предсказания М и предыскажение сигнала
2.4.1 Частоты дискретизации
2.4.2 Порядок предсказания
2.4.3 Интервал анализа
2.4.4 Предыскажение сигнала
2.5 Разные группы параметров LPC и отношение между ними
2.5.1 Автокорреляционная функция R(I) и нормализированная автокорреляционная функция г(1)
2.5.2 Оптимальные коэффициенты предсказания {а,}
2.5.3 Коэффициенты PARCOR К—Км
2.5.4 Коэффициенты отношения площадей

2.6 Выводы
ГЛАВА З МЕТОДЫ ЛИНЕЙНОГО ПРЕДСКАЗАНИЯ РЕЧИ
3.1 Обзор
3.2 Линейное предсказание с возбуждения от основного тона
3.2.1 Метод простого возбуждения
3.2.2 Новая модель возбуждения—WCE модель
3.3 Линейное предсказание с многоимпульсным возбуждением
3.4 Линейное предсказание с возбуждения от остатка предсказания
3.5 Метод линейной спектральной пары
3.6 Выводы
ГЛАВА 4 ВОКОДЕР—АНАЛИЗ И СИНТЕЗ РЕЧЕВОГО СИГНАЛА
4.1 Введение
4.2 Модели LPC вокодеров и их основные описания
4.3 Кодирование и декодирование вокодеров
4.4 Вокодер с низкой скоростью передачи информации
4.4.1 Вокодер с возбуждением от основного тона (LPC vocoder)
4.4.2 Вокодер с возбуждения от остатка предсказания (REIB)
4.4.3 Вокодер с многоимпульсным возбуждением (MELP)
4.4.4 Вокодер с возбуждением от код-книги (CELP)
4.5 Векторное кодирование и его применение в вокодерах
4.5.1 Основное понятие векторного кодирования
4.5.2 Цель векторного кодирования
4.5.3 Применение векторного кодирования в вокодерных
системах
4.6 Техника кодирования с переменной скорости фреймов
4.7 Выводы
ГЛАВА 5 ПРЕДЛОЖЕНИЕ И АЛГОРИТМ ДЛЯ РЕАЛИЗАЦИИ

НИЗКОСКОРОСТНОГО ВОКОДЕРА
5.1 Основная цель и предварительные замечания
5.2 Предложение и структурная схема низкоскоростного вокодера
5.2.1 Особенности низкоскоростного вокодера
5.2.2 Структурная схема низкоскоростного вокодера
5.3 Алгоритм кодирования
5.3.1 Взвешивание входного речевого сигнала
5.3.2 Алгоритм ЕРС анализа
5.3.3 Алгоритм оценивания частоты основного тона
5.3.4 Алгоритм векторного квантования
5.3.5 Метод и тактика кодирования
5.4 Блок-схема вычисления и программа реализации
5.4.1 Общее описание программной реализации
5.4.2 Блок-схема и программа для ЬРС анатиза
5.4.3 Блок-схема и программа для оценивания ОТ
5.5 Экспериментальные результаты
5.6 Сравнительные оценки результатов и обсуждения
5.7 Задача будущего исследования и направление развития
5.8 Выводы
ЗАКЛЮЧЕНИЕ
ЛИТЕРАТУРА
ПРИЛОЖЕНИЕ
ПРИЛОЖЕНИЕ

Как известно, в телефонии полоса речевого сигнала занимает диапазон 300-3400 Гц. Чтобы предотвратить наложение спектров, необходимо дискретизировать сигнал с частотой , в 2 раза превышающей верхнюю граничную частоту сигнала. Характерные частоты дискретизации, использующиеся в вокодерных системах с низкой информационной скоростью передачи речи, лежат в диапазоне [6.8-—10 кГц]. Для точной оценки вокализованной речи частота дискретизации должна превышать 6.8 кГц, чтобы включить полосу речи по крайней мере до 3.4 кГц. Для точного представления фрикативных звуков необходимо иметь высокую частоту дискретизации. С другой стороны, применение высокой частоты приведет к повышению скорости передачи. Широко применяемыми частотами дискретизации являются 8 кГц и 10 кГц. В нашем низкоскоростном вокодерном применении мы выбираем 8 кГц.
2.4.2 Порядок предсказания
С практической точки зрения целесообразно использовать минимальное число параметров, необходимых для точного моделирования существенных характеристик сигнала. Как выбрать порядок линейного предсказания—это очень важный вопрос в низкоскоростной вокодерной системе с методом 1РС. Выбор порядка должен быть таким, чтобы обеспечить точность определения нужных характеристических параметров речевого сигнала при условия ишзких затрат вычисления. В 2.3 уже было показано, что оптимальная погрешность предсказания а снижается с увеличением порядка М. Эту закономерность изменения можно показать следующим выражением:
о=П [№7] - (2-22)
Вы всегда можете написать нам и мы предоставим оригиналы страниц диссертации для ознакомления

Рекомендуемые диссертации данного раздела