Начало
 
 


Yamaha Vocaloid
VirSyn Cantor

НовостиОборудованиеСтатьиФорумФайлыОрганизацииСсылкиПрайс-листыРекламаСловарьПоиск

 
  Виртуальные вокалисты
  Yamaha Vocaloid и Virsyn Cantor

Сергей Нечитайло
Музыкальное Оборудование
ноябрь 2004

Сравнение двух программ синтеза вокала.

Задачи, стоящие перед синтезаторами с момента их возникновения и по нынешний день, можно условно разделить на две основные категории. Это, во-первых, создание абсолютно новых звуков, эффектов и инструментов, а, во-вторых, — моделирование уже существующих. Совершенствование и расширение ассортимента методов синтеза позволило за относительно короткий срок добиться просто феноменальных результатов. Происходившие параллельно микроминиатюризация элементной базы электронных устройств, расширение использования цифровых технологий и, наконец, стремительное развитие компьютерной техники обеспечили условия для комбинирования разных способов звукообразования, более гибкого управления, существенного увеличения количества составных модулей, а главное, — общего кардинального повышения мощности синтезаторов.

Специализируясь на программных синтезаторах и постоянно отслеживая все более или менее значимые продукты на рынке современных музыкальных технологий, я уже давно перестал удивляться появлению различного рода новинок, каждый раз получающих сенсационные титулы "революции в моделировании", "прорыва в мире синтеза" и т. д., и т. п. Все эти виртуальные реинкарнации старых аналоговых инструментов, новомодные физмодели, навороченное компьютерное управление звукообразованием и исполнением я рассматриваю, скорее, как естественный результат современного технического прогресса. Даже программное воплощение уже не инструментов, а музыкантов, на них играющих (Virtual Guitarist, Groove Agent), или аранжировщиков (Band In Box, Onyx) я воспринял спокойно, хотя четко осознавал их отличие от обычных синтезаторов.

Однако возможность моделирования вокала и, тем более, — вокалиста, почему-то всегда казалась мне чем-то из разряда научной фантастики. То есть, понятно — рано или поздно это обязательно будет сделано, но... когда-нибудь позже. И вот в прошлом году мне на глаза попадается анонс программы Yamaha Vocaloid. Слушая демонстрации (еще на японском языке), я постоянно ловил себя на мысли, что это какой-то хитрый обман. Только вот удивляться-то было совершенно нечему — в операционных системах давным-давно имеется штатный компонент синтезатора речи (зайдите в Панель управления своего PC и кликните по пиктограмме Речь). Осталось лишь научить синтезатор петь...

Голосовой аппарат человека
Сначала давайте вкратце разберемся с физикой голосового синтеза и историей его развития. Прежде всего, посмотрим, как устроен голосовой аппарат человека — надо же хоть в общих чертах представлять себе предмет моделирования.

Человеческий голосовой (или речевой) аппарат представляет собой совокупность нескольких органов. Во-первых, это дыхательные органы (легкие, бронхи, трахея, диафрагма, межреберные мышцы), работа которых создает воздушный поток — движущую силу любой речи или пения. В зависимости от фазы дыхания (вдоха или выдоха) поток движется по дыхательным путям в двух противоположных направлениях. Фактически все процессы звукообразования при пении или во время разговора осуществляются на выдохе. Стоит отметить, что встречаются случаи (некоторые языки, особые техники вокала, фольклор и т. п.), когда звуки извлекаются и на фазе вдоха, но поскольку это скорее редкое исключение, чем правило, в рамках данной статьи я к ним больше возвращаться не буду.

Во-вторых, это пассивные голосовые органы: зубы, альвеолы, твердое небо, носовая полость, глотка и гортань. Они являются неподвижными и служат точкой опоры для активных органов.

В-третьих, это активные голосовые органы, которые подвижны и производят основную работу артикуляции: язык, губы, мягкое небо, маленький язычок, надгортанник и голосовые связки.

И, наконец, в-четвертых, это мозг — "центральный процессор" человеческого организма, который отвечает за управление и координацию дыхательных и активных голосовых органов (естественно, помимо всего прочего).

На пальцах, работу голосового механизма (то есть процессы звуко- и словообразования) для более удобного восприятия можно схематично представить следующим образом. Выработка "основного сигнала" голоса, который имеет свои тембровые особенности и может варьироваться по громкости и частоте, осуществляется органами дыхания и голосовыми связками. Различные способы модуляции этого "несущего" сигнала, то есть придание "чистому" голосу способности передавать речевую информацию, производятся пассивными и активными голосовыми органами. Оба процесса должны действовать в жесткой взаимосвязи друг с другом, что и происходит при помощи синхронного управления ими из одной "высшей" инстанции — мозга. Вам не кажется, что эта схема очень напоминает конструкцию синтезатора или радиопередатчика? Налицо блок генератора "несущей" (или аддитивно-субтрактивная часть синтезатора), блок модуляции и т. п.? Неужели, человеческая речь является настолько сложной субстанцией, чтобы ее нельзя было с тем или иным успехом смоделировать? Оказывается, это вполне возможно. Давайте сперва посмотрим, что она собой представляет "под микроскопом".

Речь
С физической точки зрения речь человека представляет собой определенную последовательность звуков разного типа, которые могут быть тональной, шумовой или смешанной структуры. Если произносятся тональные или смешанные звуки (гласные, носовые, звонкие согласные, они еще называются voiced — вокализованными), голосовые связки вырабатывают периодические колебания выходящей из легких воздушной струи той или иной частоты. Эти колебания воздушного потока возбуждают полости голосового тракта, которые являются природными резонаторами. Во время разговора геометрические размеры и форма этих полостей меняется, что приводит к изменению и их резонансных частот, или формантных частот. Если же произносятся звуки шумового характера (их еще называют глухими, или devoiced — невокализованными), голосовые складки "выключаются" из процесса звукообразования. Проходя через суженные ротовую и носовую полости, воздух создает турбулентные завихрения и порождает непериодические шумоподобные колебания. Еще одна группа звуков образуется "взрывным" способом, когда речевой тракт резко открывается после предварительного усиления давления воздуха в ротовой полости. Они могут быть как глухими, так и звонкими, — в зависимости от участия в звукообразовании голосовых связок.

Последовательности гласных и согласных, звонких и глухих, свистящих, шипящих и остальных звуков речи произносятся слитно с разделительными паузами, разграничивающими отдельные слова или иногда даже слоги. Эта слитность произношения обуславливает взаимное влияние соседних звуков друг на друга. Таким образом, в различных сочетаниях одни и те же звуки речи могут звучать по-разному. Поэтому современная лингвистика рассматривает полный набор звуков конкретного языка не как сумму типовых гласных и согласных (как правило, соответствующих буквам алфавита), из которых строятся слова, а как общее количество всех участвующих в произношении неповторимых звуков. Казалось бы, таких звуков должно быть бесчисленное множество — ведь, во-первых, разным людям присущи и разные размеры органов речи, а, во-вторых, индивидуальная манера произношения так же уникальна, как, например, отпечатки пальцев или рисунок сетчатки глаза. Тем не менее, при всех упомянутых различиях носители конкретного языка оперируют довольно небольшим количеством звуков. Такие звуки называются фонемами, и их несколько больше, чем букв в алфавите. Например, английский язык содержит сорок одну неповторимую фонему при двадцати шести буквах алфавита. Однако фонемы фонемами, но простым построением цепочек из них не обойдешься — оказывается, одни и те же фонемы в разных сочетаниях имеют различное звучание. Плюс ударение в слове — ударные и безударные гласные даже в одинаковых сочетаниях с соседними фонемами звучат неодинаково. Поэтому кирпичиками, из которых строится речь, современные лингвисты считают не только разные варианты произношения фонем — аллофоны, но и созвучия из двух фонем (дифоны) и даже трех (трифоны).

Ко всему этому следует добавить и такой важный фактор речи, как интонацию — без правильного интонирования даже самые ювелирные построения фонем будут иметь механическое звучание. Человеческая речь очень богата на интонации — не то что отдельные слова, а целые предложения могут кардинально менять смысл сказанной информации только при помощи разного интонирования. Если же мы немного вернемся к теме статьи (посмотрим на речь с точки зрения вокального искусства), то увидим, что при изменившейся роли интонации (она используется главным образом для мелодического интонирования) добавляется большое количество дополнительных средств выразительности: экспрессия, вибрация, более широкое динамическое "дыхание". И все это надо держать в голове, решая проблему синтеза, так как и вокал, и простая речь воспринимаются и оцениваются человеческим ухом гораздо тоньше, чем большинство музыкальных инструментов. Малейший артефакт в звучании имитируемого голоса может загубить даже очень совершенную модель синтезатора, в то время как гораздо большие огрехи в моделировании различных музыкальных инструментов проходят мимо наших ушей фактически незамеченными.

Немного истории
Рис. 1 Первые попытки создать говорящую машину начались во второй половине XVIII столетия — то есть задолго до появления не только компьютеров и синтезаторов, но даже использования человечеством электричества. Возможность создания такой машины в 1761 году высказывал еще великий Леонард Эйлер (Leonard Euler) в своих знаменитых "Письмах к немецкой принцессе". В 1773 году в Копенгагене известный ученый Христиан Готлиб Кратценштейн (Christian Gottlieb Kratzenstein — физик, медик, механик; между прочим, почетный иностранный член Российской Академии Наук, рис. 1) занимался любопытными экспериментами — при помощи акустических резонаторов разной формы (рис. 2), соединенных с трубами органа, он добился узнаваемого воспроизведения различных гласных звуков.


 
Рис. 2  
   

Рис. 3

В это же время известный венгерский инженер и изобретатель Вольфганг фон Кемпелен (вошедший в историю не только как создатель первого в мире речевого синтезатора, но и как конструктор Шеннбруннских фонтанов, пишущей машинки для слепых, автоматического шахматиста, а также многого другого, рис. 3), начал собственные опыты, которые подвигли его на изобретение и постройку рабочего образца механического оратора. Детальное описание и схемы-иллюстрации машины были опубликованы в его книге "Механизм человеческой речи и описание говорящей машины" (Mechanismus der menschlichen Sprache nebst Beschreibung einer sprechenden Maschine), вышедшей в свет в 1791 году. Устройство фон Кемпелена позволяло воспроизводить не просто отдельные звуки речи, но целые слова и даже короткие предложения. По утверждению изобретателя, за три недели можно было научиться довольно свободно управлять машиной, особенно если "говорить" при ее помощи на латинском, французском или итальянском языке, в то время как немецкий был более сложен для освоения из-за его многочисленных закрытых слогов и последовательностей из согласных звуков.

Машина фон Кемпелена представляла собой механическую модель человеческого голосового аппарата. Роль дыхательной системы исполняли мехи, в качестве голосовых связок использовались проскакивающие язычки из слоновой кости (ну, как в язычковых музыкальных инструментах), ротовая полость и носовые ходы имитировались специальными камерами, сделанными из каучука. Струя воздуха из мехов поступала в "ротовую полость" не только через язычковый "генератор" частоты, но также и по отдельному каналу, что позволяло увеличивать давление в камере при плотном закрытии "рта" для получения взрывных фонем. Плюс к этому машина имела небольшие мехи (приводимые в действие пружиной), которые производили дополнительный выброс потока воздуха. Участие в звукообразовании "носовой составляющей" регулировалось открытием или закрытием деревянных "ноздрей". Управление машиной осуществлялось при помощи обеих рук оператора — предплечьем правой руки качали мехи, а пальцами воздействовали на три рычага, отвечавшие за отдельные фонемы, и управляли "ноздрями", в то время как левой рукой управляли параметрами резонанса "рта", открывая и закрывая его.

Стоит заметить, что из-за несовершенства отдельных узлов конструкции (например, форма "рта" оставалась всегда неизменной, были и другие огрехи), машина, вполне удобоваримо выговаривая отдельные фонемы, весьма фальшиво воспроизводила другие. Хуже всего дело обстояло с согласными "д", "т", "г", "к", а некоторое подобие "л" оператор мог получить, лишь засунув большой палец в каучуковый "рот". Кроме того, в первоначальной конструкции говорящей машины изобретатель не предусмотрел возможность изменения длины звукообразующих язычков в процессе работы (то есть, произвольного изменения высоты голоса), в связи с чем она говорила очень монотонно, безо всякого намека на интонацию. В более поздней версии аппарата фон Кемпелен добавил эту функцию, что здорово оживило речь говорящей машины.

Окончательный вариант машины фон Кемпелена пережил свое время и находится сейчас в стенах одного из крупнейших музеев Европы — мюнхенского Немецкого Музея (Deutsches Museum). Механизм устройства действует до сих пор — работа машины напоминает речь ребенка или очень громко говорящего взрослого. На рис. 4 показан общий вид говорящей машины фон Кемпелена, рис. 5 демонстрирует ее внутреннее устройство.

Рис. 4

Рис. 5

В XIX веке было сконструировано немало говорящих машин. Однако все они с большим или меньшим успехом использовали те же принципы, что и аппарат фон Кемпелена, — механическое моделирование человеческих органов речи, и я не вижу смысла останавливаться на них в рамках данной статьи. Конечно, читатели, знакомые с историей развития речевых (и не только) синтезаторов, вспомнят и реконструкцию машины фон Кемпелена известным физиком Чарльзом Уитстоуном (Charles Wheatstone), показанную последним в 1835 году в Дублине и обладавшую более внятным произношением, чем ее прототип (рис. 6 — видно воздействие левой руки оператора на каучуковый "рот"). Вспомнят они и юношеские эксперименты будущего изобретателя телефона Александра Белла, который, увидев в 1861 году в Лондоне работу машины Уитстоуна, настолько загорелся этой идеей, что по возвращении в США вместе со старшим братом построил свой вариант говорящей машины, впрочем, не отличавшийся принципиально от реконструкции Уитстоуна.


 
Рис. 6  
   

Отдельного разговора заслуживает, пожалуй, только устройство, сконструированное немецким изобретателем Йозефом Фабером (Joseph Faber) в 1835 году (рис. 7), вдохновившемся вышеупомянутой книгой фон Кемпелена. Машина была названа изобретателем "Euphonia" и имела несколько новых интересных технических решений — в частности, в ней моделировались язык и полость глотки, форма которой управлялась оператором. Но самым интересным (с точки зрения темы статьи) было то, что Euphonia умела не только разговаривать (как в полный голос, так и шепотом), но и... петь. Во время демонстрации говорящей машины в Лондоне в 1846 году Euphonia ухитрилась спеть национальный британский гимн "God Save The Queen". Таким образом, она оказалась, видимо, первым в мире искусственным певцом.

Рис. 7

Управление машиной получилось более рациональным, так как привод действия механических легких (мехов) был вынесен на ножную педаль. Все остальные команды — изменение высоты тона, параметры артикуляции и т. п. — отдавались со специальной клавиатуры (рис. 8). К сожалению, автору так и не удалось "раскрутить" свое поистине замечательное изобретение (не помогли даже демонстрации машины в Америке), и история с Euphonia завершилась на совсем грустной ноте — в 50-х годах Фабер уничтожил свое детище, после чего покончил жизнь самоубийством.

Рис. 8

Попытки создания механических моделей речевого аппарата продолжались и дальше, например, уже в XX веке в 1937 ученый из США Риш (R.R. Riesz) придумал гораздо более совершенную конструкцию (рис. 9 и рис. 10). Как видите, это дальнейшее развитие все той же идеи фон Кемпелена, только гораздо более совершенное — при помощи десяти клавиш (напоминающих кнопки-клапаны трубы) оператор двумя руками мог управлять фактически всеми движущимися частями человеческого голосового тракта. По отзывам очевидцев, машина (даже внешне напоминающая музыкальный инструмент) говорила весьма разборчиво — в качестве примера высокого уровня артикуляции приводили очень отчетливо произнесенное слово "cigarette".


 
  Рис. 9  
   

 
  Рис. 10  
   

Способы физического моделирования речевого аппарата человека существуют и по сей день. Изменились только средства достижения результата — теперь изобретателю не требуется изготовлять сложные конструкции из металла или каучука, так как современный уровень развития науки и вычислительной техники позволяют ему создавать математические модели любой сложности, которые обретают жизнь в виртуальном мире компьютеров.

Однако моделирование голосового тракта человека (неважно, какое оно, компьютерное или механическое) — это лишь один из подходов к решению задачи. Тем более, в XX веке — эпохе широкого использования человеком электричества и бурного развития радиоэлектроники.

Первое в мире полностью электрическое устройство для синтеза голоса было создано Джеймсом Стюартом (James Stewart) в 1922 году. Синтезатор имел зуммер в качестве исходного сигнала и два резонансных контура, моделирующих акустические резонансы голосового тракта. Аппарат мог издавать отдельные гласные звуки с двумя нижними формантами, но не умел имитировать ни согласных фонем, ни связных слов.

Знатоки истории вспомнят и синтезатор Вагнера (Wagner) с четырьмя параллельно включенными резонаторами, и "открытие" японскими исследователями Obata и Teshima в 1932 году третьей форманты для гласных фонем. Однако первым полнофункциональным речевым синтезатором вошел в историю VODER Хомера Дадли. Впрочем, я немного забегаю вперед.

Важнейшей вехой в истории синтеза речи стало изобретение в 1928 году ученым-физиком Хомером Дадли (Homer W. Dudley — рис. 11) из компании Bell Laboratories устройства под названием вокодер (Vocoder). Предназначением вокодера являлось повышение пропускной способности каналов передачи речевой информации — линий телефонной связи. Исходная речь подвергалась анализу, далее данные этого анализа передавались, и на их основе речь заново синтезировалась уже на приемной станции. Чтобы это понять, постарайтесь представить голос в виде несущего сигнала определенной частоты, который во время разговора при помощи органов речи подвергается разным видам модуляций. Снятая анализатором характеристика этих модуляций была значительно меньше по объему, нежели обычная, некодированная речь. Вокодер Хомера Дадли был полосовой, то есть при анализе исходный сигнал разбивался по спектру на несколько частотных полос, в каждой из которых отслеживалось изменение амплитуды. Общая картина изменений амплитуды во всех полосах весьма точно описывала модуляционные воздействия речевого аппарата на голос. Таким образом, по линии связи передается не широкий по спектру сигнал некодированной речи, а лишь данные изменения амплитуды в полосах частот анализатора. Блоку восстановления (синтезатору) оставалось лишь повторить изменения амплитуды в тех же полосах частот — и на выходе прибора воссоздавалась исходная речь. Использование вокодера позволяло уменьшить необходимую ширину полосы пропускания частот, занимаемую каналом связи, до 250-350 Гц (по сравнению с тремя килогерцами без него), позволяя увеличить пропускную способность телефонной линии на целый порядок. Причем коэффициент слоговой артикуляции (то есть разборчивость речи) уменьшался на какие-то единицы процентов (83-85% с использованием вокодера против 90-91% обычной линии).

Рис. 11

Конечно, полосовой вокодер еще не верх совершенства, но прогресс не стоит на месте, и со временем появились вокодеры, анализирующие и воссоздающие исходный сигнал другими способами — формантные вокодеры, гармонические вокодеры, гомоморфные вокодеры, вокодеры с линейным предсказанием сигнала и т. д. В рамках данной статьи я не буду останавливаться на подробном описании принципа их действия, равно как и на широком использовании вокодера в современной музыке как самостоятельного эффекта.

Надеюсь, вы понимаете ценность изобретения вокодера в контексте задачи синтеза речи? Говоря проще, самый первый вокодер Хомера Дадли уже позволял полностью воссоздавать речь с качеством, не сильно отличающимся в худшую сторону от передачи той же речи по телефону. Конечно, это еще далеко не все, так как синтезатор приемной станции непрерывно получал сигналы управления — характеристику артикуляции исходного голоса, и ему не приходилось заново воссоздавать произношение и строить слова, как, например, операторам машин фон Кемпелена или Фабера. Зато вокодер представлял собой новую и очень перспективную технологию голосового синтеза, которая с самого своего возникновения показала отличный результат. Говоря фигурально, искусственный собеседник получил вполне качественный (по меркам своего времени) речевой аппарат, и можно было переходить к более высокоуровневым задачам — учить его говорить самостоятельно.

В 1939 году на Всемирной Выставке в Нью-Йорке и Сан-Франциско компания Bell Laboratories представила на суд общественности созданный Хомером Дадли в 1936 году полнофункциональный голосовой синтезатор под названием VODER — сокращение от Voice Operating Demonstrator (рис. 12).

Рис. 12

В основе синтезатора лежал принцип воссоздания речи вокодера. Как и механические говорящие машины, VODER управлялся оператором и служил, скорее, демонстрацией возможностей данного типа речевого синтеза (как это, впрочем, и следует из его названия), нежели устройством, готовым к широкому использованию. Конструктивно VODER имел переключатель типа исходного сигнала (тональный или шумовой) и педаль управления основной частотой. Исходный сигнал пропускался через десять полосовых фильтров, уровни выхода которых управлялись пальцами при помощи клавиш. Три дополнительные клавиши отвечали за имитацию взрывных согласных. Окончательный сигнал поступал на усилитель мощности и выводился через динамик (рис. 13). Требовался недюжинный навык со стороны оператора, чтобы "сыграть" на синтезаторе слово или фразу (любопытно, что в 1961 году девушка-оператор даже по прошествии двадцати лет после описанных событий сумела успешно привести синтезатор в действие). Нельзя сказать, что VODER обеспечивал прямо-таки идеальное качество синтезируемой речи, но возможности новой технологии демонстрировались им отлично, а главное, он подвиг многих ученых на дальнейшие изыскания в области речевого синтеза. Надо сказать, что и многие современные речевые синтезаторы имеют архитектуру, сходную с VODER.


 
  Рис. 13  
   

Совершенно иной принцип синтеза речи был разработан в конце сороковых годов прошлого века в стенах частного научно-исследовательского института Haskins Laboratories группой ученых под руководством Франклина Купера (Franklin S. Cooper, рис. 14).

Рис. 14

Способ получил название Pattern Playback (буквально — "воспроизведение образца"). В 1950 году было завершено создание самого синтезатора, который служил главным образом для исследований распознавания и восприятия речи и представлял собой как бы звуковой спектрограф навыворот. Конструкция аппарата была следующая (рис. 15).


 
Рис. 15  
   

Луч света направляется на вращающийся диск, который является ни чем иным, как куском фотопленки с проявленными на нем пятьюдесятью концентрическими полосками — оптическим представлением звуковых колебаний разных частот (аналогичным способом на киноленту записывается звуковое сопровождение). Частоты дорожек были подобраны таким образом, что представляли собой базовую частоту и 49 ее гармоник. При рабочей скорости вращения диска (1800 оборотов в минуту) основная частота равнялась 120 герцам, а частота последней гармоники — 6 килогерцам. Пропущенный через крутящийся "тональный диск" (tone wheel) луч света, отражаясь от зеркала, проходит через пленку со спектрограммой и попадает на фотогальванический элемент и дальнейшую электронную схему (усилитель, динамик), преобразующую световое давление каждой дорожки в звуковые колебания соответствующих частот. Картинка спектрограммы на пленке, пропуская или отражая поток света дорожек, определяет уровни громкости каждой из гармоник. Поскольку пленка перед фотоэлементом находится в движении, можно динамически изменять частотный состав синтезируемого звука, "подсовывая" под луч разные картинки спектрограмм, то есть шаблоны, паттерны. Если на пленку последовательно поместить спектральные снимки человеческой речи — аппарат заговорит, хотя и монотонно (без интонаций), так как из-за фиксированной скорости вращения тонального диска частота голоса будет неизменной. Само собой, кроме реально снятых спектрограмм речи можно было проигрывать и картинки, нарисованные от руки. На рис. 16 показано спектрографическое изображение на ленте синтезатора фразы "Four hours of steady work faced us". Обратите внимание на участки ленты, заштрихованные точками, — таким образом осуществлялась запись шумовых составляющих речевого сигнала.


 
Рис. 16  
   

Звучал синтезатор Pattern Playback очень разборчиво, хотя речь больше напоминала голос робота, нежели человека. На рис. 17 показано само устройство.

Рис. 17

Хотя идея Pattern Playback была оригинальна и перспективна, все же синтезатор являлся в какой-то степени уникальным, так как в связи с развитием радиотехники большее распространение получили целиком электронные системы синтеза речи. В большинстве таких систем, которые были разработаны и сконструированы, начиная с 50-х годов XX века, обычно прослеживалось общее направление — исходный электрический сигнал обрабатывался частотным фильтром. Исходный сигнал был либо тональным для вокализованных звуков речи, либо непериодическим (шумовым) для невокализованных составляющих. Фильтр использовался для имитации резонансных свойств голосового тракта. В те времена существовали два принципиально различающихся подхода к решению этой задачи. В первом из них для моделирования артикуляции использовались целые каскады из огромного количества электрических цепей, каждая из которых отвечала буквально за отдельный миллиметр голосового тракта. Другой способ был проще — относительно небольшое количество резонансных контуров моделировало уже готовые форманты, то есть резонансы голосового тракта, независимо от его формы.

Практически одновременно в 1953 году появились два первых динамически управляемых формантных синтезатора — PAT Вальтера Лоуренса (Walter Lawrence) и OVE Гуннара Фанта (Gunnar Fant). PAT (Parametric Artificial Talker) конструктивно состоял из трех электронных формантных резонаторов, включенных параллельно. Входной сигнал мог быть либо шумовым, либо тональным (гудение зуммера). При помощи специальных шаблонов осуществлялось управление параметрами резонаторов, основной голосовой частоты, уровнями тонального и шумового сигналов. OVE (Orator Verbis Electris — на рис. 18 синтезатор показан вместе с его изобретателем) использовал другую архитектуру. Его формантные резонаторы соединялись последовательно, причем два из них, отвечавшие за самые нижние форманты, управлялись по частоте. Также регулировались параметры "голоса" — его частота, амплитуда и т. п. Первоначальный OVE был предназначен для синтеза только гласных звуков. Дальнейшие модификации добавили ему управление амплитудой формант и отдельный контур для фрикативных звуков (тип согласных, например, "f", "t", "s", "h"). Впоследствии синтезатор был переконструирован по каскадной схеме. Новый OVE — OVE II стал использовать отдельные блоки, моделирующие работу голосового тракта для гласных звуков и согласных фонем разного типа (носовых, фрикативных, т. п.). В качестве голоса использовались тональные звуки и разные типы шумов. Потом были созданы еще более совершенные модели: OVE III и GLOVE, а в конечном итоге развитие принципов проекта OVE легло в основу коммерческой "говорящей" системы Infovox, существующей в настоящее время.

Рис. 18

К сожалению, в одну статью при всем желании даже вкратце не впихнешь информацию, которой хватит на добрую пару томов. Я мог бы рассказать и о первом артикуляционном синтезаторе DAVO, и о формантном синтезаторе POVO, и о системах с линейным предсказанием, и о многом другом, но, боюсь, и так уже перешел все мыслимые границы. Поэтому, заканчивая повествование об истории синтеза речи, скажу, что после 1970-х годов дальнейшие разработки в этой области велись в основном с использованием компьютерной техники. Ее развитие позволило моделировать сами устройства (физические, акустические, электронные), с помощью которых раньше моделировалась речь. Компьютеры позволили, наконец, применить наработанные за много лет технологии для практического использования и создать системы, преобразующие написанный текст в звучащую речь. Такие системы получили название Text-to-Speech Systems (TTS). Ранее я уже писал, насколько тонким процессом является соединение звуков речи в разборчивые слова. Однако прежде надо решить еще одну нелегкую задачу — преобразовать текст в последовательность фонем. Человеку, которого учили читать с детских лет, на первый взгляд эта задача кажется простой. Но попробуй научи читать машину! Ведь сам текст несет крайне мало информации о произношении написанного. Кроме того, в тексте постоянно встречаются различные аббревиатуры, сокращения и прочие элементы, распознаваемые человеком не только по устоявшимся правилам, но порой и по контексту изложения. Существуют два типовых подхода к решению задачи. Первый из них предлагает создать исчерпывающий словарь произношений, а второй — научить машину правилам чтения. Создать абсолютный словарь — задача чисто физически невозможная. Не говоря уже о том, что современный язык имеет огромный словарный запас, и работа по составлению такого словаря может быть выполнена только вручную, живой язык постоянно обновляется и словарь придется систематически пополнять. В то же время создание правил транскрибирования тоже не панацея, поскольку нельзя предугадать все ситуации, слова-исключения, аббревиатуры, да и грамматические ошибки, наконец. Поэтому на практике получила развитие комбинация обоих методов — то есть и создают правила произношения, и составляют словарь исключений. Кроме того, перед транскрибированием текст анализируется — проверяется грамматика, расшифровываются сокращения и аббревиатуры и т. д. Производится даже морфологический анализ — для синтезирования правильной интонации в предложениях (например, вопросительной или восклицательной).

Первую полнофункциональную TTS-систему для английского языка разработал Норико Умеда (Noriko Umeda) в Японии в 1968 году. Она обеспечивала вполне разборчивую речь, но была еще сильно далека по качеству от современных систем. В 1979 году появилась коммерческая TTS-система MITalk, разработанная в стенах Массачусетского Технологического Института (Massachusetts Institute of Technology) и изначально позиционировавшаяся как читающая машина для слепых. А двумя годами позже увидела свет еще одна TTS — Klattalk, созданная Дэннисом Клаттом (Dennis Klatt), одним из разработчиков MITalk. Технологии анализа, транскрибирования и синтеза речи, которые применялись в MITalk и Klattalk, сформировали базу, лежащую в основе многих современных TTS-систем, например, таких, как DECtalk и Prose-2000. Этот список можно продолжать еще долго — вплоть до широкого распространения компьютерных программ-читалок, приложений для надиктовывания текста (то есть преобразования речи в текст) и т. п. Думаю, любой из вас неоднократно сталкивался с подобными программами.

Однако давайте вернемся к теме синтеза вокала и посмотрим, являются ли Yamaha Vocaloid и Virsyn Cantor первопроходцами в этой области (конечно после неоспоримого первопроходца — Euphonia Йозефа Фабера)?

Знакомьтесь — VocalWriter
Оказывается, нет, поскольку еще в 1998 году (то есть задолго до появления сегодняшних виртуальных исполнителей) компания KAE Labs выпустила свой вокальный синтезатор VocalWriter, который и стал первым в мире программным певцом. Расскажу о нем в двух словах, так как VocalWriter является прямым предшественником и Vocaloid, и Cantor.

Программа (рис. 19) написана только для платформы Apple Macintosh (точнее, для компьютеров Power Macintosh с операционной системой MacOS 7.5.3 и выше) и представляет собой фактически автономную музыкальную станцию, так как кроме собственно виртуального вокалиста является неплохим MIDI-редактором и звуковым модулем архитектуры General MIDI для остальных инструментов аранжировки. Помимо более чем полного набора инструментов General MIDI (245 разных пэтчей), VocalWriter предлагает более восьмидесяти пяти моделей голосов — от вполне человеческих (во всяком случае, по замыслу авторов) до совершенно "инопланетных". Синтез вокала осуществляется при помощи запатентованной технологии акустического моделирования RAS (Resonant Articulatory Synthesis) и позволяет имитировать человеческое пение на английском языке. Чтобы создать вокальную партию, требуется сначала подготовить мелодическую линию, для каждой ноты которой вписываются слоги или слова текста песни. Используя свой специальный фонетический словарь (более чем 100000 отдельных слов), VocalWriter рассчитывает все необходимые параметры: произношение, размер и синхронизацию слогов, а также остальные составляющие голосовой модели. Если, тем не менее, запаса словаря оказывается недостаточно, его можно произвольно пополнять и редактировать.

Рис. 19

Поскольку VocalWriter — синтезатор полифонический и мультитембральный (у вокального синтезатора четырехголосная полифония и четырехчастная мультитембральность, а у звукового модуля — полифония 48 голосов и 32 части мультитембральности), аранжировка может содержать несколько вокальных дорожек, исполняемых разными "певцами". Кроме того, вокальные треки реагируют на команды стандартных MIDI-контроллеров (Pitch Bend, Volume, Program Change и т. п.) и имеют свои уникальные регулировки: Brightness (яркость), Glide Rate (скорость глиссандо), Chorus (хорус) и Aspiration (уровень придыхания).

MIDI-часть VocalWriter предлагает 32 независимых трека, клавишный редактор MIDI-событий, все необходимые инструменты редактирования, возможность рендеринга работы в аудиофайл формата AIFF, функции импорта и экспорта стандартных MIDI-файлов. Также поддерживается функция импорта текста для караоке (KAR). Из эффектов присутствует, увы, один ревербератор (не считая хоруса для вокальных партий).

VocalWriter — это условно бесплатная (shareware) программа, которую до сих пор можно скачать с сайта разработчиков (www.kaelabs.com). Никаких ограничений на функциональность VocalWriter ознакомительный период не накладывает — все будет работать, как и в зарегистрированной версии. Регистрационный ключ стоит 99$ — приобретя его, вы не только снимете пятнадцатидневный лимит на использование программы, но и получите по почте "бумажный" мануал. Не знаю уж, пригодится ли кому VocalWriter в работе, но звуковые примеры с сайта KAE Labs скачайте и послушайте обязательно.

Если уж подходить к делу совсем буквоедски, можно упомянуть еще одного виртуального вокалиста. Речь идет о модуле Virtual Singer компании Myriad Software (www.myriad-online.com), который опционально входит в состав их музыкальных программ Melody Assistant и Harmony Assistant. Virtual Singer отличается ценой всего в двадцать долларов и даже может вполне разборчиво петь на нескольких языках, но для сколько-нибудь серьезного применения, на мой взгляд, вряд ли подходит. Если интересно, можете скачать демонстрации его звучания с сайта разработчиков.

Ну а сейчас давайте посмотрим на более современные решения в области вокального синтеза.

Yamaha Vocaloid
По своим задачам Vocaloid не отличается от VocalWriter, даже интерфейс и основные функциональные модули у обоих синтезаторов одинаковые. Инструмент имеет собственный секвенсор на шестнадцать треков и MIDI-редактор, в котором можно создавать мелодические линии вокальной партии и вводить исполняемый текст. В процессе работы Vocaloid осуществляет преобразования слов песни в фонетические последовательности звуков и пропевает их, интонируя по соответствующим нотам мелодической линии. Для оживления вокальной партии предлагается набор регулировок, отвечающих за выразительность исполнения и параметров голоса. Вот, вроде бы, и все. Однако если послушать демонстрационные записи Vocaloid, становится понятно, что это не просто очередная интересная разработка, а безо всякого преувеличения — новое слово в области вокального синтеза, так как "поет" инструмент самым настоящим человеческим голосом. Помните, какой прорыв в имитации гитары в свое время сделал замечательный VST-инструмент Steinberg Virtual Guitarist (см. МО, сентябрь 2003)? Вот подобного в своей области добился и Vocaloid. Только, в отличие от Virtual Guitarist, последний не ограничен количеством забитых в него ритмических паттернов и предоставляет пользователям полную свободу действий. Словом, виртуальный певец будет петь для вас что угодно, когда угодно, сколько угодно и как угодно. Надо лишь научиться правильно с ним обращаться.

Сам по себе Vocaloid является "голым" программным вокальным синтезатором — так сказать, лишь основой для синтеза, движком. Его создатель, компания Yamaha, заключила лицензионные соглашения с рядом фирм, по которым последние будут создавать виртуальных певцов для использования с движком Vocaloid. Каждый из таких виртуальных вокалистов является, по сути, семплерной базой данных, созданной на основе записей живых исполнителей. От настоящих вокалистов их виртуальные прообразы унаследовали многие индивидуальные черты — пол, особенности голоса, язык и даже возможности работы в том или ином музыкальном стиле. Первой компанией, создавшей виртуальных вокалистов для Vocaloid, оказалась английская фирма Zero-G. Сначала, в январе 2004, аккурат к зимней выставке NAMM в Лос-Анджелесе, была выпущена "сладкая парочка" — Lola и Leon (рис. 20), а несколькими месяцами позже, к мартовской выставке Musikmesse во Франкфурте, подтянулась и Miriam (рис. 21). Последняя была создана на основе голоса певицы Мириам Стокли (Miriam Stockley) из коллектива Adiemus.

Рис. 20

Рис. 21

Таким образом, коммерческая версия Vocaloid представляет собой сочетание двух базовых составляющих. Первая из них — это ямаховский синтезаторный движок. Он отвечает за секвенсорную часть инструмента, которая обеспечивает возможность создания и редактирования мелодических и текстовых данных, и непосредственно вокального синтезатора, преобразующего проигрываемые секвенции в пение. Второй составляющей являются библиотеки певцов — именно их содержимое и превращается синтезатором в пение.

Разработанная компанией Yamaha технология вокального синтеза использует для звукообразования образцы живого человеческого голоса. Создавая виртуальных певцов, разработчики компаний Zero-G и Yamaha записывали профессиональных вокалистов, которые пропевали все возможные фонемы, их сочетания и переходы между слогами. Звучание сочетаний и переходов может в той или иной степени отличаться в зависимости от образующих их фонем. А эти отличия играют большую роль как в разборчивости речи, так и в оценке ее естественности. Например, согласная "p" звучит по-разному в начале и в конце слова, и воздействие на последующую гласную у нее иное, чем, скажем, у "t".

Записи вокалистов были переведены при помощи преобразования Фурье в частотную область и нарезаны на тысячи отдельных фонем и фонетических переходов, которые были хитрым образом обработаны и помещены в специальную базу данных для использования с движком Vocaloid. Для пущего правдоподобия элементы выразительности типа вибрато, атаки и плавного изменения высоты тона также были "сняты" с живых исполнителей и помещены в общую базу.

Во время синтеза вокальной партии Vocaloid склеивает из "нарезки" семплов базы данных фонетические последовательности, соответствующие введенному пользователем тексту песни. Преобразование текста в последовательности звуков речи осуществляется при помощи специального словаря произношений. Вот небольшая иллюстрация процесса. Для примера возьмем слово "my". Его транскрипция будет "m ai", а сформировано оно будет при помощи комбинации двух семплов — "ma" и "ai". Но поскольку тембр гласной фонемы "a" в сочетаниях "ma" и "ai" несколько различается (поскольку в данном случае мы имеем два разных варианта произношения фонемы "а"), просто соединить их не получится — ухо сразу заметит фальшь. Голосовой аппарат человека в таких случаях плавно изменяет частотные характеристики фонемы, осуществляя морфинг — плавное перетекание одного варианта звучания в другой. Нечто подобное делает и Vocaloid — место склейки подвергается динамической частотной обработке, после чего звучание становится естественным.

Параметры высоты пропевания воссозданных слов или слогов определяются заданной мелодической линией. Для достижения максимального реализма семплы фонем изначально записывались в разных по высоте вариантах. В тех же случаях, когда все-таки приходится использовать смещение по высоте, в процессе принимают участие лишь основной тон и обертона, в то время как спектр гласных формант практически не затрагивается.

В результате получается очень аутентичное, но математически точное пение с несколько механическим звучанием (как раз из-за этой сверхточности). Чтобы его очеловечить, надо дополнительно расставить атрибуты выразительности, которые "приводят в порядок" звучание прямо на глазах, так как их характеристики снимались с живых исполнителей, а не подбирались программистами.

Системные требования и инсталляция
Системные требования для Yamaha Vocaloid следующие. Как минимум, компьютер должен иметь процессор Intel Pentium III с тактовой частотой один гигагерц, 512 мегабайт оперативной памяти, 500 мегабайт свободного дискового пространства и операционную систему Windows 2000 или Windows XP. Это самые минимальные требования, разработчики же рекомендуют "танцевать" от Pentium IV с 1,7 ГГц, гигабайта памяти и работать под Windows XP. Также необходимы CD-привод, видеоадаптер с разрешением 1024 x 768 и звуковая плата с драйверами DirectSound. Ну и для работы в паре с секвенсором последний должен поддерживать интерфейсы и стандарты VST2.0, ReWire и Windows MME. Еще в системе необходимо иметь сетевую плату (об этом чуть дальше).

Инсталляция виртуального вокалиста проходит без проблем — разве что занимает немалое время. От вас требуется указать лишь установочные папки для инструмента и его VST-модуля. Предлагаются два типа инсталляции: полный (Complete) и выборочный (Custom). Второй тип может пригодиться для экономии времени и избежания дополнительной активации общих компонентов при установке дополнительных виртуальных певцов. Если вы внимательно посмотрите на меню установки разных вокалистов (рис. 22), то заметите, что отдельные составляющие у них одинаковые — например, Vocaloid Editor, Vocaloid VSTi, Vocaloid Expression (DB) Standard. Должен сказать, инсталлируя на свой компьютер по очереди Vocaloid Lola и Vocaloid Leon, я в обоих случаях использовал тип установки Complete и никаких проблем с активацией или дальнейшей работой не наблюдал.


 
Рис. 22  
   

После инсталляции инструмент требуется активировать. Вот тут не все так просто. Активация Vocaloid — это отдельная история. Как выяснилось, самое необходимое условие для работы инструмента — это не мощность процессора или быстрота аудиодрайверов, а обязательное (!) наличие в компьютере... сетевой платы! Таким необычным образом разработчики решили облагодетельствовать своих дорогих пользователей — придумав просто непревзойденную по идиотизму систему активации программы. Как говорится, боялись пиратов — создали головную боль для честных потребителей. Любопытно, что "распиратили" Vocaloid чуть ли не в день релиза. Ладно, вернемся к активации. Yamaha использует аппаратный MAC-адрес сетевой платы в качестве идентификационного номера вашего компьютера. Вообще-то тут нет ничего нового — какая принципиальная разница, считывается ли ID-код с материнской платы, сетевой платы или специального ключа, вставляемого в разъем USB или в порт принтера? Неудобно лишь, что требуется приобретение сетевой платы, поскольку это не является поголовно распространенным оборудованием, как, к примеру, центральный процессор. Даже для работы в интернете она не всегда нужна — можно подключаться и через модем.

Итак, вы решили активировать установленный Vocaloid. Это необходимо сделать в течение пяти дней после инсталляции — именно такой запас по времени дают вам разработчики. Существуют три способа активации — напрямую (то есть, когда ваш компьютер имеет выход в интернет), посредством любого другого компьютера с выходом в интернет (подразумевается, что вы имеете к нему доступ) и офлайновый метод. Последний нужен в том случае, если доступ в интернет (в обоих вышеописанных вариантах) у вас отсутствует. Порядок активации детально описан в пользовательском мануале, так что я не буду здесь его дублировать. Только при покупке инструмента обязательно обратите внимание, чтобы на внутренней стороне обложки мануала был написан серийный номер, который необходим для активации. Смех смехом, но я читал жалобы пользователей, у которых он отсутствовал. Конечно, проблема была решена службой поддержки издателя Zero-G, однако ситуацию все равно не назовешь приятной.

Подключение к интернету (в случае онлайновой активации инструмента) нужно лишь однократно — во время дальнейшей работы оно не требуется. Правда отдельные пользователи жалуются, что их Vocaloid начинает работать лишь после соединения с интернетом. В чем же дело? Вот тут-то и проявляется основной вред вышеописанной системы активации. Дело в том, что, к примеру, ADSL-модем с USB-интерфейсом тоже определяется системой как сетевая плата. И хотя его MAC-адрес по идее должен считываться при любом состоянии модема, отмечалось немало случаев, когда по каким-то причинам Vocaloid отказывался работать до тех пор, пока его владелец не выходил в интернет (как я понимаю, чтобы написать гневное письмо в службу поддержки). Во избежание различных проблем с активацией, разработчики рекомендуют приобрести простейший сетевой адаптер с USB-интерфейсом (за 10-20$) и просто повесить его в USB-порт как обычный ключ защиты. От себя скажу — если в вашей системе постоянно присутствует сетевая плата (неважно, праздно ли она там "живет" или используется для связи с другими компьютерами), ничего вам покупать не надо и даю 99%, что работать все будет нормально. А вот если вы используете какое-нибудь временно подключаемое сетевое оборудование (тот же ADSL-модем), такой адаптер может оказаться совсем не лишним. Впрочем, современные материнские платы часто уже имеют штатную интегрированную сетевую плату (ее надо лишь включить в настройках BIOS), так что попасть в "группу риска" вероятность не очень большая. И все-таки — насколько было бы проще жить, если разработчики могли бы более реально оценивать эффективность и целесообразность своих методов защиты.

Надо еще сказать, что лицензионное соглашение Vocaliod позволяет использовать продукт лишь на одном компьютере. При этом можно форматировать жесткий диск, апгрейдить операционку и т. п. — новой активации от вас не потребуется (разве что при установке обновлений самого Vocaloid). Но, если честно, я не знаю — сработает ли активация (во всяком случае, легальным путем) при инсталляции инструмента на другой компьютер, даже если переткнуть на него исходную сетевую плату.

Настройки
Все необходимые настройки инструмента собраны в меню Settings.

MIDI-настройки следующие. В меню Settings — Vocaloid MIDI — Resolution задается разрешение управляющих контроллеров вибрато и динамики. Если изменение указанных параметров кажется вам "ступенчатым", попробуйте увеличить разрешение, то есть задать меньшие числа в соответствующих окошках. Единицей измерения служат стандартные "MIDI-клоки" (clocks), коих приходится 480 на каждую четвертную ноту. Да, эти настройки действуют для режима динамики Standard (Standard Dynamic Mode — об этом читайте дальше) и игнорируются для режима Expert.

На закладке Option определяется время Pre-send Time. Смысл его вот в чем. Некоторые звуки (например, "s") требуют немного времени "на раскачку", чтобы нормально прозвучать, и берутся живым исполнителем чуть вперед по времени. Чтобы реалистично моделировать такие фонемы, секвенсор Vocaloid должен посылать управляющие MIDI-данные в синтезатор несколько раньше, чем обычно. Величина этого опережения и задается в графе Pre-send Time. Немного забегая вперед, скажу, что значение Pre-send Time должно быть обязательно меньше, нежели Pre-measure, иначе инструмент не сможет играть и выдаст сообщение об ошибке (впрочем, прямо из всплывшего окошка можно автоматически исправить Pre-send Time — рис. 23)

Рис. 23

Аудиоустановки такие. В меню Settings — Audio — Synthesis Engine выставляется частота дискретизации синтезаторного движка Vocaloid. Разрядность, увы, фиксированная — всего 16 бит, а ассортимент доступных частот дискретизации зависит от возможностей вашего устройства аудиовывода (звуковой платы). На закладке Device осуществляется выбор устройств аудиовывода для выходного сигнала Vocaloid. Вы можете направить выход инструмента как на любую из установленных в компьютере звуковых плат, так и на канал ReWire. Также можно задать формат выходного сигнала — стерео или моно. Закладка Wave File Output отвечает за параметры WAV-файла, сохраняемого при рендеринге вокальных партий. Об этих настройках я расскажу в соответствующем разделе.

В меню Settings — Play настраивается режим проигрывания партий Vocaloid. По умолчанию, инструмент сначала рассчитывает (то есть рендерит) партии и лишь потом воспроизводит полученный материал. Большим минусом при такой работе является достаточно большая задержка, затрачиваемая на пересчет. Если у вас быстрый компьютер, то вы можете попробовать активизировать опцию Play With Synthesis — тогда Vocaloid будет синтезировать партию в реальном времени, прямо во время воспроизведения. В окошке Waiting Time задается время "форы" для инструмента, которое он может потратить на синтезирование первой порции вокала. Даже если вы поставите максимальное время Waiting Time — одну секунду, такая задержка не идет ни в какое сравнение с задержкой при рендеринге длинной мультитрековой вокальной партии. Другой вопрос, потянет ли компьютер — воспроизведение может начать "дергаться", появятся щелчки и т. п. Говоря откровенно, более или менее нормально эта функция стала работать после выхода патча-обновления Vocaloid до версии 1.0.5.

Меню Settings — Pre-measure позволяет определить количество затактов перед началом партии (от одного до восьми). Эти затакты нумеруются со знаком минус и необходимы для обеспечения запаса времени Pre-send Time.

В меню Settings — Skins можно выбрать "шкуру" — схему оформления внешнего вида интерфейса Vocaloid, а в меню Settings — Customize самолично отредактировать цветовую гамму различных элементов интерфейса.

Ладно, давайте перейдем непосредственно к работе с инструментом.

Интерфейс
Основное окно Vocaloid Editor (рис. 24) является хорошо знакомым и зарекомендовавшим себя в секвенсорах клавишным редактором. Если вы знаете кубейсовский Key Editor, лоджиковский Matrix или кейквоковский Piano Roll, то и редактор Vocaloid освоите за считанные минуты. Поэтому говорить я буду в основном лишь об отдельных его особенностях, одни из которых обусловлены дизайном разработчиков, а другие — специфическими функциями голосового синтезатора.


 
Рис. 24  
   

Прежде всего, интерфейс. Панель транспорта, рабочие инструменты (стрелка, карандаш, ластик, длительности нот для пошагового ввода) — все это в отдельном представлении не нуждается. Треугольнички с буквами S (Start — синий) и Е (End — красный) — ни что иное, как левый и правый локаторы, позволяющие закольцевать воспроизведение материала внутри своих границ.

Трехэтажная линейка Measure/Tempo/Beat, расположенная над рабочим полем (рис. 25), очень наглядно (одно из лучших, на мой взгляд, решений) отображает информацию о тактах, изменениях темпа и смене ритмического размера.


 
Рис. 25  
   

Причем она служит не только индикатором — операции редактирования соответствующих параметров выполняются прямо на ней. Допустим, вам надо ограничить несколько тактов локаторами. Нет ничего проще — кликайте мышью в полоске Measures в месте левой границы и, не отпуская кнопки, ведите стрелку курсора до точки правой, где и отпустите кнопку. Все — локаторы стоят. При желании можете двигать их мышью куда угодно или опять "выделить" новую область партии. Для изменения темпа кликните (только переключитесь на карандаш) в нужное место полоски Tempo. В открывшемся окошке (рис. 26) проставьте требуемое значение и нажмите OK — прямо на линейке появится новая величина темпа.

Рис. 26

Аналогичным образом меняется ритмический размер партии — кликаете в полоску Beat и производите смену размера (рис. 27). Можете задать размер сразу для нескольких тактов.

Рис. 27

Очень меня позабавили индикаторы координат курсора — такое впечатление, что дизайн интерфейса делал математик. По оси абсцисс Х показывается время, на котором стоит курсор (в MIDI-формате — такты-доли), а по оси ординат Y отображается указываемая курсором нота. Самое смешное, я так и не понял, зачем нужны эти индикаторы.

Над индикаторами координат можно заметить две неизвестные кнопки с аббревиатурой "А" и "ae ". Это уже специфика инструмента. Первая кнопка открывает редактор фонем, а вторая включает функцию автоматической транскрипции введенного текста. Об этом я подробно расскажу дальше.

Под панелью транспорта расположены пять "кнопок-светодиодов": Lyrics, Attack, Dynamics, Phoneme, Vibrato. Они отвечают за показ в поле редактора следующей информации: текста, транскрипции и элементов выразительности. Выключение той или иной кнопки убирает с экрана соответствующие символы, позволяя визуально разгрузить интерфейс.

Внизу окна расположен трек управления Control Track, который позволяет осуществлять динамическое управления различными параметрами синтезатора.

Создание вокальной партии производится следующим образом. Сначала вы забиваете мелодическую линию. К сожалению, секвенсор Vocaloid не может записывать сигналы с внешнего MIDI-контроллера, так что все придется делать мышью. Либо же можно импортировать в инструмент стандартный MIDI-файл (об этом отдельно дальше), подготовленный в вашем любимом секвенсоре или где-то позаимствованный. Ноты в рабочем поле клавишного редактора рисуются карандашом. При этом длительности создаваемых нот соответствуют выбранным в панели сверху. Можете делать как удобнее — рисовать ноты какой-нибудь одной длительности и потом редактировать их длину, либо каждый раз выбирать в панели нужную длительность. При редактировании несколько не хватает возможности отдельного изменения не только конца ноты (то есть длительности), но и ее начала. Чтобы изменить время старта, приходится передвигать всю ноту — само собой, правая граница при этом тоже уезжает. Дело вкуса, но лично мне так неудобно.

Сетка Grid (вернее, функция притягивания к сетке) облегчает точное позиционирование создаваемых и редактируемых нот, а также символов выразительности Expression. Шаг сетки можно выбирать в широких пределах — от одной четверти до одной шестьдесят четвертой ноты, плюс варианты триолей на все указанные длительности. Выбор осуществляется в списке Settings — Grid, во всплывающем меню при правом клике мышью или в верхней панели окна. Если выставить опцию Off (отключение притягивания), то можно свободно позиционировать ноты с максимальным разрешением — 480 "MIDI-клоков" на четверть.

Шаг Grid отвечает только за позиции начала нот, можно точно также квантизировать и длительности. Для этого предназначен список Length (Settings — Length, меню правого клика или верхняя панель). Набор разрядностей Length точно такой же, как и у Grid.

Функция Show/Hide Grid Line (доступна в меню правого клика) выводит на экран или убирает с экрана пунктирную разметку минимального шага квантизирования сетки.

Основные функции и инструменты редактирования для большего удобства собраны в меню, открывающемся при правом клике мыши (рис. 28). В нем можно переключиться, например, с карандаша на ластик, выбрать длительность ноты для пошагового ввода, изменить масштаб сетки, отменить операцию и т. п. Кстати, ластиком пользоваться крайне неудобно — такое впечатление, что для успешного удаления какого-либо элемента надо целиться им с точностью до пиксела. Гораздо быстрее выделить требуемое стрелкой и нажать на клавиатуре клавишу Del.

Рис. 28

Совершенно никуда не годится (тем более по сегодняшним меркам) функция отмены операций Undo. Мало того, что предусмотрен один единственный (!) уровень отмены, так еще не всякое действие можно отменить.

Специфика работы Vocaloid такова, что ноты не могут "налезать" друг на друга в пределах одного трека (в таких случаях они не смогут звучать и инструмент выдаст сообщение об ошибке). Налезание нот — нередкое явление, особенно когда мелодическая линия берется из импортированного MIDI-файла, где она могла быть записана живьем. Да и при пошаговом "забивании" тоже трудно держать все это в голове. Меню Job предлагает автоматические средства для борьбы с подобными вещами. Функция Job — Normalize Objects устраняет все случаи перехлестывания нот в конкретном треке путем укорачивания продолжительности звучания первой ноты до момента вступления следующей.

Когда мелодическая линия готова приходит пора вводить текст. По умолчанию каждая нота уже имеет назначение — Ooh (рис. 29).

Рис. 29

Если нажать кнопку воспроизведения, инструмент человеческим голосом "проукает" всю мелодию. Ваша задача — на каждую ноту вписать соответствующие слова (или слоги) вокальной партии. Для этого дважды кликайте в текст Ooh и пишите вместо него свой (рис. 30).

Рис. 30

По завершении процесса необходимо выполнить процедуру автоматического транскрибирования текста — во время нее Vocaloid преобразует написанные слова в последовательность фонем, которые потом будет исполнять. Автотранскрибирование включается либо через меню Lyrics — Phoneme Transformation, либо нажатием в верхней панели кнопки с символом "ae ". При этом под нотами появятся последовательности фонетических символов для текста (рис. 31).

Рис. 31

Надо сказать, что каждой ноте Vocaloid может соответствовать лишь однослоговое слово (например, my, girl, night, she’s, will и т. д.). Если же вписать слово, состоящее из двух или более слогов, то инструмент не сможет синтезировать партию и при попытке воспроизведения выдаст сообщение об ошибке. Поэтому все длинные слова должны разделяться на слоги: например, " syn- the- si- zer", где каждый слог назначается на отдельную ноту (рис. 32). Дефис после каждого слога позволяет программе понять, что слово не закончено, и правильно распознать его. Если требуется произнести все слово на ноте одной высоты, то придется сделать цепочку из одинаковых нот. Видимо, это связано с тем, что длительность гласной фонемы привязана к длительности ноты, и когда гласных фонем назначено на ноту несколько, это ставит Vocaloid в тупик. Любопытно, что такие слова, как low, hear, near и т. п., могут назначаться на одну ноту и пропеваться инструментом, хоть и имеют две гласные фонемы.

Рис. 32

Если вам надо распеть на несколько нот какой-либо слог, нет необходимости отдельно прописывать его текст на каждую ноту. На первую ноту мелодической фразы напишите текст слога, а остальные пометьте символом дефиса — тогда после фонетического преобразования под каждой из нот группы будет проставлена нужная транскрипция (рис. 33).

Рис. 33

Каждый раз после того, как вы "забили" текст новой вокальной партии или отредактировали уже созданную, необходимо провести заново процедуру автоматического транскрибирования Phoneme Transformation, чтобы обучить Vocaloid правильному произношению нового текста. Если этого не сделать, то на каждую ноту (вне зависимости от написанных слов) Vocaloid будет пропевать свое дефолтное Ooh.

Если теперь запустить воспроизведение, Vocaloid пропоет мелодию со словами, хотя характер звучания будет явно неживым. Возможно, некоторые слова инструмент произнесет неправильно — придется воспользоваться редактором фонем (читайте дальше в соответствующем разделе). Когда ошибки будут исправлены, можно позаботиться и об оживлении пения Vocaloid. Для этого воспользуйтесь средствами выразительности Expression, управляющими контроллерами Control Track и редактором параметров голоса виртуального исполнителя Singer. Готовый результат можно отрендерить в WAV-файл или сохранить в MIDI-файл специального формата, чтобы потом использовать с VST-модулем Vocaloid. Можно связать инструмент с вашим любимым секвенсором по протоколу ReWire и воспроизводить и редактировать вокальную партию совместно со всей аранжировкой. Обо всем этом подробно читайте дальше в отдельных разделах.

Вообще, для быстрого освоения основных функций инструмента очень рекомендую имеющийся на диске дистрибутива обучающий видеоролик. В нем по шагам объясняются все этапы создания простенькой вокальной партии на конкретном примере. Даже если вы не знаете английского языка, ролик настолько наглядный, что и без слов все ясно. Обязательно посмотрите его.

Клавишный редактор Vocaloid позволяет единовременно редактировать только один вокальный трек (из шестнадцати возможных). Если ваша партия многоголосая (имеет несколько треков), в нижней полосе окна отображаются иконки каждого голоса (рис. 34). Переключаясь между ними, вы выводите в рабочее поле редактора данные того или иного трека.

Рис. 34

Работая с треком многоголосой партии, очень удобно иметь возможность видеть ноты остальных треков (хотя бы для того, чтобы быстрее согласовать их по ритмике и высоте). Функция Overlay (Track — Overlay) включает показ силуэтов нот всех неактивных треков (рис. 35). Чтобы убрать силуэты с экрана, деактивируйте Overlay (снимите галочку в меню).

Рис. 35

Очень полезной вещью является функция копирования трека Track — Copy. Если ей воспользоваться, то все, что вы насочиняли в текущем треке, будет скопировано в заново созданный. Таким образом очень удобно работать с многоголосыми партиями, исполняемыми, например, в терцию — записали один голос, скопировали, далее сделали транспонирование, подправили по мелочи, и все. Куда быстрее, чем набирать партию с нуля.

Ну а теперь давайте более детально рассмотрим отдельные этапы создания вокальной партии.

Редактирование фонем
Если Vocaloid самостоятельно не справился с транскрибированием каких-либо слов вашей песни, вы можете использовать редактор фонем (Phoneme Editor) для ручной коррекции произношения виртуального певца.

Чтобы открыть редактор фонем (рис. 36), сперва кликните по ноте (то есть выделите ее), соответствующей слову или слогу, который вы хотите отредактировать, после чего нажмите кнопку с изображением буквы "А" в верхней панели или зайдите в меню Lyrics — Phoneme Edit (либо самое простое — дважды кликните по требуемой ноте).


 
Рис. 36  
   

Транскрипция слова или слога, соответствующая выделенной в клавишном редакторе ноте, будет также выделена в редакторе фонем. Вообще же список в левой части окна Phoneme Edit отображает все ноты/слова данного трека, так что работу по изменению транскрипции целой партии можно сделать, не вылезая из редактора. Кроме того, редактор предлагает и возможность изменения исходного текста с автоматическим фонетическим преобразованием. Только вот параметры самих нот менять нельзя. А жаль — тогда бы Phoneme Edit был бы полноценным редактором событий (Event List) с дополнительными вокальными функциями.

Чтобы исправить неправильную транскрипцию, или наоборот — сделать из "правильной" с точки зрения Vocaloid и английской грамматики нечто иное (например, вставить слово на другом языке), просто дважды кликните по фонетическим символам транскрипции в колонке Phonetic Symbols и отредактируйте их в соответствии с вашими задачами. В правой части окна Phoneme Edit находится "шпаргалка" всех используемых Vocaloid фонетических символов (Symbols). Для удобства рядом с символами приводятся примеры слов (Samples), которые их наглядно демонстрируют, — например, короткое "U" звучит в слове "put", а длинное "u:" — в слове "boot" и т. д. Чтобы точно знать какой части примера соответствует фонема, задействованные буквы подчеркиваются: "i:" — "beef", "tS" — "touch" и т. д.

Редактируя транскрипцию, вы можете столкнуться с ситуацией, когда изменения требует не один, а сразу несколько фонетических символов (вплоть до ручного транскрибирования слова целиком). Если слово требует для транскрипции несколько фонетических символов, они должны отделяться друг от друга пробелами. По завершении операций редактирования требуется нажать клавишу Enter, чтобы все изменения вступили в силу. При этом будет автоматически включена функция защиты Protect (появится галочка в соответствующей графе), которая не даст Vocaloid изменить ее в соответствии со своими правилами транскрибирования в случае дальнейших преобразований текста в фонемы. Возможность пополнения словарного запаса Vocaloid (смотрите следующий раздел), на первый взгляд, делает функцию Protect не такой уж и необходимой. Однако на самом деле она здорово развязывает руки: во-первых, не всегда удобно связываться со словарем (к примеру, ради какого-нибудь редкого слова, с которым вряд ли предстоит еще встретиться), а, во-вторых, вы не ограничены в вариантах использования присутствующих в словаре слов — можно "закосить" под какой-нибудь диалект, исковеркать и т. п.

Править фонетические символы можно также прямо в рабочем поле клавишного редактора. Для этого дважды кликните не в ноту, а в транскрипцию слова под нотой — и вы получите возможность ее редактирования. Правила работы те же — по окончании вмешательства обязательно нажмите клавишу Enter. Защита Protect так же автоматически включится. Словом, если вам надо лишь поправить транскрипцию, и вы не путаетесь в фонетических символах (или держите на коленях мануал), всю работу по редактированию произношения можно выполнять, не выходя из клавишного редактора. Всего Vocaloid оперирует пятьюдесятью четырьмя фонетическими символами. На рис. 37 приведен полный их список.


 
Рис. 37  
   

Однако редактор Phoneme Edit позволяет осуществлять и более тонкие операции над фонемами. Иногда может возникнуть потребность в изменении продолжительности звучания некоторых согласных звуков (скажем, "s" или "f" — это наиболее часто встречающиеся примеры) для более тонкого управления фразировкой. Чтобы получить доступ к временным параметрам фонем, воспользуйтесь кнопкой Setup в левом нижнем углу окна редактора, либо дважды кликните по номеру или времени ноты интересующего вас слова (слога), которое содержит согласные звуки. Наличие согласных звуков требуется лишь потому, что для гласных фонем никаких ручных регулировок не предусмотрено — их длительность определяется продолжительностью звучания нот. В появившемся окне опять нажмите кнопку Setup, и вы попадете в список составляющих слово (слог) фонем, в графе Consonant Adjustment которого сможете задавать длительность согласных звуков (рис. 38). По умолчанию, значение длительности любой согласной фонемы — 64 единицы. Регулировка осуществляется в диапазоне от 0 до 127 единиц — меньшие значения укорачивают звучание фонемы, большие, соответственно, увеличивают.


 
Рис. 38  
   

Для отмены всех произведенных в редакторе Phoneme Edit действий нажмите кнопку Cancel, для подтверждения и сохранения — Confirm. Кнопка Convert включает функцию автоматического фонетического преобразования для всех слов — как заново записанных в редакторе, так и старых с отключенной защитой Protect.

Пользовательский словарь произношений
Vocaloid имеет штатный словарь произношений, который охватывает приличное количество наиболее часто употребляемых слов. Тем не менее, не стоит полагать, что этот словарь "знает" вообще все слова, какие вам вздумается придумать в тексте песни. Поэтому будьте готовы к тому, что периодически виртуальный певец будет неправильно произносить то или иное слово. Однако все не так плохо — благодаря возможности самостоятельно добавлять неизвестные инструменту слова в специальный пользовательский словарь (VOCALOID User Word Dictionary), лексикон виртуального певца может расширяться фактически неограниченно.

Для получения доступа к управлению словарем, выберите в меню Lyrics последнюю опцию — User Word Dictionary. В открывшемся окне User Word Registration (рис. 39) можно учить Vocaloid новым словам, а также редактировать существующие и удалять ненужные слова и словари.


 
  Рис. 39  
   

Чтобы добавить в лексикон Vocaloid новое слово, сначала нужно создать сам словарь, поскольку при инсталляции инструмента никаких словарей, кроме штатного, не создается. В строчке меню User Dictionary (в самом верху окна) видна надпись No Dictionary. Откройте меню, кликнув по этой надписи, и выберите вторую опцию — "new" (рис. 40). В открывшемся окошке Create User Dictionary напишите имя словаря и нажмите кнопку Create — словарь будет создан и его имя появится в меню User Dictionary. Для удобства работы словарей можно сделать несколько (скажем, чтобы не валить все слова в одну кучу, а распределить по темам — тогда легче будет искать и редактировать слова). Каждый вновь созданный словарь автоматически появляется в общем списке, и во время работы можно оперативно переключаться между ними. Чтобы удалить словарь, нужно выделить его и кликнуть по расположенной справа от списка кнопке Del.

Рис. 40

Теперь давайте попробуем вписать в словарь слово. Прежде всего, выберите в списке словарей User Dictionary нужный, если вы создали несколько сразу. Далее, идите в самое нижнее поле окна, к графам Word и Pronunciation. Обратите внимание на кнопку Auto. Если ее активировать, то вписываемое вами в поле Word слово будет автоматически транскрибироваться. Если же ее не трогать, то транскрипцию придется также писать вручную. Кнопка Auto должна быть "утоплена" до ввода слова. Если сначала написать слово и потом нажать Auto — ничего не произойдет. Как и в редакторе фонем Phoneme Edit в правой части окна User Word Registration находится перечень доступных фонетических символов. Жалко лишь, что звучащая фонема не подчеркнута в примере, как это сделано в редакторе фонем или в пользовательском мануале — иногда приходится мучительно вспоминать, что означает тот или иной символ даже при наличии примера. На мой взгляд, гораздо удобнее работать при постоянно включенном режиме автоматического транскрибирования — все-таки редактировать некорректную транскрипцию обычно получается быстрее, чем писать с нуля. Впрочем, решать вам. По окончании кликните кнопку Add, и слово будет добавлено в словарь.

Полное содержание словаря в алфавитном порядке отображается в списке чуть выше (в левой части списка находятся слова, в правой — их транскрипции). Если требуется отредактировать то или иное слово, просто дважды кликните по нему, и слово и его транскрипция появятся в полях Word и Pronunciation соответственно. После редактирования нажмите Add, и все изменения будут добавлены в словарь (если при этом вы измените само слово, то оно попадет в словарь как новое, если же только транскрипцию — будет записано поверх старого, о чем у вас попросят подтверждения). Для удаления слова из словаря, выделите его и кликните кнопку Del Word.

Expression
В базовый (я бы даже сказал — начальный) набор средств выразительности Vocaloid входят три типа параметров: атака, вибрато и динамические оттенки. Каждый из них представлен в нескольких вариантах на палитре Vocaloid Icon Palette (рис. 41), которая вызывается на экран через меню View — Vocaloid Icon Palette. Как видите, ассортимент палитры весьма разнообразен — имеются в наличии все основные динамические оттенки, несколько видов вибрато, присутствует приличное количество вариантов атаки и характеров крещендо и диминуэндо. Некоторые из них (я имею в виду разновидности атаки и вибрато) принадлежат конкретному виртуальному певцу — например, Lola Attack 1 или Leon Vib 2. Это, впрочем, не означает, что их нельзя использовать с другими певцами — совсем наоборот.


 
Рис. 41  
   

Придание того или иного атрибута выразительности выполняется очень просто — при помощи перетаскивания мышью его пиктограммы прямо на нужную ноту. Само собой разумеется, нота может иметь лишь один атрибут атаки или вибрации — если требуется присвоить новый тип параметра, сначала надо удалить текущий. К сожалению, это приходится делать вручную (выделять и удалять) — разработчики почему-то не предусмотрели автоматического удаления при назначении нового параметра. Присвоенный атрибут атаки отображается соответствующей иконкой в самом начале ноты, а назначенная вибрация — характерной змейкой, расположенной чуть ниже (рис. 42). Точки начала и конца вибрато задаются передвижением границ змейки мышью. По умолчанию, змейка занимает вторую половину длительности ноты. Увы, значки атаки и вибрато не дают информации о варианте присвоенного атрибута — чтобы выяснить конкретный вариант, приходится лезть в свойства параметров. На мой взгляд, было бы гораздо удобнее, если бы они отличались хотя бы номерами — тогда с одного взгляда на партию становилось бы ясно, что и куда назначено.

Рис. 42

Атрибуты динамики не привязываются к конкретным нотам, их можно перетаскивать в любое удобное место — как под нотой, так и над ней. Это позволяет сохранить визуальную читаемость партии, не убирая с экрана отдельные типы атрибутов. На рис. 43 можно посмотреть пример вокальной секвенции с проставленными атакой, вибрацией и динамикой, причем соответствующие символы не перекрывают друг друга и дают возможность оставить на экране также текст и транскрипцию. Расставляя значки динамики, следите за тем, чтобы они не "перехлестывались" — в этом случае Vocaloid не сможет синтезировать партию и выдаст сообщение об ошибке.


 
Рис. 43  
   

Для устранения подобных огрехов редактирования есть очень полезная функция Job — Verify Data. В отличие от "чистилки" перехлестывающихся нот Normalize, Verify Data сама ничего не исправляет — она лишь находит наползающие друг на друга обозначения динамики. О чем выдает соответствующее сообщение и подводит к найденному месту позицию воспроизведения. Само действие по коррекции динамики предоставляется пользователю — поскольку характер динамики партии не привязывается к конкретным нотам, исправлять что-то автоматически опасно, так как можно уничтожить творческий замысел. Кстати, функция Verify Data сообщит вам и о накладывающихся друг на друга нотах, если их найдет (рис. 44). В этом случае сделайте Normalize.

Рис. 44

К вышесказанному имеет некоторое отношение еще одна опция меню Job — режим работы с динамикой Dynamics Mode. Всего существуют два режима: Standard и Expert. Работая в первом из них, все изменения громкости голоса вы рисуете символами крещендо-диминуендо, перетаскивая их мышью с палитры иконок под ноты и далее растягивая и передвигая как душе угодно. Второй режим, Expert, убирает с экрана все динамические символы, конвертируя их в соответствующие огибающие в поле Control Track, которые можно редактировать точно так же, как параметр Volume в секвенсоре (рис. 45). Само собой, в режиме Expert полностью исключается возможность наползания символов динамики, так как на этот раз последовательность изменений громкости представляет собой единую непрерывную кривую.


 
Рис. 45  
   

Каждый назначенный атрибут Expression можно дополнительно редактировать. Чтобы выйти в меню настроек элемента, просто дважды кликните по нему. В зависимости от типа атрибута будут предложены те или иные опции регулировки. Например, меню настройки статического параметра громкости исполнения (рис. 46) позволяет корректировать значение громкости, а окно регулировок вибрато (рис. 47) — даже рисовать управляющие кривые (помимо всего прочего).

Рис. 46

Рис. 47

Для крещендо-диминуэндо можно редактировать зависимость нарастания или затихания громкости (рис. 48).


 
Рис. 48  
   

Также обратите внимание на кнопку Variation, расположенную в верхнем правом углу окна свойств атрибута. Она позволяет открыть список всех атрибутов данного типа и сменить текущий на любой из доступных (рис. 49).


 
Рис. 49  
   

Control Track
Расположенный внизу рабочего окна Vocaloid трек управления Control Track (рис. 50) давно уже стал неотъемлемой частью любого уважающего себя клавишного редактора (например, в секвенсоре Emagic Logic он называется Hyper Draw, в Cubase — Controller Display и т. д.). Трек управления Vocaloid не является исключением, он позволяет динамически изменять как значения некоторых MIDI-контроллеров, так и величины целого ряда специфических для вокального синтезатора параметров. Редактирование осуществляется вполне традиционно — при помощи огибающих. Поскольку клавишный редактор и трек управления связаны друг с другом по времени, вы имеете точное представление, к какой точке партии относятся изменения значений редактируемого в данный момент контроллера.


 
Рис. 50  
   

В левой части Control Track находится меню служебных установок. Клик по верхней строчке открывает список доступных для управления контроллеров (рис. 51). Одновременно редактировать допускается только один контроллер, но можно рисовать огибающие по очереди для всех, переключаясь в том же списке по мере надобности.

Рис. 51

В графе Interval задается время между двумя соседними узлами управляющей кривой, то есть определяется ее разрешение. Варьируя величину Interval, можно сделать огибающую как плавной, так и дискретной — с редкими ступеньками значений. В графе Value отображается точная величина (от 0 до 127 единиц) выделенного узла огибающей — если нужно точно задать значение, введите его в этой графе. Кнопки Dot, Free и Line определяют режим рисования в рабочем поле трека управления. Если активна Dot, то карандаш будет создавать при каждом клике единичные узлы. Когда включена кнопка Free, можно рисовать произвольную кривую (удерживая левую кнопку мыши). Ну и положение Line позволяет рисовать управляющую линию ровно, по линеечке. Переключив курсор с карандаша на стрелку, можно произвольно перетаскивать любой узел огибающей, а "взяв" в руки ластик — вытирать ненужные участки линии.

Среди знакомых контроллеров в списке можно видеть Note Velocity и Pitch Bend. Я думаю, не надо пояснять, что это такое. Pitch Bend Sensitivity задает чувствительность функции Pitch Bend, то есть определяет, насколько сильно ее управляющая кривая будет модулировать высоту сигнала. Максимально возможный диапазон Pitch Bend — две октавы (24 полутона) в обе стороны, минимальный — 0. Pitch Bend Sensitivity позволяет более рационально использовать контроллер Pitch Bend, подстроив масштаб регулировки — так, даже для самых небольших изменений высоты можно приспособить весь диапазон огибающей контроллера.

Также виден еще целый ряд параметров. Это четыре резонатора (Resonance 1-4) со своими регулировками Frequency, Band Width и Amplitude, это Harmonics, Noise, Brightness, Clearness и Gender Factor. Все перечисленные функции отвечают за особенности звучания голоса виртуального певца. О каждой из них я подробно расскажу в разделе Singer, посвященном этой теме.

Если в качестве редактируемого параметра выбрать Singer, то появится возможность менять виртуальных певцов в любом месте вокальной партии. Огибающие при этом рисовать никакие не надо — просто в месте смены появится иконка с именем нового исполнителя. Подробнее об этом, опять же, в разделе Singer.

Трек управления Vocaloid является очень важным рабочим инструментом. Дело в том, что приемы выразительности исполнения настоящего вокалиста гораздо богаче и разнообразнее, нежели весьма ограниченное количество вариаций, предлагаемое в наборе Vocaloid Icon Palette. Однако тонкая работа с контроллерами в треке управления позволяет добиться куда более серьезных результатов. Можно по-разному интонировать отдельные ноты, более точно задавать динамические оттенки, изменять даже параметры голоса виртуального исполнителя, словом, фактически оживлять вокальную партию.

Singer
Singer — это и есть личность виртуального певца Vocaloid, голосом которого исполняются вокальные партии. Такой певец может быть мужчиной (Leon) или женщиной (Lola, Miriam), знать тот или иной язык, словом, обладать набором индивидуальных черт, который определяет библиотека Vocaloid Library. В комплект Vocaloid входит одна или несколько таких библиотек (на примере данной статьи их две: Lola и Leon), и с появлением в продаже новых библиотек для Vocaloid вы сможете пополнять "личный состав" своего инструмента.

Как только вы создаете новую партию (даете команду File — New), ей автоматически назначается "принятый по умолчанию" вокалист (соответствующая иконка появляется в самом начале трека управления Control Track — рис. 52).

Рис. 52

Само собой разумеется, что "личность певца по умолчанию", равно как и остальных доступных вокалистов будет зависеть от используемых библиотек Vocaloid Library. Если у вас в инструменте проинсталлированы несколько певцов, то в любой момент вы можете сменить дефолтного на любого другого. Для этого дважды кликните по иконке вокалиста в треке управления, и на экране появится окно редактора певцов — Vocaloid Singer Editor (рис. 53), в котором можно выбрать нужного из списка доступных, а также настроить особенности его голоса, используя целый ряд регулировок. Чтобы выбрать вокалиста, просто поставьте галочку в квадратике слева от его имени и номеров банка и пэтча, после чего нажмите кнопку OK.


 
Рис. 53  
   

На протяжении вокальной партии можно менять певцов в любой точке времени и любое количество раз. Для этого переключите курсор на карандаш, и в треке управления кликните в нужную точку времени, на котором хотите произвести смену. Этим вы опять откроете окно Vocaloid Singer Editor, где сможете выбрать нужного певца, как я уже написал раньше. После нажатия кнопки OK в треке управления появится новая пиктограмма со свежевыбранным вокалистом (рис. 54).


 
Рис. 54  
   

Теперь давайте поговорим про настройки голоса. Использование виртуальных вокалистов с установками по умолчанию наиболее соответствует звучанию певцов, с которых снимались "слепки" голоса для библиотек Vocaloid. Вместе с тем, предлагается целый ряд параметров, варьируя которые, можно изменять звучание голоса в весьма широких пределах. Произведенные настройки для какого-либо певца сохраняются за ним; каждый певец может иметь свои индивидуальные настройки. Более того, используя функции Add Voice (добавить голос) и Copy Voice (скопировать голос), можно создавать новых певцов на базе существующих. Например, вам нравится певец Leon как в первозданном виде, так и в нескольких модифицированных вариантах. Логичней и удобней будет оставить Леона как есть, далее создать несколько его копий (под разными именами) и отредактировать каждую отдельно. В результате у вас получится несколько певцов из одной библиотеки. Команды Add Voice и Copy Voice отличаются тем, что первая из них создает нового певца на основе одного из существующих в Vocaloid Library, а вторая позволяет копировать любых — как заводских, так и модифицированных пользователем. При добавлении голоса из библиотеки (Add Voice) надо лишь указать свободный номер Program Change (рис. 55) — под ним в списке певцов появится копия выбранного вокалиста.

Рис. 55

В случае же копирования (Copy Voice) также можно произвольно задать и имя певца (рис. 56). Неактивные пока окошки Bank Change сделаны, как я понимаю, с прицелом на будущее — когда в продаже появится столько библиотек певцов, что потребуется более высокий уровень их администрирования.

Рис. 56

Вообще существуют два способа управления настройками голоса, которые имеет смысл совмещать при работе с инструментом. Один из них я назову статическим — когда параметры певца задаются в окне Vocaloid Singer Editor. С его помощью хорошо создавать исходные шаблоны голоса, от которых удобно отталкиваться в дальнейшей работе. Другой же способ (динамический, по моей терминологии) заключается в управлении этими же переменными в реальном времени при помощи огибающих Control Track. Динамическое управление хорошо тем, что позволяет буквально анимировать вокальную партию и добиваться прямо-таки человеческой выразительности исполнения. Хотя, конечно, работа эта крайне кропотливая. Ладно, перейдем непосредственно к настройкам.

В поле Voice Parameters (параметры голоса) находятся четыре секции регуляторов Resonance. На первый взгляд, каждая секция напоминает обычный параметрический эквалайзер, однако это не совсем так. Vocaloid при синтезе вокала имитирует резонансы, возникающие в человеческом голосовом тракте — то есть голосовые форманты. Человеческий голос содержит множество формант (рис. 57), распределенных по всему его частотному диапазону, которые не только определяют тембр голоса, но и, как я уже говорил, отвечают за произношение гласных звуков. В динамике процесса звукообразования Vocaloid манипулирует этими резонансами, заставляя одни звуки речи трансформироваться в другие.


 
Рис. 57  
   

Секции Resonance изменяют параметры первых четырех формант (на рисунке они под номерами 0-3). Это самые низкие (по частоте) и громкие (по амплитуде) форманты, которые являются самыми важными, так как именно они "формируют" моделируемую форму рта и определяют характер произношения гласных звуков.

Регуляторы каждой из секций действительно напоминают линейку параметрического эквалайзера — Frequency (частота), Band (ширина полосы) и Amplitude (амплитуда сигнала). Однако значения настроек задаются не в абсолютных децибелах или герцах, а в относительных единицах. И назначение блока Resonance (как, впрочем, и остальных регуляторов) состоит не в изменении уже сформированного звука, а в коррекции процесса синтеза при звукообразовании. Диапазон регулировки составляет от 0 до 127 единиц, причем 64 единицы — положение по умолчанию. При дефолтных значениях параметров никакого воздействия на звук не происходит. Попробую объяснить на примере. Допустим, вы увеличили параметр Frequency (частота) одного из блоков. Это означает, что Vocaloid, синтезируя соответствующую форманту, сдвинет ее вверх по частоте от нормального положения. Аналогичным образом можно расширить/сузить полосу форманты и ее громкость.

Варьируя параметры резонансов, можно менять произношение гласных звуков — например, превратить один гласный звук в другой или вообще получить новые звуки, промежуточные между двумя обычными. Дело это, конечно, мудреное и кропотливое, однако позволяет добиться интересных результатов — в частности, изменить диалект виртуального певца. Также при помощи Resonance можно воздействовать и на вокализованные согласные, делая их плотнее или, наоборот, — обесцвечивая. Однако воздействовать на невокализованные согласные при помощи резонансов не получится, так как блок Resonance никак не влияет на шумовые компоненты голоса.

Также раздел Voice Parameters предлагает еще пять инструментов для тонкой настройки звучания виртуального вокала.

Параметр Harmonics позволяет увеличить или уменьшить наполнение голоса гармониками. Варьирование этой величины, помимо изменения звучания голоса, делает его субъективно более громким или наоборот — мягким.

Значение Noise отвечает за уровень шумовой составляющей в голосе. Чем выше уровень шума, тем резче и разборчивее звучит голос. Если же этот параметр уменьшить — звучание вокалиста станет более чистым, тональным, музыкальным, зато ухудшится дикция.

Параметр Brightness поднимает или подрезает высокочастотные составляющие голоса, позволяя добиваться как яркого, звонкого звучания, так и спокойного, мягкого. При малых значениях Brightness эффективно моделируется нежное произношение фраз и даже шепот.

Регулятор Clearness чем-то напоминает действие Brightness, хотя воздействие на тембр голоса оказывается другим способом. Высокие значения параметра делают звучание чище, разборчивей, а низкие, наоборот, — приглушают его.

Изменение величины Gender Factor осуществляет сдвиг формант голоса в широком диапазоне частот, позволяя добиться как низких мужских тембров, так и высоких женских и даже утрированных, мультипликационных.

Ну и очень полезная кнопка Reset сбрасывает все накрученные параметры к их значениям по умолчанию.

Mixer
Микшер Vocaloid (рис. 58) ничего особенного собой не представляет — самый обычный программный микшер. Количество его трековых линеек соответствует числу дорожек проекта, также присутствует мастер-секция. Поскольку Vocaloid не имеет собственных эффектов, единственно возможными регулировками микшера являются громкость и панорама. Есть также функции заглушения (Mute) и солирования (Solo). Трековые линейки можно маршрутизировать либо на мастер-секцию, либо на ReWire-канал. Мастер-секцию можно маршрутизировать или на ReWire, или на любое установленное в системе устройство аудиовывода. Вызывается микшер через меню View — Vocaloid Mixer. Больше мне сказать про микшер решительно нечего.


 
Рис. 58  
   

Рендеринг в WAV-файл
Vocaloid позволяет рендерить свои вокальные партии в стандартные WAV-файлы, которые потом можно использовать с другими приложениями — помещать на треки многодорожечной программы, обрабатывать в звуковом редакторе и т. д. Специально для этого в меню Files есть функция экспорта (Files — Export — Wave File). При выполнении экспорта сначала открывается окно навигатора, где вы указываете местоположение и пишете имя сохраняемого WAV-файла. Далее вы попадаете в меню, в котором можно сделать дополнительные настройки (рис. 59). На закладке Synthesis Engine задается частота дискретизации аудиодвижка инструмента — такое же ее значение будет иметь и конечный файл. Разрядность, увы, жестко фиксирована — 16 бит. Закладка Wave File Output дублирует данные первой закладки, а также позволяет выбрать сохраняемый материал и его конечное представление. Можно осуществить рендеринг как всех партий текущего проекта (если, конечно, он имеет несколько вокальных треков) — опция Master Track, так и отдельной текущей партии — опция Current Track. В обоих случаях значения громкости и панорамы вокального трека (или нескольких треков) для экспортируемого WAV-файла считаются исходя из регулировок микшера инструмента. Также у вас есть выбор между форматом файла — стерео или моно. По завершении всех установок нажмите кнопку ОК, и Vocaloid пересчитает вокальные партии. Процедура может занять некоторое время — оно напрямую зависит от объема, сложности и количества вокальных треков проекта.


 
  Рис. 59  
   

Импорт MIDI-файлов
В Vocaloid можно импортировать стандартные MIDI-файлы (SMF) и использовать содержащиеся в них ноты в качестве мелодической основы для вокальных партий. Поддерживается импорт следующих MIDI-событий — команд Note On/Off, значений динамики (velocity), а также изменений параметров контроллера Pitch Bend. Поскольку внутренний секвенсор Vocaloid в состоянии "потянуть" 16 треков, можно за один присест импортировать и многоканальные MIDI-файлы, содержащие до 16 треков включительно.

Импорт MIDI-файлов осуществляется через меню File — Open. После выбора в навигаторе требуемого файла вам сначала задается вопрос — раскладывать ли треки файла по отдельным дорожкам Vocaloid или валить все в одну кучу (рис. 60).

Рис. 60

Далее вы попадаете в меню SMF Options (рис. 61), где можете указать, какие именно треки из доступных будут импортироваться. Если какие-то из треков вам не нужны, сбросьте соответствующие галочки.


 
  Рис. 61  
   

Синхронизация по протоколу ReWire
Vocaloid может работать с любым совместимым секвенсором (или другой аудиопрограммой) по протоколу ReWire. В качестве ReWire-приложения инструмент выступает как ведомое устройство, таким образом, секвенсор должен быть устройством ведущим (и должен поддерживать этот режим). Для синхронизации по протоколу ReWire сначала требуется запустить хост-программу, например, секвенсор. После загрузки и старта секвенсора (надо дождаться инициализации всех его компонентов) включайте Vocaloid. Далее, в меню Setting — Audio — Device надо активизировать опцию ReWire, либо в окне микшера выбрать ReWire в качестве выхода отдельных каналов или (и) мастер-секции.

Теперь можно выбрать Vocaloid в меню ReWire-клиентов вашего секвенсора (на рис. 62 показан пример ReWire-синхронизации Vocaloid с секвенсором Steinberg Cubase SX) и использовать их совместно. Причем, транспортом обеих программ можно управлять как из окна секвенсора, так и из окна Vocaloid.


 
Рис. 62  
   

Стоит заметить, что после получения команды Play приходится ждать некоторое, иногда весьма приличное, время, пока Vocaloid "посчитает" вокальную партию (на экран выводится соответствующее сообщение — рис. 63). Впрочем, такой предварительный рендеринг имеет место быть лишь после редактирования вокальной партии или при первом воспроизведении — если просто проигрывать ее без изменения, старт осуществляется мгновенно. Надо сказать, что с выходом патча-обновления Vocaloid до версии 1.0.5 задержка на рендеринг стала значительно меньше и не так достает, как раньше.

Рис. 63

Работа с VST-модулем Vocaloid
Если ваш секвенсор поддерживает работу с VST-инструментами, и VST-модуль Vocaloid установлен, вы можете использовать Vocaloid внутри секвенсора в качестве VSTi-плагина. Однако в отличие от самостоятельного Vocaloid Editor, его VST-ипостась представляет собой не полноценное приложение для создания и редактирования вокальных партий, а лишь проигрыватель вокальных партий, созданных в Vocaloid Editor заранее. Кроме того, VST-модуль предлагает органы управления некоторыми параметрами виртуального вокалиста, а точнее — тот же самый набор, что присутствует в окне Singer самостоятельного приложения Vocaloid. Все доступные регулировки можно производить в реальном времени, а также использовать систему автоматизации секвенсора для управления ими.

Способы включения и назначения VST-инструментов на MIDI-дорожки хотя и могут несколько отличаться в зависимости от используемого секвенсора, но давно известны и подробно описывать их смысла я не вижу. VST-модуль Vocaloid включается точно так же, как и остальные инструменты, однако чтобы он "запел", надо сделать кое-что еще. Сначала вы должны сохранить готовую вокальную партию в Vocaloid Editor. Она сохраняется в формате стандартного MIDI-файла (*.mid). Далее требуется импортировать этот файл в секвенсор и поместить его в MIDI-трек с назначенным VST-модулем Vocaloid. На рис. 64 показана панель управления VST-инструментом Vocaloid в секвенсоре Steinberg Cubase SX.


 
Рис. 64  
   

Несколько слов надо сказать по поводу создаваемых Vocaloid MIDI-файлов. Эти файлы, хоть и имеют стандартный формат и расширение MID, используют специальные команды и не содержат стандартных MIDI-событий типа Note On/Off и т. п. Таким образом, MIDI-файлы, созданные инструментом, не могут быть импортированы или открыты в других программах и предназначены только для Vocaloid (вернее, открыть-то их можно, только толку от этого никакого не будет).

Также обратите внимание, что управляющие данные для Vocaloid посылаются в инструмент с опережением — с учетом поправки на время вычислений. Поэтому когда вы наблюдаете задержку между черточками событий в MIDI-клипе и реакцией на эти события инструмента, не удивляйтесь — это нормально.

Конечно, не совсем удобно то, что всеми функциями Vocaloid нельзя управлять в реальном времени прямо из его VST-панели. Получается, для малейших исправлений вокальной партии приходится открывать Vocaloid Editor, что не всегда удобно по времени, или синхронизироваться по протоколу ReWire, что опять же не всегда удобно по ресурсам. Однако совершенно неожиданно я наткнулся на утилиту, которая волшебным образом разрешила все проблемы. Это оказался подключаемый VSTi-модуль VocController компании TazMan Audio ценой всего в 25$. Программа стоит того, чтобы о ней рассказать хотя бы вкратце.

TazMan Audio VocController
VocController (рис. 65) представляет собой небольшой виртуальный инструмент, который вырабатывает специальные MIDI-сообщения для управления Vocaloid VSTi. Он позволяет исполнять мелодические линии Vocaloid (иными словами, проигрывать ноты) при помощи MIDI-клавиатуры или использовать для этого MIDI-партии с дорожек секвенсора. Также VocController имеет свой внутренний пошаговый секвенсор, который обеспечивает возможность "привязывать" к произвольным нотам текст и поддерживает для этого все стандартные функции Vocaloid типа вибрато, атаки и т. п. Инструмент дает возможность управления в реальном времени такими параметрами, как Volume, Pitch Bend, Velocity, Vibrato (глубина и частота), а четыре главных параметра, отвечающих за выразительность Vocaloid (Harmonics, Noise, Brightness и Clearness), могут управляться значениями динамики нот. Все произведенные манипуляции разрешается сохранять как в специальном MIDI-файле для дальнейшего использования в Vocaloid Editor, так и в обычном MIDI-формате (с нотами, значениями динамики, питчами и т. п.).


 
Рис. 65  
   

Кроме того, Vocaloid VSTi вызывается и активизируется напрямую из VocController (только в последней версии программы — 1.2) и не задействует систему MIDI-маршрутизации секвенсора. От секвенсора, с которым планируется использовать VocController, требуется поддержка функции передачи MIDI-данных между VST-инструментами. Среди протестированных на совместимость хост-приложений разработчики программы называют Cubase SX/SX2, Ableton Live 4, FL Studio 4 и другие, однако в случае сомнений можно просто скачать демо-версию с сайта программы (www.tazman-audio.co.uk/products/vocController.htm) и убедиться, что называется, воочию. Демо-версия устанавливается с подробным мануалом в формате PDF, кроме того, на сайте www.vocaloid-user.net в разделе Tutorials есть очень подробная "обучалка" по работе с VocController. Там можно найти ответы решительно на все вопросы.

Впечатления
Как вы помните, в начале статьи я назвал Vocaloid буквально революцией в области вокального синтеза. И даже привел в качестве примера успех Steinberg Virtual Guitarist в моделировании гитары. Безусловно, это так. Но не надо думать, что Vocaloid, как и Virtual Guitarist, позволит вам за пять-десять минут создать вокальную партию хорошего (даже не говорю — высокого) уровня. За пять минут вы получите результат, годный лишь для грубой демонстрации, но не больше. Пение покажется вялым, механичным, невыразительным и неестественным. Однако, если вы как следует повозитесь с инструментом, "пощупаете" многочисленные органы управления, послушаете их влияние на звук и подойдете к процессу творчески — Vocaloid вас не разочарует. Послушайте демонстрации (их наделали так много, что я даже не вижу смысла иллюстрировать работу инструмента самостоятельно) на сайте компании Yamaha (www.vocaloid.com) и на сайте компании Zero-G (www.zero-g.co.uk/index.cfm?articleid=804). Прежде чем покупать Vocaloid, имеет смысл познакомиться с его демо-версией, которая даже разрешает коммерческое использование полученных с ее помощью вокальных партий. Стоит сказать, что демонстрационные примеры Vocaloid представлены самого разного уровня — от довольно посредственных работ, в которых слышно множество артефактов, до настоящих произведений искусства, где очень трудно распознать искусственную природу голоса. Обязательно зайдите на неофициальный сайт поддержки инструмента (www.vocaloid-user.net/index.php) — там можно найти массу полезной информации, начиная от примеров и обучающих статей и заканчивая большим форумом пользователей Vocaloid со всего света. Для многих примеров приводятся MIDI-файлы (формата Vocaloid), которые дают возможность изнутри посмотреть, как сделана та или иная партия.

Хотя Vocaloid Lola, Leon и Miriam являются лишь первым поколением виртуальных вокалистов, уже сейчас при надлежащем подходе инструмент можно с успехом использовать для создания полноценных демонстраций и партий бэк-вокала. Конечно, Vocaloid и не создавался как замена живых исполнителей, но если вы работаете с музыкой, где вокалу отведена второстепенная роль, возможно, вам стоит внимательнее присмотреться к синтезатору.

Думаю, многих волнует приспособляемость Vocaloid к исполнению русскоязычного материала. Увы, вынужден вас разочаровать — фонемы русского и английского языков очень отличаются. Не говоря уже о сочетаниях фонем, формантах гласных звуков и т. п. До выхода библиотек с певцами, поющими на русском языке, об этом можно забыть. Даже если вы и введете русский текст латиницей и потратите массу труда на ручное редактирование транскрипции, выразительности и голосовых параметров (особенно резонансов), результат будет очень слабым. Да, инструмент под конец запоет по-русски, но с таким чудовищным акцентом, что ни о каком сколько-нибудь серьезном использовании полученной партии не стоит и думать.

Virsyn Cantor
В отличие от Yamaha Vocaloid (который можно для простоты назвать вокальным семпл-плеером, хотя это и не совсем так), Virsyn Cantor представляет собой самый настоящий синтезатор — для звукообразования инструмент не использует ни одного семпла. Принцип синтеза вокала в Cantor основан на отдельном моделировании работы голосовых связок, образующих базовое звучание голоса, и функционирования речевого аппарата, отвечающего за артикуляцию — то есть за произношение слов. Технически это реализовано при помощи генератора основного сигнала, определяющего частоту и тембр виртуального голоса, и специального управляемого формантного фильтра, который заставляет этот голос разборчиво говорить (вернее будет сказать — петь). Для моделирования глухих согласных фонем, например, "s", "t" и т. д., используется дополнительный генератор шума. Такая схема (вам она, кстати, ничем не напоминает VODER Хомера Дадли?) позволяет применять Cantor в качестве очень гибкого синтезатора для моделирования фактически любого "говорящего" инструмента.

При моделировании произношения Cantor преобразует слова и слоги заданного текста песни в последовательность фонем — составных кирпичиков человеческой речи. Фонетическая транскрипция производится при помощи специального словаря, включающего в себя более чем 120000 слов английского языка. Стоит заметить, что этот "словарь произношений" был любезно предоставлен разработчикам Университетом Карнеги-Меллона (Carnegie Mellon University). Полученная последовательность моделируется в реальном времени формантным фильтром и генератором шума. В результате, основной сигнал, поступающий с генератора голоса, обретает способность членораздельно говорить.

Cantor — это синтезатор, который работает полностью в реальном времени. Вы можете ввести в него слова песни и вживую исполнять вокальную партию, играя мелодические линии на MIDI-клавиатуре. Причем различными параметрами выразительности, вибрации и т. п. можно тоже управлять в реальном времени. Можно работать с синтезатором и как с Vocaloid — прописывать мелодию и текст в секвенсор, редактировать партию и лишь потом воспроизводить. Cantor способен одновременно синтезировать до восьми вокальных треков. Каждый трек настраивается и управляется индивидуально — от регулировок параметров голоса до распределения по разным MIDI-каналам и даже клавиатурным зонам. Более того, некоторые функции Cantor позволяют пойти немного дальше моделирования человеческого вокала — можно создавать самые фантастические голоса, которые, тем не менее, будут разборчиво петь на английском языке. Помимо редактора голоса Cantor имеет и редактор фонем — с его помощью можно менять и произношение синтезатора. В добавление к этому Cantor имеет свой процессор эффектов с весьма неплохим ревербератором и микшерный пульт.

Синтезатор написан для обеих платформ, Mac и PC, причем на каждой из них может работать как в виде самостоятельного приложения, так и в виде подключаемого модуля форматов VST 2.0 и Audio Units. Большим достоинством инструмента является полная совместимость разных его ипостасей — файлы голосов и проектов имеют одинаковый формат во всех случаях и могут свободно использоваться под любыми платформами и протоколами.

Системные требования и инсталляция
Минимальные системные требования Virsyn Cantor для платформы PC таковы. Процессор — Intel Pentium III/IV или AMD Athlon XP (c обязательной поддержкой SSE) с тактовой частотой от 600 мегагерц. Объем оперативной памяти не ниже 256 мегабайт. Не менее 300 мегабайт свободного места на жестком диске. Также необходимы ASIO- или DirectX-совместимая звуковая плата и видеоадаптер, способный "потянуть" разрешение экрана 1024 x 768 и 16-битную цветовую палитру. Операционная система — строго Windows XP.

Для платформы Apple Macintosh синтезатор запрашивает процессор G4 с обязательной поддержкой технологии Altivec и тактовой частотой не ниже 400 мегагерц, 256 мегабайт RAM и 300 мегабайт свободного дискового пространства. Кроме того, компьютер должен обладать устройством вывода звука, совместимым c Core Audio, и поддерживать минимальное разрешение экрана 1024 x 768. Операционная система — MacOS X 10.2.

Инсталляция Virsyn Cantor проходит без каких-либо затруднений — на РС программа установки запустится автоматически, как только вы вставите компакт-диск дистрибутива (если автораспознавание диска у вас отключено в системных установках, активируйте вручную файл setup.exe), на Mac дважды кликните по пиктограмме Installer. Для платформы PC Cantor устанавливается в двух ипостасях — как отдельное приложение и как модуль формата VST2. Надо, правда, заметить, что инсталляция VST-модуля происходит почему-то "в режиме самообслуживания" — надо вручную скопировать файл canttor.dll из рабочей директории Cantor в специальную папку для VST-модулей (например, C:\Program Files\Steinberg\VSTplugins) вашего секвенсора. Именно скопировать (продублировать), так как попытки добавить рабочую папку инструмента в список директорий с VST-плагинами внутри самого секвенсора никакого результата не дают. Для платформы Mac дела с сервисом обстоят значительно лучше — Virsyn Cantor сразу устанавливается и в виде самостоятельного приложения, и как VST-плагин, и как модуль Audio Units. Для начала работы с инструментом требуется лишь ввести регистрационный номер (он написан на обложке компакт-диска) при первом его запуске. Если у вас возникают проблемы, связанные с вводом номера при открытии Cantor внутри секвенсора Steinberg Cubase (Cubase SX), зайдите в настройки и активизируйте опцию Plugin receives key commands, после чего повторите регистрацию.

Настройки
Работая с самостоятельным приложением Cantor, вы можете произвольно задать нужный MIDI-вход и аудиовыход, если имеется выбор из нескольких вариантов. При первой загрузке после инсталляции инструмент автоматически возьмет аудио- и MIDI-драйверы устройств, стоящие в конфигурации системы по умолчанию. Если данные установки вас не устраивают, то (для PC версии), не выходя из окна инструмента, перейдите на закладку микшера Mix и в окошках соответствующих меню выставьте желаемые драйверы. В маковской версии такой номер, увы, не пройдет — драйверы можно выбирать лишь в программе конфигурации MIDI-аудиоустройств самой операционной системы.

Cantor является мультитембральным синтезатором — все его восемь треков могут одновременно исполнять вплоть до восьми разных вокальных партий. Каждый трек (Part) способен управляться по отдельному MIDI-каналу, и все (или несколько) треков могут получать сигналы управления с одного MIDI-канала. Также треки с вокальными партиями можно раскидать по разным клавиатурным диапазонам. Назначение MIDI-каналов и зон клавиатуры осуществляется на закладке Mix (читайте соответствующий раздел).

Многими (хотя далеко и не всеми) регуляторами Cantor можно управлять с внешнего MIDI-контроллера (например, при помощи микшерной MIDI-консоли, дополнительных кнопок и слайдеров MIDI-клавиатуры и т. д. и т. п.). Чтобы "привязать" ту или иную виртуальную ручку к управляющим сигналам внешнего MIDI-устройства, сначала кликните по ней правой кнопкой мыши (либо сделайте обычный клик, удерживая клавишу Ctrl). Если внешнее управление поддерживается, то при клике выскочит всплывающее меню с двумя опциями: MIDI Learn и MIDI Forget (рис. 66). Выбирайте первую опцию MIDI Learn, после чего подвигайте туда-сюда желаемый регулятор MIDI-контроллера, чтобы Cantor "научился" распознавать его сигналы — вы увидите, как ручка на экране начнет двигаться синхронно с регулятором. Чтобы сбросить назначение просто нажмите строчку MIDI Forget в том же меню. Список всех назначенных контроллеров управления сохраняется в файле VSMIDI.vsm, расположенном в рабочей директории Cantor.

Рис. 66

Cantor имеет интересную возможность корректировки основного строя синтезатора — то есть позволяет использовать не только один лишь темперированный строй. В установочной директории синтезатора есть специальная папка с именем Tuning. Там расположены совместимые со специальной программой Scala (подробности смотрите на странице www.xs4all.nl/~huygensf/scala) файлы различных строев: *.scl, *.tun. Чтобы изменить темперированный (по умолчанию) строй какого-либо из треков, нужно поместить в эту папку файл нужного строя, изменив его название на имя требуемого трека — например, part1.scl, part2.scl и т. д. Чтобы изменения вступили в силу, надо перезагрузить синтезатор (выключить и запустить заново).

При запуске Cantor автоматически загружается дефолтный файл проекта. Он находится в установочной папке синтезатора и называется Default.vcp. Вы можете подставить вместо него любой свой проект, назвав его тем же именем.

Работа с синтезатором
Virsyn Cantor имеет два режима работы: ручной и автоматический. В первом из них синтезатор в реальном времени воспроизводит MIDI-ноты, поступающие извне (с MIDI-клавиатуры или из хост-секвенсора), а текст песни считывает из своего окна Score. То есть за интонирование виртуального певца отвечают входящие MIDI-ноты. Те же ноты, которые "забиты" в редакторе Score самого Cantor, игнорируются — они являются лишь носителями исполняемого текста и определяют порядок исполнения слогов и слов. Иными словами, как только вы взяли ноту на клавиатуре, то с ее высотой будет пропет текст, назначенный на первую ноту в редакторе инструмента, при взятии второй ноты исполняется текст следующей ноты Cantor, и так далее. Когда все ноты с текстом закончились, процесс зацикливается, и отсчет опять начинает идти с текста первой ноты синтезатора. Таким образом, можно подряд на разные лады пропевать одну и ту же фразу.

В автоматическом режиме Cantor воспроизводит MIDI-ноты со всеми сопутствующими параметрами и текстом из окна Score, то есть работает как самый обычный секвенсор. Поскольку синтезатор может использоваться как в самостоятельном виде, так и как подключаемый модуль формата VST или Audio Units, есть некоторая специфика использования режимов для каждой ипостаси.

Когда Cantor работает как отдельное приложение, он находится в ручном режиме до тех пор, пока не запущен его внутренний секвенсор (иными словами, пока не нажата кнопка Play в панели транспорта). В случае же запуска синтезатора из секвенсора в качестве VST/AU-инструмента всеми функциями транспорта управляет хост-программа (то есть секвенсор). В автоматическом режиме Cantor по-прежнему берет ноты, текст, контроллеры и автоматизацию из собственного окна Score, однако навигация по вокальной партии, ее воспроизведение и остановка осуществляются уже с транспортной панели хост-секвенсора. В ручном режиме синтезатор заимствует ноты из трека секвенсора, на который назначен (либо с подключенной к этому треку MIDI-клавиатуры), а текст — из окна Score. Чтобы записать в Cantor текст, сначала нужно забить в Score любые (совершенно произвольные) ноты, на которые вы будете назначать слова (слоги). Мелодическая линия, команды навигации и транспорта, повторяю, будут поступать из хост-секвенсора. Если вы сначала не определились, с каким режимом будет удобнее работать — не беспокойтесь, между ними можно переключаться в меню (рис. 67), всплывающем при клике по букве M или A (в зависимости от текущего режима) в черном поле навигационной информации Sequencer Information справа от кнопок транспорта.

Рис. 67

Основное рабочее окно Cantor — это все тот же клавишный MIDI-редактор (самая первая закладка Score — рис. 68). В нем (как и в Vocaloid) производится создание и редактирование мелодической линии песни и ввод ее текста.


 
Рис. 68  
   

На правой границе окна синтезатора расположены восемь закладок переключения треков (Parts). Единовременно можно работать лишь с одним из них, однако вы можете видеть "просвечивающие" силуэты нот, принадлежащие другим трекам (рис. 69). Интерфейс пользователя организован значительно менее удобно, нежели в Vocaloid. Отдельные моменты, например, невозможность редактировать длину ноты стрелкой, а не карандашом, удаление нот только ластиком и т. п., просто выводят из себя. Однако, по большому счету, принципиальных различий в работе с клавишным редактором очень мало.


 
Рис. 69  
   

Тактовая линейка Measure Ruler одновременно выполняет несколько функций, помимо отображения текущих тактов и позиции воспроизведения. Если за нее уцепиться мышью и потянуть в горизонтальном направлении (влево или вправо), будет происходить прокрутка содержимого окна Score в том или ином направлении. Если же потянуть мышью вверх или вниз, то вы сможете изменять горизонтальный масштаб рабочего поля клавишного редактора. Вертикальный масштаб не меняется.

Чтобы расставить границы зоны Loop, внутри которой материал будет воспроизводиться по кругу, надо мышью выделить на линейке Measure Ruler нужный участок. Если требуется впоследствии передвинуть границы Loop — просто перетащите их в нужное место. Стоит сказать, что выделение и перемещение зоны Loop реализовано очень неудобно: приходится целиться мышью очень точно, малейший промах — и вы будете прокручивать такты, а не выделять Loop.

Справа от кнопок транспорта находится черное поле Sequencer Information. В нем, помимо информации о текущей позиции воспроизведения и выбора режима работы (для VST/AU-модуля), производятся следующие настройки. Во-первых, ритмический размер проекта (буква T и дробь после нее). Числитель дроби обозначает количество долей в такте, знаменатель — длительность каждой доли. Чтобы изменить размер, надо отдельно задать значения числителя и знаменателя (при клике по ним открываются списки с доступными значениями). Во-вторых, шаг квантизирования (Q). Диапазон квантизирования — от целой ноты до одной тридцать второй, включая все триоли и ноты с точкой. Включает и отключает квантайз голубая кнорка с символом ">|<" (она расположена справа от панели инструментов). В-третьих, степень свингования (S), задается в процентах. И, в-четвертых, темп проекта. При работе с VST/AU-модулями темп определяется хост-секвенсором.

В правом нижнем углу окна Score расположен индикатор загрузки процессора компьютера.

Если кликнуть правой кнопкой мыши в логотип компании Virsyn, расположенный в верхнем левом углу окна синтезатора, то откроется меню, в котором можно выбрать цветовую схему интерфейса Cantor (рис. 70). Правый клик в любое другое место интерфейса (за исключением, разумеется, рабочих полей окон) позволит открыть PDF-мануал синтезатора или сайт разработчиков.

Рис. 70

Как и в Vocaloid, можно назначить на ноту целое слово или отдельный слог, однако Cantor позволяет назначать на ноты и многослоговые слова. Вообще, вы добьетесь лучших результатов, если разложите слова текста на слоги-ноты, так как сможете управлять их длительностями, изменяя длину нот в редакторе Score или даже просто беря ноты на клавиатуре. Однако если слово распределяется по слогам на несколько нот, следует ко всем слогам, кроме последнего, добавить символ "-". Например, слово cantor, разложенное на две ноты будет выглядеть так: "can-" и "tor" (рис. 71).

Рис. 71

Дефис, добавленный к слогу, дает Cantor понять, что слово на этом не заканчивается и впереди будет следующий слог (и так до тех пор, пока не появится слог без дефиса). Или вот обратная задача — сделать распевку одним слогом на несколько нот. Возьмем для примера стандартное "La". Для первой ноты распевки вписываем La с дефисом — "La-". Остальные ноты помечаем лишь знаком дефиса вместо текста (рис. 72) — тогда Cantor пропоет фонемой "а" всю мелодическую линию. Если вместо "La" взять какое-нибудь слово из нескольких слогов и таким же образом распеть его на несколько нот, непосредственно распеваться будет последняя гласная фонема, а слово проговорится лишь на первую ноту.

Рис. 72

При вводе текста автоматически включается функция автотранскрипции. При желании ее можно отключить, деактивировав голубую кнопку с буквой "i". Фонетические символы произношения выводятся, как и в Vocaloid, прямо под нотой. Обычно Cantor адекватно транскрибирует произношение слов. Однако если этого по каким-то причинам не произошло, или вам требуется нестандартное произношение, вы можете редактировать транскрипцию напрямую. Просто кликните по транскрипции слова под нотой и напишите туда свою (в соответствии с таблицей фонетических символов из мануала).

Cantor не имеет специальных атрибутов выразительности, которые назначаются на ноты, как в Vocaloid. Поэтому все подобные регулировки осуществляются в расположенном внизу окна Score треке управления, называемом Automation Editor. Он позволяет редактировать два типа параметров: одни являются конкретной величиной для каждой ноты (Velocity, Gender, Breath, Balance — рис. 73), а другие представляют собой огибающие, динамически изменяющие свои значения в процессе воспроизведения конкретной ноты (Pitch, Level, Brightness, Pan, Vibrato Rate, Vibrato Depth — рис. 74).

Рис. 73

Рис. 74

Изменение "частокола" обычных параметров осуществляется вполне традиционно — карандашом или стрелкой. Редакция параметров с огибающими требует некоторых пояснений. Чтобы вывести в окне Automation Editor огибающую, нужно сперва выделить ноту в поле клавишного редактора. Каждая из нот партии может иметь индивидуальные настройки любого параметра с динамическим управлением. При копировании ноты копируются и все ее динамические регулировки. Огибающая представлена в относительном масштабе времени — при увеличении длины ноты все ее фазы также увеличиваются, и наоборот. Управляющая кривая разделена на две части: атаку (Attack) и затухание (Release). Первая часть отвечает за время от получения команды Note On до ударной гласной, а вторая за "поведение" ноты после команды Note Off. Каждая из частей может иметь неограниченное количество фаз огибающей. Для каждой фазы создается узел (надо кликнуть по линии, придерживая клавишу Shift), который можно двигать мышью. По обеим сторонам от узла находятся маленькие черные точки, потянув за которые, можно изменить форму огибающей между соседними узлами.

С левой стороны окна Score расположено множество ручек, регулирующих различные параметры вокальной партии. В самом верху находятся окошки транспонирования и точной подстройки синтезатора. Кнопка Legato отвечает за продолжительность звучания нот во время игры — если режим Legato включен, то Cantor будет пропевать текст взятой ноты до тех пор, пока нажата клавиша. Если Legato отключено, то слова будут исполняться в соответствии со своими внутренними установками времени (длительностями фонем и т. п.), даже если нота еще держится. Ручка Bright регулирует общую яркость (Brightness) для всего голоса (ее же можно индивидуально задать для каждой ноты в треке управления). Ручка Ensemble определяет уровень эффекта хора, а Metallic — эффекта Metallize (звук приобретает металлическую окраску, напоминает эффект частотной модуляции). Humanize позволяет оживить голос, задавая случайную нестабильность по высоте — голос начинает немного "дрожать". Регулятор Balance позволяет изменить соотношение уровней тональной и шумовой составляющей голоса. Ручки V Rate (Vibrato Rate) и V Depth (Vibrato Depth) отвечают за параметры частоты и глубины вибрато соответственно. Кнопка MWheel (Modulator Wheel) включает режим управления вибрато с колеса модуляции MIDI-клавиатуры или сигналов соответствующего MIDI-контроллера. Регулятор Gender сдвигает по спектру форманты, обеспечивая возможность получения разных типов голосов: от низкого мужского до высокого женского или детского. Ручка Breath добавляет в голос дополнительную шумовую составляющую — своеобразное "придыхание". Значение Glide определяет время эффекта Portamento, позволяя немного "замылить" математическую точность попадания виртуального певца в ноты. Про ручки громкости, панорамы и индикатор уровня, я думаю, рассказывать не надо.

Слева от кнопок транспорта расположено меню, в котором можно сохранить проект (а также загрузить проект, создать новый, сохранить и загрузить пресет голоса, пересчитать партию в аудиофайл). Чтобы открыть меню, кликните мышью по символу дискеты (рис. 75). В двух синих окошках слева от дискеты отображается название текущего проекта (в левом) и пресет голоса, загруженный для данного трека (в правом). Опция Render Loop осуществляет рендеринг материала, находящегося в границах выделения Loop. PC-версия синтезатора осуществляет пересчет вокальной партии в WAV-файл, а маковская — в формат AIFF.

Рис. 75

Проекты, созданные в VST- или AU-ипостасях Cantor, автоматически сохраняются с проектами используемого хост-секвенсора (то есть при помощи секвенсорных команд сохранения).

Редактор голоса Voice
На закладке Voice находится редактор параметров голоса (рис. 76). В нем можно регулировать настройки заводских пресетов, а также создавать свои собственные шаблоны и сохранять их для дальнейшего использования. Каждый из восьми голосов синтезатора можно редактировать индивидуально, переключаясь между треками Parts во время работы.


 
Рис. 76  
   

Верхняя часть редактора Voice отвечает за тональную составляющую голоса. В окне Partials видна спектрограмма сигнала, где высота каждой вертикальной линии отображает уровень соответствующей гармоники — говоря проще, вы видите графическую интерпретацию (вернее, разметку) преобразования Фурье. Произвольно изменяя гармонический состав сигнала (рисуя нужную кривую мышью), можно делать с его тембром буквально все, что угодно. Если в поле спектрограммы кликнуть правой кнопкой, то в открывшемся меню (рис. 77) можно выбрать образец волны — синусоиду, пилу, треугольник, прямоугольник, а также скопировать, вставить и вставить зеркальное отражение содержимого окна.

Рис. 77

Кроме окна Partials, изменять тембр голосового сигнала можно при помощи полупараметрического двухканального эквалайзера. Первый канал (EQ High) отвечает за верхнюю часть спектра, второй (EQ Low) — за нижнюю. Полупараметрическим я его назвал потому, что регулируются лишь частота и коэффициент усиления, в то время как добротность настройке не подлежит.

В графе Partials слева от окна спектрограммы определяется количество гармоник, присутствующее в сигнале, а в графе Bend задается рабочий диапазон колеса Pitch Bend — то есть количество полутонов, на которое будет увеличиваться/уменьшаться базовая частота сигнала при максимальных отклонениях колеса.

Второе (нижнее) окно спектрограммы определяет частотный состав шумовой составляющей голоса. Редактируя огибающую линию на графике, можно, например, исключить из шумового сигнала низкочастотные составляющие, подрезать самый "свистящий" верх и т. п. При помощи ручки NoiseMod можно подстроить характер шумовой составляющей в общем сигнале. Регулятор Blur позволяет "размыть" голос, сделать его чуть мягче.

Остальные настройки редактора Voice отвечают за реакцию голоса на команды MIDI-контроллеров. Ручка Velocity задает чувствительность громкости голоса к сообщениям динамики. Ручка Brightness определяет максимальную величину параметра яркости голоса при поступлении команд управляющих контроллеров, которые задаются в окошке под ней. Например, можно регулятором Velocity задать необходимое изменение громкости от динамики игры, а, привязав тот же контроллер (Velocity) к функции Brightness, обеспечить и одновременное увеличение (или уменьшение — есть возможность задания обратной зависимости) яркости голоса. В меню Sustain Mode производится выбор режима работы педали сустейна. Используя педаль, можно во время живой игры на время задержать чередование слов в окне Score, например, для "распевания" одного слова по нескольким нотам.

Все изменения, произведенные в редакторе Voice, можно сохранить в файл через меню, открывающееся при клике по символу дискеты слева от кнопок транспорта. Там же доступна и загрузка голосового пресета, так что для этой цели нет надобности переключаться между окнами.

Редактор фонем
Редактор фонем, расположенный на закладке Phoneme (рис. 78), обеспечивает возможность индивидуальной настройки звуков речи, вырабатываемых синтезатором. Cantor использует тридцать девять фонем для словообразования, такой набор составляет пресет фонем (Phoneme Set). В комплекте с инструментом поставляются несколько заводских пресетов (они не подлежат редактированию), которые можно использовать как есть или брать в качестве основы для создания пользовательских пресетов.


 
Рис. 78  
   

Чтобы выбрать тот или иной набор фонем, кликните в графу Phoneme Set, и в открывшемся списке укажите нужный (рис. 79). Как видите, в списке присутствуют также слоты для пользовательских пресетов и функции копирования, вставки и сохранения.

Рис. 79

Расположенная ниже графа Phoneme List открывает список всех фонем синтезатора (рис. 80) и отображает в окне редактора настройки указанной вами фонемы (среди них встречаются как одиночные фонемы, так и дифоны — созвучия из двух фонем).

Рис. 80

Если вы еще не забыли теорию, то, наверное, помните, что звуки речи бывают гласные и согласные, последние, в свою очередь, подразделяются на вокализованные и невокализованные. Эти атрибуты фонемы определяются кнопками Vowel (гласная) и Voiced (вокализованная). В зависимости от положения кнопки Voiced, в окошки спектрограмм выводятся настройки спектра тональной или шумовой составляющей фонемы. Для невокализованной согласной все частоты спектра голосовой составляющей (Voiced активна) "зарезаны". Для вокализованной — определенные частоты присутствуют как в шумовом, так и в тональном спектре фонемы. Гласным звукам наличие шумового спектра не требуется, но если это вам надо для каких-то целей, редактор позволяет добавить "придыхание" и для гласных фонем.

Изменение спектра (как шумового, так и тонального сигналов) осуществляется при помощи мыши. Узелки формант и антиформант (пики "провалов" между формантами) передвигаются по частоте и амплитуде, а если потянуть за соединяющие их линии, можно изменить и добротность форманты. Кроме того, правый клик в окно спектрограммы открывает меню, позволяющее сбросить частотные регулировки, скопировать и вставить настройки спектра и даже скопировать и вставить полные настройки фонем (рис. 81).

Рис. 81

Вы спросите — а зачем нужно второе окно спектрограммы? Объясняю. Часть фонем Cantor представляют собой двоезвучия — дифоны. Некоторые одиночные фонемы также немного изменяются в процессе звучания. Так вот. Первое (верхнее) окно задает начальный спектр фонемы, а второе (нижнее) — конечный. При синтезе фонемы осуществляется плавный переход (морфинг) от одного состояния к другому. Временные параметры и уровни каждой из фаз определяются в окошках регулировки слева от окон спектрограмм. Увеличение значения Damping позволяет приглушить общее звучание фонемы. Атрибут Sustain (единовременно может быть активна лишь одна кнопка Sustain) задает фазу фонемы, которая будет "распеваться" в течение длительности ноты. При этом фаза с неактивным атрибутом воспроизведется в соответствии со своими индивидуальными временными установками.

Секция эффектов
Cantor предлагает также четыре типа эффектов: Distortion, Echo/Delay, Chorus и Reverb. Для доступа к ним зайдите на закладку FX (рис. 82). Эффекты могут независимо включаться и настраиваться для каждой из восьми частей Parts (только с ревербератором не все так просто). Чтобы активировать тот или иной эффект, нажмите соответствующую кнопку On — она при этом загорится. Для отключения эффекта нажмите On еще раз.


 
Рис. 82  
   

Distortion предлагает четыре типа эффекта, определяющие характер перегрузки: Distortion, Soft Distortion, Tape Distortion и Tube Distortion. Для выбора кликните мышью в окошко, расположенное над ручками управления, и выберите из списка нужное название. Регулировки эффекта вполне традиционные: Level — уровень амплитуды выхода эффекта, Drive — глубина перегрузки, Cutoff — частота среза обрезающего фильтра, Tone — тембр.

Echo/Delay имеет три вариации: Stereo Delay, Mono Delay и Cross Delay (задержанный сигнал воспроизводится поочередно в разных каналах). Ручки Level, Feedback и Cutoff регулируют уровень эффекта, глубину обратной связи и частоту среза фильтра соответственно. В окошках Delay1 и Delay2 задается величина обеих задержек. Если расположенная справа кнопка MIDI выключена, то значение времени задержек отображается (и регулируется) в миллисекундах, если активна — то в ритмических долях проекта.

Chorus по вашему выбору может превратиться также в Phazer или Flanger. Все настройки эффекта стандартные: Delay — величина задержки, Level — уровень выхода, Depth — глубина эффекта, Rate — частота "вращения", Feedback — глубина обратной связи.

Ручки управления всех трех эффектов (включая и значения задержки Delay) можно привязать командой MIDI Learn к сигналам управляющего MIDI-контроллера.

А вот ревербератор не так прост. Во-первых, управлять эффектом можно лишь мышью на экране. Во-вторых, его нельзя включить для одной вокальной партии и деактивировать для другой — включается и выключается эффект для всех треков одновременно. Ревербератор имеет двадцать четыре пресета и вполне серьезный набор регулировок. Помимо уровня эффекта (Level), времени ранних отражений (Pre-Delay), размера "помещения" (Size) и скорости затухания "хвоста" (Time), присутствуют ручки управления такими продвинутыми параметрами, как Damping (заглушение), Fusion (слияние) и Structure (структура).

Микшер
Микшер Cantor (рис. 83), расположенный на закладке Mix, объединяет в себе не только органы управления громкостью и панорамой вокальных треков, но отвечает также за аудио- и MIDI-настройки синтезатора. В правом верхнем углу микшера находятся меню выбора устройств для MIDI-входа и аудиовывода. Если в вашей системе установлены несколько звуковых плат или MIDI-интерфейсов, то вы можете произвольно указать нужные из них в соответствующих окошечках. Само собой, это справедливо лишь для самостоятельного приложения Cantor — при использовании его в качестве VST-инструмента будет использоваться MIDI-аудиосистема секвенсора, и оба меню исчезнут с экрана.


 
Рис. 83  
   

Теперь рассмотрите внимательно линейки микшера. Каждая из них соответствует своему треку Part. Помимо кнопок заглушения и солирования, ручек громкости, панорамы и уровня реверберации (сам эффект настраивается на закладке FX), линейки предлагают индивидуальные MIDI-настройки для Parts. В окошке MIDI Channel выбирается MIDI-канал трека — можно все треки раскидать по разным MIDI-каналам. В меню Keysplit Low/High осуществляется определение границ клавиатурного диапазона, в пределах которого будет играть данный трек. Можно, например, при живом исполнении подготовить несколько фраз и назначить каждую на свою часть клавиатуры. Чтобы снять назначение, выберите в каждом меню опцию No Split. Следующее окошко, Voice Preset, позволяет загрузить файл настройки голоса для данного трека. Та же самая функция доступна и в окне Score, однако микшер позволяет видеть голосовые пресеты одновременно для всех треков сразу, что иногда бывает удобнее.

Еще на закладке микшера присутствует мастер-секция. Мастер-фейдер изменяет общий уровень выхода инструмента, а ручка Reverb делает то же самое для всех регуляторов уровня реверберации (это не регулятор отдельного эффекта, как может показаться сначала).

Впечатления
Огромной недоработкой разработчиков Cantor, на мой взгляд, является полное отсутствие хоть сколько-нибудь вменяемых демонстрационных примеров. Посмотрите, как "распиарили" Vocaloid — даже явно неудачные примеры, но помещенные в подобающий контекст, звучат (а, следовательно, и характеризуют инструмент) в выигрышном свете. На интернет-странице Cantor (www.virsyn.de/en/E_Products/E_CANTOR/e_cantor.html) можно скачать и послушать лишь жалкие голые фразы, демонстрирующие больше недостатки, чем достоинства Cantor. Совершенно иное впечатление производит видеоролик с выставки MusikMesse во Франкфурте (апрель 2004), где один из создателей синтезатора Harry Gohs вживую показывает его возможности (правда, тоже вне контекста). Обязательно посмотрите ролик — он очень полезен и в обучающих целях. Ссылка на него красуется на самом видном месте интернет-страницы Cantor.

Что я могу лично сказать про синтезатор? Это не Vocaloid, и не стоит ожидать от него стопроцентного сходства с живым человеческим голосом. Хотя, если серьезно поработать над партией и использовать ее на заднем плане или для бэк-вокала — еще придется прислушиваться, чтобы это заметить. Однако не следует забывать, что разработчики создавали свой синтезатор не в качестве замены живых вокалистов. Основное предназначение Cantor — открыть новые творческие горизонты композиторам и саунд-дизайнерам, обеспечив им самые широкие возможности для экспериментов с "говорящим" звуком. В этом возможности синтезатора выше всяких похвал.

Заключение
Я постарался максимально подробно и непредвзято рассказать об обоих вокальных синтезаторах. Как видите, нельзя дать однозначный ответ, кто из них лучше, а кто слабее, так как Vocaloid и Cantor просто занимают разные ниши и ориентированы, по сути, на разное использование. Vocaloid является имитатором именно человеческого голоса, причем известны даже имена тех людей, голосом которых он поет. Cantor же, напротив, совершенно не привязан не только к человеку, но и вообще какому-либо голосовому источнику, поскольку может использовать в качестве основы для звукообразования сигнал любого типа. Мне это напоминает сравнение синтезатора с семплером — оба устройства востребованы и оба же успешно решают стоящие друг перед другом задачи. Так и здесь. Vocaloid требуется для имитации натурального вокала. Cantor идеально подходит для электронной музыки и необычных говорящих эффектов. Каждый по-своему хорош и, на мой взгляд, оба "певца" будут должным образом востребованы среди музыкантов.

Yamaha Vocaloid
www.vocaloid.com
Virsyn Cantor
www.virsyn.de

  Оценка статьи

Посещений: 4927 | Проголосовавших: 2 | Средняя оценка: 2.0

   

  Комментарии

22.09.07 20:31
N
Хорошо! Пусть бы дальше пошли разработчики.Но ещё лучше было бы "выпевать" (клавиатурными-мидиклавиатура или гриф)на синтезаторе в виде музрифов(пассажей с различными штрихами,динамикой) отдельные строфы или стихотворения.

08.10.07 07:51
стеф
к сожалению не упомянули в истории наш страшный и могучий АНС,а так историческая подборка на 5

16.12.08 15:01
Сотник e.sotnikov@mail.ru
Забавный софт для распространения дурновкусицы. Безусловно, ещё рано человеку подделывать человека. Но обязательно нужно заниматься этим!

В связи с обилием спама размещение комментариев отключено. Пользуйтесь форумами.

РЕКЛАМА

 
       


Цены на рекламу


Музыкальное Оборудование
www.muzoborudovanie.ru
www.moline.ru
mail@muzoborudovanie.ru
© Агентство ДАТА