highland's diary

一年で12記事目標にします。

ボカロ音楽の「透明性」と、歌唱の「人間らしさ」の関係について

asyncvoice.booth.pm

編集で関わりました評論同人誌『ボーカロイド文化の現在地』が通販にて販売開始しました。

冬コミ、C103の1日目でも頒布予定になっています。『ボーカロイド文化の現在地』に加えて、新刊のコピ本『ボーカロイド文化の番外地』やカラーイラストのペーパーを出す予定です!

よろしくお願いいたします。

同人誌の掲載記事のなかからサンプルとして1記事掲載しようと思ったのですが、他の方の寄稿記事から選ぶのもはばかられるため、私自身の寄稿記事を掲載させていただきます。

「ボカロ音楽の「透明性」と、歌唱の「人間らしさ」の関係について」というタイトルです。

執筆時からもうすでに情報が古くなってしまっている部分もありますが、2023年10月時点での認識として書き残したものになっています。

Web掲載に際していくつか参考リンクを加えたりしています。また、Soundmainのサービス終了にともない当該サイト上のインタビュー記事がFlatさんのnoteに転載される形になったため、転載先のURLを付記しました。

ご興味ある方はお読みいただければと思います。ご批判やコメント等いただけましたら幸いです。

 

______________________________________________________

ボカロ音楽の「透明性」と、歌唱の「人間らしさ」の関係について

1.はじめに

 「ボカロ音楽」の定義は何か?というと、「ボカロが使われている音楽」ということになる。細かい問題をすっ飛ばして言えば、「ボカロ=合成音声シンガーの歌唱による音楽」のことであり、逆に、この世にあまた存在するボカロ音楽の共通項はこの一点に限られる。

 すなわち、ボカロ音楽は「声がボカロであること」という条件によって規定されているジャンルだ。よくボカロ音楽の特徴として「高速早口歌唱」「音域が広い」「シニカルな歌詞」などが指摘されることがあるが、これらはあくまで一部の流行りの楽曲に当てはまる特徴であり、ボカロ音楽の定義とは関係がない。これらは、「声がボカロである」というおおもとの条件から派生した特徴であり、「結果的にそうなっている」という方が実態に近いだろう(実際、このような特徴に当てはまらない曲は山ほどある)。また、今はボカロ音楽出身のアーティストがメジャーデビューすることによってJ-POPの一部においてもこうした特徴は散見されるようになっており、必ずしもボカロ音楽に固有のものとは言えなくなっている。

 したがって、ボカロ音楽の特異性について考えるにあたっては、あくまでそれが「ボカロの声により歌われている」という点に着目する必要がある*1。歌曲を人間ではなくボカロが歌うことによって、どのような特異性がボカロ音楽には生まれているのだろうか?

 本稿では、先行する言説を参照しつつ、「ボカロ音楽の特異性」として「透明性」が語られてきたということについて述べ、それが「人間らしさ」とどのような関係を持っているかについて論じる。次いで、合成音声の分野におけるAI技術の進展によって、そのボカロ音楽の特異性にどのような変化が生じるかということについて考えたい。

 

2.ボカロ音楽の特異性

 ボカロシーンの初期より活躍し、教本なども手がけるボカロPであるアンメルツPは、「ボカロ曲を作ることの魅力」について、以下の四点を挙げている。作り手目線での意見ではあるが、リスナーから見たボカロ音楽の魅力についても関わってくるものだ。

1:誰でも歌モノ楽曲が作れる

2:人間ではなかなかできない歌わせ方をした曲が作れる

3:作曲者のメッセージが、ほかの人間を媒介せずに伝わる

4:歌ってもらうこと自体が楽しい!

 

ボカロ曲の作り方①【ボカロの歴史/ボカロPの作業/基礎知識】 | plug+(プラグ・プラス) https://plugplus.rittor-music.co.jp/training/series/how-to-make-vocaloid-songs/01-vocaloid-attraction/2/(2023年10月5日閲覧)

 このうち1については説明は不要だろうが、ボカロを使うことで、自分の声で歌えない、あるいは歌唱に自信がない人でも歌モノを作れるようになったことで、インディーな場としてボカロシーンが盛り上がって多様な音楽性が生まれたという点が指摘でき、本稿では取り上げないが重要なポイントだ。

 2については、アンメルツPは「初音ミクの消失」のような高速歌唱や、1オクターブを超える音域の曲を労せず作れるということを指摘し、「人間が歌うことを念頭に置かなくとも楽曲のアイデアを膨らますことができ」ると述べている。高速歌唱や広い音域に付け加えるならば、例えば「息継ぎがない」曲が作れるというのがあり、これを曲のテーマとして活かした「ノンブレス・オブリージュ」という曲もある。あるいは、「一千光年」のような異常に長いロングトーンや、あるいは音程が乱高下する曲などもこれにあたるだろう(もちろん、これらは誰にとっても分かりやすい特徴を抜き出したものであり、「歌いにくさ」も実際にはもっと多様な観点から見れることは確かだろう)。

 ニコニコ動画においてはこういった「人間が歌う難易度が高い」ボカロ曲には「歌ってみろ」というタグがつけられており、2023年10月現在「頓珍漢の宴」「高音厨音域テスト」「マシンガンポエムドール」などの曲が並んでいる。


www.youtube.com

 

 4については純粋に作り手目線の話なためここでは割愛する。

 本稿が注目したいのは3の「作曲者のメッセージが、ほかの人間を媒介せずに伝わる」ということについてだ。アンメルツPは以下のように述べている。

 これはどういうことかと言うと、前出の『カゲロウプロジェクト』など、ストーリー楽曲にとりわけ言えるのですが、作曲者の持っている世界観やメッセージなどを、ほかの人間を媒介せずに直接伝えることが可能なのです。そういった”色の無い器としてのボカロ”が魅力の1つです。

 例えるなら、色の無い器(ボカロ曲)を用意して、そこに思い思いにみんなが料理(派生作品)を盛り付けていく。そうすると器も美しい、料理も美味しいで、みんな幸せになれる感覚を私は感じています。

(※太字は原文ママ

 ここで言われているのは、ボカロで曲を作ることによって、世界観やメッセージなどを、ほかの人間(=歌い手)を媒介せずに直接伝えることが可能だということだが、ボカロのことを「色の無い器」と形容していることに注目したい。

 「色の無い」というのは「透明」と言い換えることができる。即物的な次元においてはボカロはあくまで合成音声ソフトであり、自我を持たない。人間の歌い手が曲を歌う場合、作曲者・作詞者が別にいたとしても、必ずその歌い手の自我がそこに介在してしまうのだが、ボカロだとこれが起こらず、あくまで「透明」な器として機能する。

 こういった意味での「透明性」がボカロ音楽の特異性の一つとなっている可能性は大きい。そして先行文献を参照すると、これと部分的に重なるような指摘は、これまで多くのクリエイターやリスナーによってされてきたのだと分かる。次章においてはそれについて述べていく。

 

3.ボカロ音楽の「透明性」について

 まず取り上げるのは、ボカロPであり音楽評論家の鮎川ぱてが『東京大学ボーカロイド音楽論」講義』(文藝春秋、2022年、p.142~143)で「ロストワンの号哭」を例に論じている内容だ。鮎川ぱては「透明性」ではなく「函数性」という言い方を使っている。当該箇所を引用する。

(中略)「ロストワンの号哭」を「自分の中の分裂と葛藤」という視点で解釈した人は多いでしょう。(中略)この曲の印象を「自分に向かって叫んでいるようだ」と語った学生もいました。

 ただ、考えてみてほしいんですが、この曲が生身の人間のボーカリストによって歌われていたなら、みなさんはすぐにそのような視点を得られていたでしょうか?

 一般に、楽曲を人間の歌い手が歌うと、「その人が持っているメッセージを聞き手に向かってぶつける」という情報伝達モデル=聞き手の受容のモデルが成立することを免れません。もちろん、シンガーソングライターによる楽曲以外においては、この受容モデルはフィクションですが、それでも強固なこのフィクションを、作り手は活用しようとします。

(中略)

 また、この曲は非常にパッションフルなメロディです。とくにサビは叫ぶように高音域で歌う構成になっている。これを人が歌ったなら「オレはこう思っているんだぞー‼」と、歌い手が自分のパッションをぶつけている印象になっていたと思います。もっと暑苦しい印象だったでしょう。

 けれどもそうはなっていない。なぜならボカロが歌っているからです。

 ぼくはこの曲を、ボカロが歌うに相応しい名曲だと認識しています。ボカロ曲になるべくしてなった曲。ボカロが歌っているからこそ、聴き手は「歌い手の感情をぶつけられている!」とは感じず、その歌詞で表現される世界を我が事として、「僕」という一人称に自分を代入して聴くことができる。人の葛藤を聴かされているというよりも、それが自分の葛藤のように聴こえる。そこに自分を代入させられてしまうような効果が、ボーカルがボカロであることによって成立している。

 これをもって、次のように言いたいと思います。

 ボーカロイドには函数性がある。


www.youtube.com

 

 激情を歌った歌詞を、生身の人間ではない(=身体を持たない)「ボカロが歌っている」ことによって、リスナーはそのボカロという主体に自身を代入して聴くことができる。そのことを鮎川ぱては「函数性」と表現しているが、これはボカロが、メッセージを伝達するための「透明」な器として機能しているというアンメルツPの指摘とも軌を一にしていると言えるだろう。

 そしてここで述べられているような「透明性」/「函数性」は、ボカロ音楽を論じたり語ったりする側ではない、作り手においても共有されている(されていた)認識であるようだ。ボカロPとして「ウミユリ海底譚」「夜明けと蛍」といった代表曲を持ち、現在はヨルシカのコンポーザーを手がけているn-bunaは、2017年のインタビューにて以下のように述べている。

 ボカロって、言ってしまえば声に感情がないじゃないですか。がんばって付けることもできますけど、声に感情がないこと自体、ボカロの長所だと僕は思うし、だからこそ聴く人が感情を好きなふうに入れられる。僕がボカロで作った歌に、リスナーの方が自分の経験や感情を当てはめて、いろいろな聴き方をしてくれるっていう。と言うことは、歌詞に重きを置いた聴き方をされやすいのかなって思うんですよ。それにボカロって、感情のない無機質さこそが面白い音楽じゃないですか。ある意味、アーティストとしての色を感じさせない。

──こと歌に関してはそうですね。

 はい。曲においては作曲者ごとの色も出ると思うんですけど。歌においてはそれを感じさせないっていうのが、この文化がここまで発展してきた理由だろうなと思うから、そういう要素を生かした曲を作っていきたいんです。

 

ヨルシカ「夏草が邪魔をする」インタビュー|気鋭ボカロP・n-bunaが新たに挑む“バンド”という表現手段 - 音楽ナタリー 特集・インタビュー

https://natalie.mu/music/pp/yorushika/page/2(2023年10月5日閲覧)


www.youtube.com

 

 n-bunaによれば、ボカロにおいては「声に感情がない」ことが長所になっており、それによって「聴く人が感情を好きなふうに入れられる」。これは先に紹介した「函数性」と重なる着想だといっても差し支えないだろう。また、くわえてn-bunaはその「函数性」が、ボカロの声の「無機質さ」に起因するという点を指摘している。これは彼がボカロ曲で主に使用していた初期の初音ミクやGUMIといったVOCALOIDが、ベタ打ち(ピアノロールにメロディと歌詞を打ち込んだだけの素の状態)だと生気のない無機質な機械音声であった、という性質とも関係しているだろう*2。また、論からはやや外れるが、「声に感情がない」というのはボカロシーンにおいて「歌ってみた」が発展した理由でもあると思われる。ボカロの原曲ではフラットなボーカルになっている部分を、歌い手が各々の個性でニュアンスを付けて歌い、自由に味付けすることができるからだ。

 ボカロの「透明性」に関して、もう一つ興味深い論点を指摘している作り手があり、それはボカロを用いてポエトリーリーディングの楽曲を制作するボカロPとして知られる「アメリカ民謡研究会」のHaniwaだ。

──合成音声のことをどのような存在として認識していますか?

「新しい楽器」という感じがします。ピアノを使えばそのピアノの音色を生かした音楽ができるというのと同じように、合成音声を使えば合成音声らしさを生かした音楽ができます。AIを利用した最近の合成音声は人間の発音やイントネーションにどんどん近づいていっていますが、やはり人間ではない合成音声にしかない魅力というものを感じます。

──もう少し詳しくお伺いしてもよろしいでしょうか。

たとえば、悲しい内容の歌があったら歌手は悲しそうに歌おうとすると思うんですけど、その瞬間の歌手は、本当に悲しいわけではないじゃないですか。そこに一種の、演技をしているような雰囲気を感じてしまうこともあると思うんです。

 

一方で合成音声が歌っている曲だと、演技も何も全部が嘘なわけですから、人間を通さずに言葉がやってくるというか、言葉が直接聴者にやってくる感覚があるのではないかと感じています。

 

アメリカ民謡研究会・Haniwaインタビュー 合成音声×ポエトリーリーディングで紡がれる、唯一無二の作風の根源に迫る

https://blogs.soundmain.net/17374/2/(2023年10月5日閲覧)/ 再掲先はこちら


www.youtube.com

 

 Haniwaが、合成音声が歌っている曲(≒ボカロ音楽)の魅力として挙げている「人間を通さずに言葉がやってくるというか、言葉が直接聴者にやってくる感覚」というのは、これまで確認してきた「透明性」とも共通するものだが、その理由付けとして、そもそも合成音声の感情は(いかに感情豊かな表現であっても)全てフィクションである、という性質を挙げているのが興味深い。

 Haniwaは前述のn-bunaの立場とは異なり、人間の発音やイントネーションに近い(=人間らしい)声であっても「透明性」のようなものは生起すると考えているようだ。この立場の相違については次章で論じる。

 ここでHaniwaが指摘しているのは、ボカロの感情がそもそも最初からフィクションだからこそ逆に真実性を見出すことができる、といったことだが、ピノキオピーの楽曲「君が生きてなくてよかった」(2017)の歌詞においてもそれに近い観点が表現されているとみることができる。

変わらぬ愛も 儚い恋も

君からすれば ただの記号で

正義も悪も 帰らぬ日々も

君の前では どうでもよくて

ずっと ずっと 君が生きてなくてよかった


www.youtube.com

 

 あくまでこの曲の解釈の一つではあるが、(当時の)VOCALOIDに歌詞を歌わせる際には言葉の意味をインプットすることはなく、言葉をすべて発音記号に直してエディター上で一音ずつ入力していくため、ボカロのソフトウェアが意味を解釈するというプロセスは挟まらない。ボカロが処理しているのはどこまでいっても単なる記号であり、そしてその感情の欠損が逆に「生きてなくてよかった」という長所として解釈されている。ボカロには感情がなく透明な存在だからこそ、作り手やリスナーに寄り添う存在ともなれる。そのような希望について歌い、支持された楽曲ではないだろうか。

 これ以外にも、「透明性」に関してはボカロアングラシーンで活躍するヒッキーPがインタビューにて「このボーカルの感情はボーカロイドのものなのか、作者のものなのか。その曖昧な半透明な感じがボーカロイドの魅力だ」というなっとくPの指摘に納得を表明している*3ほか、ボカロPのフロクロも、「日本文化における〈主客合一〉」を論じた記事において、ボカロ楽曲の「無人称性」が「〈ゼロ化〉した主体」への移入をもたらすのではないかという指摘を行っている*4。ボカロPとして活動歴のあるキタニタツヤも、ボカロ音楽について「声という一番手前にあって分厚いフィルターが限りなくニュートラルに近い」ので、「その奥の作り手の人間性が出るときはとことん色濃く出」ることを楽しんでいると発言している*5

 いずれにせよ、このような「透明性」に関わる観点が一定数以上の作り手や論者からボカロ音楽の特異性として語られてきたとはいえるだろう。

 

4.「透明性」を成り立たせている要因について

 次に述べたいのは、ボカロ音楽における「透明性」を成り立たせている要因は何なのかということだ。もちろん「声がボカロであること」がそれにあたるのだが、もう少し掘り下げると以下の二つに分けられるのではないかと思う。

A.  ボカロの声に「合成音声/機械音声らしさ」が残っている、ないし合成音声であることを示すようなシグナルがあること

B. アーティスト名やボーカル名の情報やキャラクターの認知など、「ボカロが歌っている」ことが分かるコンテクストが存在すること

 AとBはともに、「声がボカロである」という認知をリスナーに対して与える要因になっている。両者の違いは「音楽以外の情報が存在するかどうか」であり、聴取体験それ自体に「ボカロらしさ」が内在するかどうかだ。

 Aについて、「ボカロらしさ」とは声が人間らしくなく、「合成音声/機械音声らしさ」があること、もっと言えば「身体性がない」という言い方も可能だろう。実際に、ボカロ音楽についてはよく「身体性がない」ということが言われる。ただ、「身体性」という言い方は多義的で分かりにくい。そこで、「身体性」に関して鮎川ぱてが「ボカロのじかん」(『CDジャーナル 2012年06月号』音楽出版社、p.25)にて書いていた記述を引用する。

 ボカロに「身体性がない」というのは、あまりに雑な印象論にすぎません。とはいえ、"そこに身体があること"を直接連想させるサイン――たとえば、“喉"という人間の身体の一部が運動していることを連想させる音程のしゃくり上げや、音の末尾の揺れや、吐息のノイズなど――が歌唱に埋め込まれていないことを、端的に「身体性がない」と言っているのだとしたら、それはボカロの最大の可能性のひとつです。逆に言えば、歌に「身体性を感じる」というのは、実は非常に記号性の高い、意味論的な経験でもあります。

 当時の伝統的なボカロ(例えば「初音ミクの消失」などをイメージすると分かりやすい)においては「音程のしゃくり上げや、音の末尾の揺れや、吐息のノイズなど」はあらかじめ組み込まれていない(逆に、こういった身体性のサインが曲に含まれるとしたらそれはボカロPが調声技術によって付け加えたものということになる)。実際、ボカロには人間と違って舌や唇、喉や肺が存在しないため、それら身体器官によって人間の声に自然と加わるようなニュアンスは欠ける傾向がある。以後の記述で用いる「ボカロらしさ」には以上のような性質が含まれると考えていい。

 もちろん「人間らしさ」対「ボカロらしさ」という軸で考えるのは物事を単純化し過ぎではあるが、本稿ではそれらを特に細分化せずに用いる。

 トートロジー的な言い方になるが、ボカロ音楽において、どういうサウンドが流行っているかといった問題を抜きにすれば、ボカロ音楽とそうでないものをリスナーから見て弁別できるのはボーカルに「ボカロらしさがある」ことにほかならないだろう。

 合成音声であることのシグナルには、先に述べたようないわゆる「ボカロじゃないとできない歌い方」=「人間が歌う難易度が高い」という点も含まれると思われる。

 他方で、Bはボカロの声が人間らしいかどうか、といったことにかかわらず合成音声であること自体によって「透明性」が成り立つということであり、これはHaniwaが明確に述べていたことでもあった。

 とはいえ、これについてはコンテクストに依拠する以上、状況がやや限定的になってしまう面はあるだろう。例えば「ロストワンの号哭」のような曲*6がSynthesizer V AI小春六花やAI きりたんといった人間と区別がつきにくいAIシンガーのボーカル(これについては後述する)で作られ、それがYouTubeで視聴されるのではなく有線などで流れた場合、同じような認知は抱けないのではないだろうか。

 もっとも、AとBとを比べた場合、Bの方がより大きく「声がボカロである」という認知に寄与するものであることは間違いない。例えばPerfumeの楽曲のような、人間の声にオートチューン加工を施されている楽曲に対しては、いかにそれが機械音っぽくても「透明性」を感じることはあまりないように思われるからだ。

 

5.非人間的な目線での歌詞について

 ここでやや脱線するが、「透明性」とは重なりつつも別の観点として、ボカロ音楽には「非人間的な目線で歌詞が書ける」という効果もあるためそれを指摘しておきたい。ピノキオピーは「君が生きてなくてよかった」をリリースした2017年のインタビューにて以下のように述べている。

 人間が歌うと、その人の人格というフィルターを通して聴いてしまうんですけど、ミクは無色透明で人格がない。だから書ける歌詞がいっぱいある。俯瞰で物事を見るような歌詞なら、人が言うより人じゃないものが言ったときのほうが破壊力も出るんですよ

『別冊ele-king 初音ミク10周年――ボーカロイド音楽の深化と拡張』(Pヴァイン、2017年、p.55)

 「人が言うより人じゃないものが言ったときのほうが破壊力も出る」というのはある種のボカロ音楽の一側面を言い当てているようで興味深い。これはピノキオピーの風刺的な、あるいは人間の生自体を相対化するような歌詞においてボカロが寄与しているポイントだ——近作においては「神っぽいな」や、「匿名M」で初音ミクが人間に対して述べる「存在しててウケますね」などがそれにあたるだろう。

 そしてこれは初音ミクの、機械音声と人間の声の中間にあるような体温の低いボーカルの性質とも繋がっている。ピノキオピーの楽曲以外も見ると、これがホラー的な想像力と結びついている例もあり、ハチの「結ンデ開イテ羅刹ト骸」やMARETUの「うまれるまえは」(「生まれるまえは しんでいたんだから」)、「ホワイトハッピー」(「命は尊くて重い、とかいう常識は(中略)最高に勝手気ままな妄想」)の詞にも繋がっている。


www.youtube.com

 


www.youtube.com

 

 こういった性質の楽曲には初音ミク機械的な声が必要だ、という見方はできる。感情は乗りつつも人間の声になりきらないことで、ある種不気味でぞっとするような感じを醸し出しているからだ。これは、人間の声に寄ったSynthesizer V AIやCeVIO AI、あるいはVOICEPEAK等のキャラで歌詞・セリフを言わせると違う印象になりそうな点だ。

 

6.ボカロと現在のAI合成音声技術

 ここで、Aとして挙げた、ボカロの声の「合成音声/機械音声らしさ」について、'20年代以降にAI合成音声技術の進展により変化が起こっているという点を指摘する。前章までで述べてきた「ボカロらしさ」は、多かれ少なかれ'10年代までの音声合成技術で作られたボカロ曲を前提にしている面があるからだ。

 '10年代までのボカロ楽曲はその大半がヤマハの開発したVOCALOIDないしUTAUを使用して作られていたが、'20年代に入って以後はCeVIO AIやSynthesizer V(以下、場合によりSVと略)をはじめAI技術を活用した様々な合成音声ソフトが台頭し群雄割拠となっている。

 こうした状況について細かく見ていくのは難しいが、見通しの良くなる整理の仕方として、ボカロシーンでキュレーターとして活躍する御丹宮くるみが2020年末にまとめたnote記事がある。

合成音声方式の違い……喉の種類のようなものが、ざっくり2種類あります。それが「波形接続型合成音声」と「AI合成音声」の2つです。

 

AIシンガーに関するあれこれを考える【ボカロリスナーアドベントカレンダーhttps://note.com/oniku_kurumi/n/n07c5db49638b(2023年10月5日閲覧)

 御丹宮くるみは記事中でボカロのソフトウェアを二つの方式に大別して整理している(厳密には「AI合成音声」のなかにもHMMやDNNなど様々な方式があることにも言及しつつ)。'10年代に支配的であったVOCALOIDやUTAUは波形接続型であるが、2020年に入りリリースないしリリース発表されたNEUTRINOやCeVIO AI、Synthesizer V AIなど多くのソフトはAI合成音声となっている。

 「AI合成音声」は概ね「歌声をディープラーニングして歌声モデルを生成して、その歌声モデル(AI)に歌を歌わせる方式」であり、声優やシンガーといった学習元の演者本人の歌い方の癖をシミュレートする。花譜の声をもとにした「CeVIO AI 可不」のような「音楽的同位体」はコンセプトにおいてもそれがよく出ていると言える。これは「波形接続型合成音声」が旧来的な「ボカロらしい」情報量が少ない声であることと対照的だ。


www.youtube.com

 

 「音楽的同位体」に代表されるCeVIO AIと並んでメジャーなAI合成音声ソフトとしてはSVがあり、著名なライブラリとしては「小樽潮風高校PROJECT」を中心とする小春六花、夏色花梨、花隈千冬などが挙げられる。

 なお、2022年にリリースされたVOCALOIDの最新版であるVOCALOID6はAI合成音声を搭載したため、VOCALOIDについても現行のバージョンは波形接続型合成音声ではなくAI合成音声になっている(波形接続型はVOCALOID5まで)。

 現代のボカロにおける波形接続型合成音声からAI合成音声への切り替えが、楽曲の性質にも影響を及ぼしている顕著な例を一つ挙げる。2023年4月末にそれまでUTAU版しかなかった重音テトのSynthesizer V AI版がリリースされた。そのおよそ一ヶ月後に古参ボカロPのNemは、「キューティーハッカー」をSV版重音テトのボーカルでリリースしており、その際「重音テトほぼベタ打ち&初期設定のままです。歌うま過ぎ」とコメントしている*7が、YouTubeの当該曲のコメント欄では2023年6月時点において「神調教」「テトでこの調教はすごい」とったコメントがついており、それだけUTAU版とSV版には体感的な落差があったことがうかがえる。UTAU版重音テトを人間のように歌わせるのはかなりの調声(調教)技術を要するので難しいが、SVだとほぼベタ打ちで容易に達成できるということを示していると言える。


www.youtube.com

 

 前掲のnoteにおいて、御丹宮くるみは「今波形接続型合成音声を採用してる歌声合成ソフトがめちゃくちゃ少ない」「もはや初音ミクNTとUTAUしか波形接続合成音声採用の知名度のある歌声合成ソフトが存在しない現状」と述べている。これは実状を巧みに捉えている指摘だが、より正確に言い直せば、「『2020年以後新しくリリースされている歌声合成ソフト』で波形接続型合成音声を採用しているものがめちゃくちゃ少ない」となるだろう。例えば鏡音リン・レン歌愛ユキなどは現在も広く使われているが、それぞれ「鏡音リン・レンV4X」(2015)や「VOCALOID4 歌愛ユキ」のVOCALOID4対応版(2015)が最新版であり、それ以後リニューアルされていない。

 '20年代に入って以後、波形接続型合成音声で新しく出たものが少ない(著名なものは初音ミクNTとUTAUしかない)、ということが'10年代のボカロシーンと現在のモードの違いを決定づけているように思われる。

 こうした動きのなかで、声自体が持つ、旧来の「ボカロらしさ」は目減りしていくことは考えられそうだ。

 旧来的な、'10年代までのボカロの声については、人間の声に近づきつつも人間の声そのものにはならない、ということが特徴としてよく指摘されていた。

 例えば佐々木敦『ニッポンの音楽』(2014年、講談社現代新書)の第四章においては、初音ミクとボカロ音楽に関して以下のように記されている。

 ところで、彼らの歌姫である初音ミクのヴォーカルは、高度な最新技術によるものとはいえ、まだまだ本物の「人間の声」とはやはり似て非なるものです。むしろ、ミクの「声」がヒトの「声」に漸近しつつも決定的に異なっているという点こそが、ボカロPたちの音楽的想像力のエンジンだったのではないかと思います。

(中略)

 初音ミクも、音声合成技術の行き着く先は「人間の声」そのものです。そこまでは行かず、絶妙なバランスで「谷」(引用者注:「不気味の谷」のこと)の手前に踏み留まることによって、彼女たちの歌声は、多くのリスナーの心を掴むことに成功したのだと思います。

 『ニッポンの音楽』においては言及されていないが、ボカロの声を人間の声に近づける要因はソフトウェアの技術発展だけではなく、個々のボカロPがボカロにほどこす「調声」の工程がある。

 人間らしさがあらかじめ失われているボカロの声に調声をほどこすなかで「滑舌を良くして歌詞を聴き取りやすくする」「自然な発音にする」「声にニュアンスをつける」といったことを行い、違和感なく聴けるものにしていく。一方で、旧来のボカロの場合、ベタ打ちの段階での「ボカロらしい」声を人間の声に近づける「調声」を行っても、やはり「完全に人間の声にはならない」ことが一つの魅力を生み出してもいた。

 「調声」について触れている初期のボカロ論として、川本聡胤『J-POPをつくる!』(2013年、フェリス女学院大学)の第五章がある。川本はボカロ音楽の特徴の一つとして「機械的な節回し(音の抑揚や高低)を残す」を挙げており、ゆよゆっぺ巡音ルカ曲「You and beautiful world」(2009)について、「全体を通してとても上手に調教されているなかに、わずかに残る機械的サウンドがおもしろい響きとなっている」と述べている(p.153)。

www.nicovideo.jp

 大まかに言えば、ボカロはどれだけ調声をしても、言葉の発音に機械的な雰囲気が残り、それがボカロらしさを生み出している、ということが述べられている*8。'10年代的なボカロのパラダイムは概ねこの見方に沿っているとも言えるだろう。

 一方で、当初のVOCALOIDが人間の声になりきらなかったのは開発者側が匙加減を調整したというよりも、技術的な限界の問題が大きかったと考えられる。そしてリスナーの側もどちらかというと「人間の声に近ければ近い方がいい」という価値観の人が多かったのではないかと思われる。人間の近いリアルな歌唱を実現した楽曲には「神調教」と絶賛コメントが付いてきたし、2009年の「ただでさえ天使のミクが感情という翼を持って女神になろうとしてるな」といったバズワードの誕生の背景にもそういった価値観は反映されている。

 とはいえ、「ボカロらしさ」を擁護するなかで技術発展やその可能性を否定するのは多分に守旧派的な姿勢ではある。ヤマハVOCALOIDの開発者が著した『ボーカロイド技術論』(2014年、ヤマハミュージックメディア、剣持秀紀・藤本健)においては、初音ミクVOCALOID2でのリリースが最初)が出るより以前、2005年にVOCALOID1.0からVOCALOID1.1にアップデートした際にも、声が「滑らかになったことへの不満も飛び出した」というエピソードが紹介されている(p.79)。

 そのため、LEON、LOLA、MEIKOの歌声は、システムアップデートによって、改良されるという形になりました。チームとしては、よりよい声になったと満足していたのですが、ユーザから予想外の不満が出てきたのです。

 とくにLOLAやMEIKOは歌い方の表情が顕著に変わったため、「俺のLOLAを返せ!」といった声がいくつか上がりました。自然に聞こえる声にしたからよいということではなく、やや不自然だった歌声を気に入ってくれていた方もいたのだと強く実感する出来事でした。

 LOLAやMEIKOの時期から「自然に聞こえる声」への反発があったことを考えると、今日私たちが「ボカロらしい」と思っている歌声も、2005年のリスナーからすれば「ボカロらしさ」が失われたものとして聴こえることだろう。逆に、我々が2005年のLOLAやMEIKOの歌声をいま聴くと、「自然に聞こえる声」とはあまり感じないはずだ。その意味ではボカロに感じる「人間らしさ」の感覚は年月とともにアップデートされていくものであり、現在における「ボカロらしい声が良い」という主張も相対化されるべきものだと言える。

 ただ、2005年当時と現在とで大きく違うのは、現在の最新技術では合成音声の人間らしさが、真に人間と区別できなくなる閾値に達しているということだ。

 こうした動きのなかで、2020年にリリースされた初音ミクNTはAI合成音声ではなく、波形接続型の合成音声となっている(自社開発の歌声合成エンジンを採用)。初音ミクがAI化しない理由としては、クリプトン代表の佐々木渉は以下のように述べている。

 AI歌声合成ソフトの開発やリリースがトレンドであり、進化していることも理解しています。

 初音ミク NTは収録した音声波形を切り貼り・加工して音声を合成する「素片接続」という仕組みのソフトです。操作性と自然さのバランスという意味で、見習わないといけない部分が多くあると思います。

 他方で、人間の歌声を再現するAI歌声合成ソフトが、生のグランドピアノの音色を目指すようなものだとしたら、われわれは初音ミク NTでエレクトリック・ピアノを目指しているともいえます。

 この方針では、歌唱を機械的にも抑揚たっぷりにもできるところにメリットがあります。うまくユーザーに使ってもらえるソフトにすると同時に、操作の難しさは拭い去っていかなくてはという難しさもあります。

 

ニュータイプになった初音ミクはどこへ向かうのか “VOCALOIDじゃないミク”の開発者に聞く ITmedia NEWS

 https://www.itmedia.co.jp/news/articles/2011/30/news062_2.html(2023年10月5日閲覧)

 これは機械音声としての初音ミクのブランドを重視し、既存の「ボカロらしさ」「初音ミクらしさ」を保とうとしていると見ることができる。ベタ打ちの状態では機械的な声になるようになっており、ユーザーの介入によって「機械的にも抑揚たっぷりにもできる」幅を作ることが重視されている。

 ただ、「操作の難しさは拭い去っていかなくては」とコメントにあるように、AI合成音声は波形接続型合成音声よりも、労力をかけずに表現力の高い声が実現できることや、UIの使いやすさにおいて優れているから支持されるという側面がある。ボカロPのいよわはREDとの対談において、VOCALOIDと比べた際のCeVIO AIの「使い勝手の良さ」「カスタマイズのしやすさ」について述べている。

いよわ:『CeVIO AI』って音を打ち込んだら自動的にピッチが生成されて、それが線になって見えるじゃないですか。僕は「Mobile VOCALOID Editor」を使っているので、基本的にピッチを書いたりすることがないんです。なので、自動的に生成されたピッチが視覚的に見えるということは新鮮でしたね。あとは、打ち込んだ時点でほぼ完成系の歌い方になっているというのが今までにない感覚だと感じました。それでいて、微調整をしたいと思ったらいくらでもできる。こだわらない人は最初の時点で完結させても様になるし、こだわりたい人はとことん細かく詰めていけるという、融通の利きやすいソフトだなと感じました。

 

ボカロシーンに広がる「音声合成ソフトウェアの多様化」から生まれた新たな“創作論” いよわ×RED 対談  https://realsound.jp/tech/2023/03/post-1279359.html(2023年10月5日閲覧)


www.youtube.com

 

 CeVIO AI以前のVOCALOIDに顕著であったような、人間の声と機械音声のあわいの声質になったり、調声によって作家性が出るというのは、それだけユーザーが介入して手間をかける必要があるという難しさと隣り合わせではあるだろう。

 本来的に、ソフトウェアとしての使い勝手が良いというのはあらゆる点で望ましいことであり、むしろこれによって歌唱の平均的な表現力が上がり、参入障壁が下がれば色々なクリエイターがボカロに参入しシーンが活気づくというメリットも考えられる。

 

7.「ボカロらしさ」の現在

 前章ではボカロの歌唱について旧来の「ボカロらしさ」が目減りしている点を指摘したが、他方で、現在のボカロシーンにおいてそうした「ボカロらしさ」の余地がなくなっていると考えるのは早計にすぎると思われる。

 前述の御丹宮くるみのnoteにあるように、2021年にリリースされたCeVIO AI版の可不は、あえて波形接続型合成音声の特徴を残したものとしてリリースされた*9。可不は「フォニイ」や「きゅうくらりん」、「キュートなカノジョ」などの大ヒット曲に使われており、もっとも著名なCeVIO AIシンガーとなったと言っていいだろう。


www.youtube.com

 

 また、前述したSV版がリリースされた重音テトも、完全に人間らしさのシミュレーションに徹しているというわけでなく、UTAU版の重音テトの特徴を残したものになっているとされる*10

 ボカロ音楽の祭典である「ボカコレ」の2022年秋では、いよわによる足立レイ「熱異常」がランキングトップになったが、人間の声を混ぜずに作っているUTAUの音源である足立レイのロボットボイスを存分に活かした歌唱になっている。

 VOCALOID4やそれ以前のボカロの音源が近年に再評価され脚光を浴びるような例もある。2009年リリース、2015年のVOCALOID4版が最新版である歌愛ユキは、2016年にデビューした稲葉曇が使い始め「ロストアンブレラ」(2018)、「ラグトレイン」(2020)などヒット曲を出したのを一つのきっかけとして広く使われるようになった。「ボカロ小学生」キャラである歌愛ユキは大人の声優が小学生風の演技をした声ではなく実際の(素人の)小学生の声を元にしており、収録時の演者のコンディションが影響して、ハスキーでこもった感じの声になっている。それがダウナーな曲調にマッチすることを見出されて、広まったという形のようだ。


www.youtube.com

 

 '20年代においてもAzari、式浦躁吾、なきそなどのボカロPの楽曲に使われることで存在感を放っており、あどけなさと枯れた感じが同居した声質を活かしてダークな曲や妖艶な曲も多く作られている。曲調はそれらとは異なるが、2023年リリースのボカロ楽曲の中で10月現在YouTubeの再生回数トップを記録している「強風オールバック」(9月末時点で6000万再生超え)も歌愛ユキのボーカルおよびキャラクターを前面に押し出した楽曲だ。

 UTAUはことにインディー音楽シーンにおいて影響力が強く、SV版の重音テトがリリースされた後にUTAU版の重音テトも再注目され、原口沙輔「人マニア」「ホントノ」のようなヒット曲も出ている。


www.youtube.com

 

 また、一般的なボカロと比べてもはるかに機械音的な「ゆっくり」音声を使った耳中華の楽曲も注目されている。なお、「ゆっくり」(AquesTalk)の開発者である山崎信英は、「人間の声に近づけよう」という音声合成業界の流れと異なり「人間“らしくないけど”聞きやすい声」を目指している、という旨をインタビューで述べている*11

 もっとも、現在のボカロシーンは刻一刻と状況が変化しており、ほとんど月単位で勢力図が塗り替えられていると言っていいため、今後どうなるかは不確かだ。

 先述した可不も2024年1月にはSV版がリリースされる予定であるし、ヤマハが2023年8月に発表し、10月現在試験的にリリースされているVOCALOIDβは、いわゆる既存の「ボカロらしさ」の癖がないボーカルとなっている。作り手から見ればカスタマイズの幅が広がり表現力が増す一方で、リスナーから見た際にボカロ音楽的な特性がなくなり他と変わらなくなるという可能性はありえる。

 一つ確実なこととして言えるのは(今更な指摘ではあるが)「合成音声」=「人間らしくない/機械音声っぽい」という構図は成り立たなくなってきているということだ。

 これはAIボイチェン技術の浸透もそうであるし*12、TTSの分野においても、例えばマイクロソフトが「電子書籍を“好きな人の声”のオーディオブックに変換するシステム」として、テキストを人間的な声で感情や強調を込めて読み上げることを可能にするシステムを開発し発表している*13。AIボイスエンジンで色々な声を混ぜてオリジナルの声を作り人間そっくりに歌わせることができる「Pocket Singer」というスマホアプリもリリースされている*14。合成音声技術・作曲技術の進展はボカロ音楽に限定されない範囲で起こっており、それによって一般大衆における受容も変化している。

 ボカロ音楽の一部をなす「人間っぽくない声」という特性は前提ではなくなっており、今後は例えば選択肢の一つとして「あえて人間っぽくない声にする」という位置づけになり、それによって「透明性」が生じることもあれば生じないこともある、という形になっていくと思われる。

 

8.おわりに

 本稿においては旧来のボカロ語りと現在の文脈を結びつける意味もこめて「ボカロらしさ」対「人間らしさ」という対立軸で話したが、合成音声技術を使った音楽はもっと多様な可能性を持っていると言えるし、それは理論および実践の双方において今後掘り下げられていくと思われる。

 この二つを単純に二項対立で考えるのは正しくなく、問題はボカロの「調声の上手さ」が「人間らしいかどうか」という基準で判断されがちだという状況にあるのかもしれない。

 また、色々なタイプの合成音声が共存して残っていくという前提に立てば「どっちも良い」という意見も当然ありえる。VOCALOID・UTAU・CeVIO・SVの歌声をそれぞれに楽しめばいいし、選択肢が増えるのは単純に環境として恵まれているということだからだ。

 もちろん新しいバージョンが出たからといって古いバージョンが使えなくなるということはないし、CeVIO AI版「IA」が出てもVOCALOID3版「IA」を使い続けることもできる*15。一方で、ソフトウェアとして新しいバージョンが出ないことの影響は小さくないと思われる。それは例えば十分なサポートがされなくなるという可能性とも隣り合わせだからだ。先述した通り、新しくリリースされる合成音声ソフトはほぼAI合成音声になっており、今後のシェアの動きによるものの、「ボカロらしい」声は選択肢としてあまり残らないということも考えられる。

 ただ、これまでの論を覆すようだが、「ボカロらしさ」に固執するのは、ボカロ音楽リスナーのなかにおいても必ずしも一般的な観念だとまではいえないだろう。そうでなければ、ボカロ音楽シーンにおいて「歌ってみた」や歌い手の存在感が非常に大きいことの説明はつかない。「命に嫌われている」(オリジナルは初音ミク歌唱)の死生観をとうとうと歌う歌詞は「『透明性』のあるボカロ曲ならでは」だとも言えそうだが、一方で歌い手であるまふまふのカバーバージョンの方が多くの人に聴かれており、この曲をまふまふの曲だと受容しているリスナーの方が全体として多いだろう。

 また、「ボカロらしさ」や「ボカロじゃないとできない表現」というものがあったとしても、それを金科玉条のように掲げるのはもちろん正しくない。ボカロでナチュラルなポップスを作っている人が、合成音声ならではのエクスペリメンタルな表現をしている人より劣っているといったことはないし、個々のクリエイターにとっては、自分がやりたいことに最も適している表現や媒体を選ぶのは当然のことであるからだ。

 加えて、本論のような「透明性」という枠でボカロを捉えていると見過ごされる観点として、例えば初音ミクもキャラクターとしてそれ自体のストーリー性を持った存在になっているということだ。これは「ODDS&ENDS」(2012)や、「砂の惑星」(2017)や「ブレス・ユア・ブレス」(2019)といった歴代の「マジカルミライ」の象徴的なテーマソング、重音テトとのデュエット曲「あいのうた」(2023)などを通じても分かることだろう。個々のボカロの持つキャラクター性やストーリー性が前景化する際は、「透明性」という側面が弱まる面はあるだろう。その意味では「Synthesizer V AI Mai」や「VOCALOID6 AKITO」のような、キャラクター設定やデザインが存在しないボカロの方が、キャラクター付きのものよりも「透明性」を獲得しやすいという可能性もあるかもしれない*16

 上記のような取りこぼしはあるにせよ、本論では、ボカロ音楽の特性として「透明性」があり、それが多かれ少なかれ合成音声自体の「ボカロらしさ」とかかわりを持っていること、そして現在の合成音声方式の変化によってそれが部分的に目減りし、部分的に保たれる可能性について見てきた。

 ボカロカルチャーによって育まれた価値観があるとすれば、それは「歌声にキャラクターを投影する」というものに加えて、表情の乏しい機械音声を必ずしも劣化版と見なさず、抑揚を欠いた声であってもそこに魅力を見出すような感性があるとも指摘できるのではないだろうか。

 そうしたなかで、ボカロ音楽の一つのアイコンでもある初音ミクがソフトウェアとしてどう変化するのかというのは大きなトピックの一つだと思われる。

 現在において初音ミクを用いるボカロPの代表格にはDECO*27とピノキオピーがいるが、2017年に初音ミク10周年を記念して刊行された『初音ミク 10th Anniversary book』(KADOKAWA)に収録された両者の対談(p.97)では、それに関して興味深い発言がされている。

――ミクはどんどんリアルに歌えるようになったほうが良いでしょうか。それともボカロらしさが残っていたほうがよいでしょうか?

DECO*27:以前は、“ミクはミクっぽいほうがいい”と言っていたんですけれど、最近は新しい技術にどんどん乗っていきたいなって思うようになりました。僕は、今届けたい層が中学生や高校生なんです。ゲーム機に例えると、僕らはスーファミスーパーファミコン)から知っているからPS4PlayStation4)を見たら「うお~~」ってなるじゃないですか、グラフィック進化したなあって。でも最初からPS4で始める人はそのグラフィックであたりまえなんです。だからミクも同じで、はじめから進化した歌声を聴けば、そういうものだって思うはずなので、リアルになるのは良いと思いますし、その進化を拒絶しないほうが人とボカロの壁みたいなものが無くなりやすくなるのかなって考えています。

ピノキオピー:僕はボカロのしょうもなさ、力の抜けた感じが好きなので、リアルになりすぎなくてもとは思うものの、ボカロを聴いたことのない人が、歌詞が聴き取れないという意見はまだ聞きます。ですから普通に聴いて歌詞がちゃんと聴こえつつも、いわゆる“ボカロらしさ”も残っているようなものになったら自分としてはすごくうれしいですし、壁もなくなっていくと思います。

 DECO*27はボカロの存在をリーチさせたいため、初音ミクがリアルな声になっていくのを希望するが、ピノキオピーはボカロの声の特性それ自体に愛着があるため、「ボカロらしさ」を残した上での進化を望んでいる*17

 この両者の意見は第四章におけるBとAの立場とも対応させることができるだろう。単純化して言えば、ボカロ/初音ミクアイデンティティはキャラクターやコンテクストの部分にあるか、声質それ自体にあるかという考え方の違いだ(これはDECO*27が初音ミクのアイドル性を押し出した楽曲群(『MANNEQUIN』シリーズなど)を展開し、ピノキオピーがボカロの特性を生かしたコンセプチュアルな楽曲を発表していることとも符合する)。

 DECO*27のこの時点での提言によれば、初音ミクの声は人間らしくなっていくのが望ましいが、人間の声と同一化したとしても、初音ミクのキャラクターやアイドル性の部分で「ボカロらしさ」は担保されることになる。他方で、ピノキオピーの提言によれば、ボカロの声がリアルになり切らないことにも「ボカロらしさ」という価値が存在しているため、ある種の不完全さを残した方が望ましいことになる。「PS4」(最新版はPS5だが)のハイスペックさとの類比で言うと、ピノキオピー的な立場によれば初音ミクはレトロゲー的な価値を持つようになっていくのかもしれない。あるいはクリプトン代表である佐々木渉の「エレクトリック・ピアノ」から連想すれば、初音ミクのデザインのモデルになっているシンセサイザーである「DX7*18のような存在になるだろうか。

 そういった当の初音ミクが今後実際にどうなっているかということも含め、ボカロ音楽の行く先に注目していきたい。

 

*1:もちろん、ボカロ音楽というジャンルが「歌ってみた」動画を中心とする人間の「歌い手」カルチャーと共鳴して発展してきたのは事実であり、そのことを否定するものではない。

*2:もっとも、n-bunaは『Sound & Recording Magazine 2015年9月号』(リットーミュージック)のインタビューにてボカロの調声について以下のように語っており、ただ無機質なボーカルを目指していたわけではないことには留意する必要がある。

「ボカロの声に感情のようなものを込めたくて、方法を模索していたんです。それで生身のシンガーの声を聴き、エモーショナルな歌い方には何か特徴があるのではと考えたところ、"ピッチをうまく揺らす"という結論にたどり着きました。『透明エレジー』では、歌の出だしのピッチを大きく揺らし、涙声のような震えを作っています」(p.35)

*3:ヒッキーP インタビュー ボカロアングラシーンの重要人物が語る、「感情の音楽化」と現在のボカロシーン  https://blogs.soundmain.net/14162/(2023年10月5日閲覧)/ 再掲先はこちら

*4:日本の芸術・文化における〈主客合一〉の傾向について ~『雪国』とシャニマスの共通点~ https://note.com/2r96/n/n4bd3047f8a36(2023年10月5日閲覧)

*5:https://twitter.com/TatsuyaKitani/status/1638516822650818563(2023年10月5日閲覧)

*6:「~のような曲」という言い方をするのは、制作に用いられるソフトウェアやライブラリが異なればそもそも違う性質の曲が作られると考えられるからだ。

*7:https://twitter.com/Nem_P/status/1666043069744164864(2023年10月5日閲覧)

*8:副次的に言えば、調声の過程で個々のボカロPの作家性が発揮されて特徴的な声になり、「うちのミク」といった概念が生じる側面がある。例えばDECO*27とピノキオピーが共作した初音ミク「デビルじゃないもん」(2023)においては、DECO*27とピノキオピーがそれぞれ調声をほどこした初音ミクが交互に歌っているが、両者の声が混ざることなく対比されている。

*9:詳しい経緯については、以下のTogetter等を参照。

音楽アーティストと同じ声の合成音声ソフトが出たら「私の居る意味がなくなる」?VSinger花譜とCeVIO AI可不について、情報の整理と反応のまとめ https://togetter.com/li/1610827(2023年10月5日閲覧)

*10:島村楽器 イオンモール大高店」Twitter公式アカウントの投稿を参考にした。

https://twitter.com/shima_oodaka/status/1653290334359805952

https://twitter.com/shima_oodaka/status/1653292056390021134 (ともに2023年10月5日閲覧)

*11:ゆっくりしていってね!!!」の声はどうやって生まれたのか 開発者が語る“起業エンジニアの生存戦略https://nlab.itmedia.co.jp/nl/articles/1901/22/news098_2.html(2023年10月5日閲覧)

*12:RVCやSVC等を用いたAIカバー楽曲について、2023年12月現在の最新情報は以下のnoteに詳しい。

AI Coverは新しい音楽文化なのか? & # 2023年Vtuber楽曲10選 (裏) |すら note https://note.com/bluesura/n/n4c18c4a7aa18(2023年12月13日閲覧)

*13:https://www.techno-edge.net/article/2023/09/18/1930.html(2023年10月5日閲覧)

*14:https://play.google.com/store/apps/details?id=com.accidental.ocsinger(2023年10月5日閲覧)

*15:歌い手のAdoは、例えば初音ミクNTなど新しいバージョンが出ても初音ミクV3など旧来のバージョンが使えなくなるわけではないため、むしろ選択肢の拡大に繋がる感覚があると指摘している。(『別冊カドカワ 総力特集 初音ミク』(KADOKAWA、2023年、p.98~99))

*16:ボカロPのサノカモメは以下のインタビュー記事で、「音楽に声と歌詞を乗せたいだけであって、そこにキャラクター性を乗せたくはなかった」という理由から「VOCALOID VY1」を使うようになったということを述べている。

サノカモメはCeVIO AI『POPY』をどう使った? 人間と機械、双方の“らしさ”を備えたAI音声合成ソフトの魅力 https://realsound.jp/2023/08/post-1393678_3.html(2023年12月13日閲覧)

*17:もっとも、DECO*27は「プロフェッショナル~仕事の流儀~」の「初音ミク」特集回(2022年3月1日放送)に出演した際に、自身の初音ミクの調声について「機械と人間のちょうど中間 どっちにも寄らない感じ」と発言しており、実際には2017年時点でのこの発言がそのまま現在の立場というわけではないと思われる。

*18:初音ミク」ができるまで:クリプトン・フューチャー・メディアに聞く - ITmedia NEWS https://www.itmedia.co.jp/news/articles/0802/22/news013.html(2023年12月13日閲覧)