調声ならびに合成技術スレ
無題 名無し 06/26 20748

調声ならびに合成技術スレ

無題 名無し 06/26 20749
音声合成技術の系統樹見てみたいな
無題 名無し 06/26 20750
色んな人があっちこっち行ってるからババンと系統樹を示すのは少しむずかしいかも知れない
年表的に技術の推移を観察しながら具体例を見ていったほうがわかりやすいかな?
無題 名無し 06/26 20751
分野が狭くて尚且共同研究とかしていると系譜が分からない…
無題 名無し 06/26 20752
テキスト音声合成の歴史をすっごいざっくり言うと
人工音声の始まりは1779年にまで遡る
コンピュータを用いるものでは1950年代には既に研究が始まっていた
90年代まで:ルールベースのフォルマント音声合成(RPAとAIの中間みたいなの)
90年代から:コーパスベースの波形接続型音声合成(ボイロの源流)
95年頃から:コーパスベースの統計的パラメトリック音声合成(CeVIOの源流)
1999年にはCeVIOでおなじみのHMMが提案された
2010年年代初頭に深層学習が導入されて以降、AIブームに乗って多くの手法が考案されている
無題 名無し 06/26 20753
音声処理はそこそこに応用的な分野ゆえに使われている技術は最先端って感じではないことが多い
よその分野の画期的な技術をもとにブラッシュアップして実用に耐えうる品質にするという図式がほとんど
昨今のAIブームでは画像処理が最先端技術者の遊び場になっているからそこから生まれた技術で遊んでる
無題 名無し 06/26 20754
そこまで興味なければ動画編集や音楽関連の話でもいいよ
音声合成ソフトとそれに関連するツールの利用・制作の技術を柔軟な視点で多面的に観察・研究していく
つまりなんかボイロとかそういうやつに関する面白げな技術的な話などを語ったり語らなかったり
無題 名無し 06/26 20755
ボカロに代表される歌声合成とテキスト音声合成の技術的差異ってどの辺りになるの?
それとも基幹の部分は共通になっているのかな
無題 名無し 06/26 20756
2020年は花ちゃんが中央に移動 右下に新人が増えて
琴葉姉妹も中央に移動しSynthesizerVの横軸ができる感じか
まったくややこしいな
無題 名無し 06/26 20757
それぞれの分類でも波形接続型と統計型・学習型と違いがあるから一概には言えないけど
基本的には声っぽい音を出して自然につなげるって物だから根幹はとても似通ってる
より複雑な歌や喋りへの最適化の仕方で枝分かれしてると理解したほうがわかりやすいかも

無題 名無し 06/26 20758
>2020年は花ちゃんが中央に移動 右下に新人が増えて
>琴葉姉妹も中央に移動しSynthesizerVの横軸ができる感じか
>まったくややこしいな
もはやキャラレベルで分類してると追いつかないくらいには複雑化してきてるよね
AITalk系のエーアイとサード各社の関係とか消費者には相当分かりにくいでしょ
無題 名無し 06/26 20759
ボイロ4あたりでVocalShifterいらずにならんかなぁ
無題 名無し 06/26 20760
>より複雑な歌や喋りへの最適化の仕方で枝分かれしてると理解したほうがわかりやすいかも
なるほどねー
無題 名無し 06/27 20763
調声スレか
ボイロ2買ってまだほとんど触ってないからぜんぜんパラメータいじってどう変わるってのが肌でわかってなくて苦戦してるので
用動画で見る人達はすごいんだなって思ってる
無題 名無し 06/27 20764
>2020年は花ちゃんが中央に移動 右下に新人が増えて
>琴葉姉妹も中央に移動しSynthesizerVの横軸ができる感じか
>まったくややこしいな
まとまった勢力としてガイノイド勢も増えてるしね
無題 名無し 06/27 20765
動画編集の仕方とかBGMとか書体とかそういうのでもいいぞ
技術と名のつきそうなものは何でも
無題 名無し 06/27 20767
話題が結構出るようなら編集専門スレでも立てればいいしね
技術的な質問だとリブレちゃんが強いけど…
無題 名無し 06/27 20769
リブレのボイロスレはもう人いないよ…本当にいない……
無題 名無し 06/27 20770
VocalShifterとか外部ツール使った調声ってよくやる?
無題 名無し 06/27 20771
リブレのボイロスレといえばMMDからボカロまで手広くカバーしてたのに…

無題 名無し 06/27 20772
3Dでも音楽でも訊いてくれたら分かる範囲で何でも答えるであおい
技術系の情報交換で流れにくい場所ほしいなって思ってただけやから
無題 名無し 06/27 20773
技術論ではない音声合成技術の社会的射程についてもここでいいのかな
無題 名無し 06/27 20774
なんでも
無題 名無し 06/27 20775
社会学・経営学的考察や倫理的評価でもいいし新しい音声合成手法を思いついたぞってんでもいいし
フォロワーの伸ばし方とか立ち絵の使用率の上げ方とかでもいいなんでもいい
無題 名無し 06/28 20776
>社会学・経営学的考察や倫理的評価でもいいし新しい音声合成手法を思いついたぞってんでもいいし
博論いっちゃえるのでは…?
無題 名無し 06/28 20777
良いネタあったら博論でパクろ
無題 名無し 06/28 20778
Softalkの調声の受容から声優交代を考察するとかもなんか書けそうなネタだとは思うんだけど
違いが認識されたかどうかが計測できないという致命的な問題があるんだよな
あとは単純に調声が人によってバラバラなところか
無題 名無し 06/28 20779
Aquestalkは中の人が居ないが故のニュートラルなイメージが非常に使いやすい
どんな事を喋らせても適度に似合うし見る側もキャラ性という先入観を持ちにくい
キャラ売りのボイロになると多かれ少かれ前提属性は付く
無題 名無し 06/28 20780
ボイロは新世代技術で再収録が必要になったときに中の人を交代して作ることは可能だろうか
人気キャラはファンコミュニティと各種素材や文脈あるいは人格資源を豊富に抱えることになる
声優の高齢化というだけの理由で捨て去ることが不合理と言える規模にまでそれらが拡大した時
ご長寿アニメの中の人交代みたいなことが求められる可能性は十二分に考えられる
無題 名無し 06/28 20781
声変換技術は音声合成技術の兄弟みたいなもので伴って急速に発展しているから
過去の収録音源やそれによる合成音声の念入りな加工によって
声質の近い別人による中の人交代がより耳に馴染みやすい形で可能になる可能性は高い
一方口調や発音の特質といった声質以外の部分は今後暫くは本人の努力に委ねられるはず

無題 名無し 06/28 20782
ゆっくりと言っても霊夢魔理沙あたりはずいぶん声のイメージが固まってるはずだけどね
実際にはそれ以外のキャラにもゆっくりボイスを使う場面が生じてくる
そうなったときに固まりきっていないキャラだと声が解釈違いだというような問題が生じることがある
固まっていたら別の選択肢が出てこないから可視化されることがないだけだけど
合成音声が現実に連続して使用されるなかで不連続となる場面があるからそういう問題が出る
それというのは声優の交代という問題と相通じるところがあるように思うけどね

続きを見る01日12:05頃消えます









戻る

レス

おなまえメールコメント