人工知能@ふたば
[ホーム]

[掲示板に戻る]
レス送信モード
おなまえ
E-mail
題  名
コメント
添付File []
削除キー(記事の削除用。英数字で8文字以内)
  • 添付可能:GIF,JPG,PNG,WEBM,MP4. 8000KBまで. 現在17人くらいが見てます.
  • スレッドを立てた人がレスを削除してスレッド内のみアク禁にできます.
  • メール欄に「id表示」と入れてスレッドを立てるとid表示にできます.
  • メール欄に「ip表示」と入れてスレッドを立てるとip表示にできます.
  • 削除依頼が閾値を超えるとidを表示します.
  • 生成系AI,ChatGPT,Stable Diffusion,自動運転など
  • 管理人への連絡は準備板 ご意見へ. 削除依頼は記事番号を押しdelを押して下さい.
  • スマホ・携帯ふたば入口 この板の保存数は20000件です. 規約
  • 新しい板: 人工知能 ZOIDS

画像ファイル名:1775720163024.jpg-(13213 B)
13213 B無題Name名無し26/04/09(木)16:36:03No.159899そうだねx3 26年11月頃消えます
Ace-Step 1.5 XL が登場ですってね
オリジナルは 20GB(5GBx4)あるので様子見してたが bf16(ComfyUI)版なら 10GB だ
これならあるいは

https://huggingface.co/Comfy-Org/ace_step_1.5_ComfyUI_files/tree/main/split_files/diffusion_models
削除された記事が1件あります.見る
1無題Name名無し 26/04/10(金)03:37:38No.159945そうだねx2
    1775759858176.mp4-(7624101 B)
7624101 B
とりあえず春らしいの一発
2無題Name名無し 26/04/10(金)06:42:07No.159949そうだねx2
    1775770927064.mp4-(4290294 B)
4290294 B
M2Mで歌詞を直そうと思ったが
どうやら4分もあるとM2Mできないっぽい
まあなんぼでもやりようはあるんだがな
3無題Name名無し 26/04/10(金)18:06:27No.159979そうだねx1
いい感じ。
4無題Name名無し 26/04/12(日)20:45:57No.160157+
    1775994357301.jpg-(245075 B)
245075 B
ギガジンにも出てるな
https://gigazine.net/news/20260409-ace-step-1-5-xl/
5無題Name名無し 26/04/26(日)06:55:23No.161161そうだねx1
v1.7でたもよう
6無題Name名無し 26/04/29(水)00:33:00No.161398+
書き込みをした人によって削除されました
7無題Name名無し 26/05/02(土)16:31:57No.161728+
    1777707117398.jpg-(236987 B)
236987 B
何がすごいのかと思ったら
ローカル生成の音楽生成AIなのか
それでこの品質はすごいな
https://x.com/ai_hakase_/status/2050078261502214249
8無題Name名無し 26/05/03(日)00:34:58No.161805そうだねx1
Ace-Step UIのはデフォで入るモデルがXLでは無いっぽんよね
9無題Name名無し 26/05/03(日)04:49:20No.161818+
学校行かなくていいよと 騙されたやつ
騙されたからAIにすがる

騙したやつに連絡とれよ
10無題Name名無し 26/05/03(日)19:31:05No.161937そうだねx3
    1777804265381.mp4-(6800418 B)
6800418 B
comfyから利用してXL turbo + 0.6B qwen3の組み合わせでだしてみたもの
suno超えは大げさかもしれないけど昔のudioくらいなら超えてそうな感じ
11無題Name名無し 26/05/03(日)21:20:41No.161944そうだねx3
    1777810841082.mp4-(7692739 B)
7692739 B
ターボで気に入った感じがでたらベース版でMusic2Musicするって手があるよ
最初からベース版で生成すると時間がかかるのと不安定なので曲として成立しないことも多いので
12無題Name名無し 26/05/09(土)04:06:19No.162705そうだねx2
    1778267179047.mp4-(5682247 B)
5682247 B
どなたかが XL turboをfp8で再量子化してくれててファイルサイズが約半分に
text encoderも0.6B+1.7Bの組み合わせでOKだった
よわよわPCでもだいぶメモリ的な余裕ができて おかげさまで2分曲を約100秒で出力できるようになった
step数で補う感じで音質もだいたい似たところまでにはもってこれた。

>ターボで気に入った感じがでたらベース版でMusic2Musicするって手があるよ
あとでやってみるわぁ
13無題Name名無し 26/05/09(土)23:39:45No.162816そうだねx1
GradioUIで触ってみたらめっちゃ楽しいんで、ComfyUIに移行ようとしたら
あまりにも何もわからなさすぎた。ComfyUIは厳しすぎるわ。
GradioUIでXLモデルを指定するよりはマシだけど。

turboはリリックがスクラップにされるし、baseとsftはしっかり歌ってくれるけど、
ボーカルの音質が悪くて耳障りだし、曲は素朴すぎてさみしい。

もっと情報が出てくることを期待。
14無題Name名無し 26/05/10(日)03:29:40No.162850そうだねx3
>ComfyUIは厳しすぎるわ。
やろうぜ
ComfyUI!

あと作ったやつ聞かせて
15無題Name名無し 26/05/10(日)11:05:27No.162872そうだねx2
β崩壊の歌とか聴きたいやついないでしょ。
みんなmp4で動画として貼ってるし。そのステージが遠いわ。

CivitaiにAce-Step 1.5 XL, Song + Lyrics + Album Cover + Video Publisher - All in one workflow
ってワークフローが公開されてたけど、フクザツすぎて無理ゲーなんてもんじゃなかった。

Wan2.2 i2vのフローは動いたんで、これで短いループ動画作れんかなとか思ってるけど。
リミックスのフローも動かしたい。CONFUSION rimixってフローは意味がわからんかった。

時間が溶けていく!
16無題Name名無し 26/05/10(日)15:03:45No.162899そうだねx1
全部AIでする必要なくね?
AIだっていちツールなわけだし
17無題Name名無し 26/05/10(日)15:07:40No.162901+
全部AIばっか
www.playbox.com/?ref=TOMO00
motionmuse.ai/r/sqzqoo5t
veners.ai/ref/e3e91545e2cd
musebox.ai/?ref=cNz6Jg
unlucid.ai/r/6tbrsjuw
18無題Name名無し 26/05/10(日)16:13:42No.162906そうだねx1
>全部AIでする必要なくね?
それはほんとにそう。
ただ未体験系の遊びに、AIが誘ってくれる感が楽しい。
19無題Name名無し 26/05/11(月)18:43:23No.163039そうだねx1
Comfyで出力された音声ファイルには画像と同じようにワークフローが埋め込まれてるみたい
ジャケ絵や動画付きで一括生成できれば共有も早くなりそう
20無題Name名無し 26/05/12(火)03:49:23No.163092そうだねx1
https://ace-step.github.io/

いったん公式プロジェクトページを張る
プロンプトエディティングや歌詞の書き方は大量のサンプルである程度学べると思った
21無題Name名無し 26/05/13(水)04:24:39No.163184そうだねx2
    1778613879513.webp-(139622 B)
139622 B
stemdeck
https://github.com/stemdeckapp/stemdeck

生成後の音声ファイルを6つのトラック(ボーカル、ドラム、ベース、ギター、ピアノ、その他)に分離してくれる
Ace-Step UIにも似たような(4トラック分離)のが搭載されてるけどこちらの方が性能いいかも。
22無題Name名無し 26/05/18(月)00:00:06No.163733そうだねx3
    1779030006155.mp4-(1858467 B)
1858467 B
どうやらTR-808とか有名音楽機材名とかもプロンプトとして有効そう。
低音も太くなったような気がする。

あと、カバー絵と音声をffmpegのワンライナーで結合して動画化するやつ便利だった。
ffmpeg -loop 1 -i './cover.png' -i './input.mp3' -c:v libx264 -c:a aac -pix_fmt yuv420p -vf "scale=800:800" -shortest ./output.mp4
23無題Name名無し 26/05/18(月)17:34:22No.163772そうだねx3
https://huggingface.co/megagrump/Ace-Step-1.5-ScragVAE-ComfyUI

音質(fidelity)向上を目指してチューニングされた
本家互換のVAEをComfyUI用に微調整したもの

期待される改善点:
高域のザラつき軽減
ステレオの広がり改善
低域の濁りの減少
ボーカルや楽器の輪郭がより自然に

改善の傾向(音のクリアさとか)は感じられるが限定的か
24無題Name名無し 26/05/22(金)05:18:09No.164102+
この生成AIにもLoraあるんだ...どこだろう?と疑問だったけど単純に

[モデル]→[Loraローダー(モデルのみ)]→[モデルサンプリングオーラーフロー]→[Kサンプラー]

って繋げばいいだけだった(ComfyUI)

- GazouBBS + futaba-