人工知能@ふたば
[ホーム]

[掲示板に戻る]
レス送信モード
おなまえ
E-mail
題  名
コメント
添付File []
削除キー(記事の削除用。英数字で8文字以内)
  • 添付可能:GIF,JPG,PNG,WEBM,MP4. 8000KBまで. 現在20人くらいが見てます.
  • スレッドを立てた人がレスを削除してスレッド内のみアク禁にできます.
  • メール欄に「id表示」と入れてスレッドを立てるとid表示にできます.
  • メール欄に「ip表示」と入れてスレッドを立てるとip表示にできます.
  • 削除依頼が閾値を超えるとidを表示します.
  • 生成系AI,ChatGPT,Stable Diffusion,自動運転など
  • 管理人への連絡は準備板 ご意見へ. 削除依頼は記事番号を押しdelを押して下さい.
  • スマホ・携帯ふたば入口 この板の保存数は20000件です. 規約
  • 新しい板: 人工知能 ZOIDS

画像ファイル名:1758338166177.png-(35946 B)
35946 B無題Name名無し25/09/20(土)12:16:06No.140247そうだねx7 2月01日頃消えます
AI関連のニューススレ
立ってないようなので
削除された記事が3件あります.見る
1無題Name名無し 25/09/20(土)12:17:44No.140248そうだねx3
Grok 4 Fast
https://x.ai/news/grok-4-fast
安くて2Mもあって性能も結構あるよ
2無題Name名無し 25/09/20(土)14:48:28No.140266そうだねx3
前スレ記録。
記録スレにあります
https://dec.2chan.net/bin/jump.php?https://megalodon.jp/2025-0919-0254-37/https://c3.ftbucket.info:443/other/cont/dec.2chan.net_85_res_120078/index.htm
3無題Name名無し 25/09/20(土)16:05:36No.140270そうだねx2
Wan2.2-Animate
https://x.com/Alibaba_Wan/status/1968921551392432175
Wan2.2の派生でキャラクター画像と参照動画でキャラクターをアニメーションできる
4無題Name名無し 25/09/21(日)23:50:11No.140427そうだねx1
IBMが開発した軽量マルチモーダルモデル Granite-Docling-258M
https://huggingface.co/ibm-granite/granite-docling-258M

タイプ:画像+テキスト → テキスト変換のマルチモーダルモデル
ベース構造:IDEFICS3を基盤に、以下を改良
・視覚エンコーダ:siglip2-base-patch16-512
・言語モデル:Granite 165M LLM

文書解析・変換に特化
5無題Name名無し 25/09/22(月)00:14:11No.140430そうだねx2
MCP Toolbox for Databases
https://github.com/googleapis/genai-toolbox

Googleのデータベース向けMCPツールボックスがオープンソースに
Python、JS、Go、LangChainなどと互換性
6無題Name名無し 25/09/23(火)03:03:05No.140550そうだねx4
MalTerminal
https://gbhackers.com/malterminal-new-gpt-4/

世界初級のLLM(大規模言語モデル)駆動型マルウェアの一例とされる。

OpenAIの GPT-4 API を利用し、実行時に ランサムウェアやリバースシェルのコードを動的生成。

従来型の「コード埋め込み型マルウェア」と異なり、実行ごとに異なる悪意コードを生成するため、静的シグネチャ検知がほぼ不可能。
7無題Name名無し 25/09/23(火)09:06:47No.140556そうだねx1
ネイティブなオムニモーダルモデルのQwen3-Omni
https://qwen.ai/blog?id=65f766fc2dcba7905c1cb69cc4cab90e94126bf4&from=research.latest-advancements-list
複数画像編集をサポートしたQwen-Image-Edit-2509
https://qwen.ai/blog?id=7a90090115ee193ce6a7f619522771dd9696dd93&from=research.latest-advancements-list
8無題Name名無し 25/09/23(火)09:08:41No.140557そうだねx1
DeepSeek-V3.1-Terminus
https://api-docs.deepseek.com/news/news250922
エージェント能力がアップ
9無題Name名無し 25/09/24(水)02:29:25No.140665そうだねx2
Teaching LLMs to Plan
提案手法:PDDL-INSTRUCT
https://arxiv.org/abs/2509.13351

「LLMは計画を立てるのが苦手」→「考える過程を言語化させ、外部でチェックして鍛える」→「論理的に正しい計画を作れるようになった」

問題を解くときに答えだけ書くのではなく、途中式を全部書かせて、先生が逐一チェックして直させる ことで、 「ちゃんと筋道を立てて考える力」を身につけさせたと言い換えられる。

評価
ベンチマーク:PlanBench(Blocksworld, Mystery Blocksworld, Logistics)
モデル:Llama-3, GPT-4
結果: 計画妥当性が最大 94% に到達(従来比 +66% 改善)。特に難しい Mystery Blocksworld で劇的な改善(1% → 64%)
10無題Name名無し 25/09/24(水)06:17:43No.140670そうだねx2
モデレーション用のQwen3Guard
https://qwen.ai/blog?id=f0bbad0677edf58ba93d80a1e12ce458f7a80548&from=research.research-list
視覚言語モデルのQwen3-VL
https://qwen.ai/blog?id=99f0335c4ad9ff6153e517418d48535ab6d8afef&from=research.latest-advancements-list
リアルタイムマルチモーダル翻訳モデルQwen3‑LiveTranslate‑Flash
https://qwen.ai/blog?id=b2de6ae8555599bf3b87eec55a285cdf496b78e4&from=research.latest-advancements-list
Qwen3-Max
https://qwen.ai/blog?id=241398b9cd6353de490b0f82806c7848c5d2777d&from=research.latest-advancements-list
11無題Name名無し 25/09/24(水)07:43:10No.140671そうだねx1
Gemini Liveモデルがアップデートしてgemini-2.5-flash-native-audio-preview-09-2025
https://x.com/googleaidevs/status/1970550144719536423
12無題Name名無し 25/09/25(木)02:41:36No.140761そうだねx1
「Nemotron-Personas-Japan: Synthesized Data for Sovereign AI」
https://huggingface.co/blog/nvidia/nemotron-personas-japan

nvidiaによる日本の人口統計・文化的背景を反映した 初の大規模オープン合成データセット。
個人情報を含まず、プライバシー保護・規制対応を前提に設計したという

オープン性:CC BY 4.0 ライセンスで商用・非商用利用可能
規制対応:日本の個人情報保護法(PIPA)に準拠
13無題Name名無し 25/09/25(木)02:52:40No.140762そうだねx1
    1758736360975.png-(151218 B)
151218 B
さくらインターネットのAI Engine
https://www.sakura.ad.jp/aipf/ai-engine/

テキスト生成・分類・埋め込み・音声認識(whisper)に対応
APIですぐ利用
・サーバー構築・運用は不要
無料で使える
・リクエスト制限内での利用が無料
複数の基盤モデル
・目的に応じたモデルを選択できる
セキュアな国内完結
・データが外部に出ない安心基盤
14無題Name名無し 25/09/25(木)03:15:14No.140763そうだねx1
awesome-ai-tools
https://github.com/mahseema/awesome-ai-tools

目的:
世界中の最新・有力なAIツールを分野ごとに整理した「キュレーションリスト」

特徴:
誰でも無料でツールを追加できる(Pull Request歓迎)
定期的にニュースレターで更新情報を配信
各カテゴリごとに代表的なAIサービスやOSSを紹介
15無題Name名無し 25/09/25(木)03:25:10No.140764そうだねx2
>No.140556
>No.140670
それぞれのモデルのちょっとした解説
https://x.com/0x__tom/status/1970360009826672690
16無題Name名無し 25/09/25(木)03:38:53No.140765そうだねx1
PlayCanvas Open Sources SOG: The WebP of Gaussian Splatting
https://blog.playcanvas.com/playcanvas-open-sources-sog-format-for-gaussian-splatting/

3D Gaussian Splatの新フォーマット「SOG」登場
SOG = Spatially Ordered Gaussians(点群ベースの3D表現)の圧縮フォーマット
従来の SOGS を改良した次世代仕様

特徴と利点
・ 圧縮が容易:CUDA不要、WebGPUで動作 → どこでも利用可能
・ 高精度:同じビット数でもアーティファクトを最小化

圧縮効果の例
・元データ(PLY形式):1GB
・SOG圧縮後:42MB(約95%削減)
17無題Name名無し 25/09/25(木)03:58:19No.140766そうだねx2
gambo
https://www.gambo.ai/

AIゲームビルダー、ワンストップ開発でデプロイ
広告収入も狙えるらしい
だけどこれ開発素材が著作権ぶっちぎりすぎてヤバい
18無題Name名無し 25/09/25(木)13:42:17No.140808+
>https://www.gambo.ai/
>AIゲームビルダー、ワンストップ開発でデプロイ
>広告収入も狙えるらしい
>だけどこれ開発素材が著作権ぶっちぎりすぎてヤバい
トップページからヤバすぎる
19無題Name名無し 25/09/25(木)17:23:21No.140819そうだねx2
Moondream 3
最先端の物体検出と強力な視覚的推論
https://moondream.ai/blog/moondream-3-preview
https://x.com/moondreamai/status/1970922304730431742

新アーキテクチャ:9BのMixture-of-Experts(MoE)モデルで、2Bのアクティブパラメータのみ使用。高速かつ低コストで推論可能。

オブジェクト検出:「紫の靴下を履いたランナー」など複雑なクエリにも対応。
ポインティング(指差し):画像内の対象物を直接指し示す能力。
構造化出力:32Kトークンの長文コンテキストにより、JSONなどの構造化データを生成可能。
OCR(文字認識):小さなフォントには課題があるが、実用レベルに到達。
20無題Name名無し 25/09/25(木)22:15:52No.140840そうだねx1
独立行政法人情報処理推進機構 セキュリティセンターが
米国国立標準技術研究所(NIST: National Institute of Standards and Technology)の発行するSP800シリーズ(SP: Special Publications)とFIPS(Federal Information Processing Standards)の中から、日本において参照するニーズが高いと想定される文書の翻訳・監修を行い、公開した
https://www.ipa.go.jp/security/reports/oversea/nist/about.html
21無題Name名無し 25/09/26(金)23:39:32No.140932そうだねx1
Gemini 2.5 FlashとFlash-Liteのアップデート
https://developers.googleblog.com/en/continuing-to-bring-you-our-latest-models-with-an-improved-gemini-2-5-flash-and-flash-lite-release/
22無題Name名無し 25/09/26(金)23:40:52No.140933そうだねx1
Gemini Robotics 1.5
https://deepmind.google/discover/blog/gemini-robotics-15-brings-ai-agents-into-the-physical-world/
23無題Name名無し 25/09/26(金)23:56:25No.140935そうだねx2
    1758898585513.jpg-(77722 B)
77722 B
世界初!日本企業(株式会社I.Y.P Consulting)がGPUを不要とする生成AI (LLM) の開発に成功。/2025年10月10日の都内イベントで先行発表
https://prtimes.jp/main/html/rd/p/000000009.000169148.html
https://neurips.cc/virtual/2025/poster/115463

Support Vector Generation (SVG) は、凍結された言語モデルを使って、解釈可能かつ学習不要なゼロショット分類器を構築する新しいカーネルベースの手法。

SVGは、Metropolis–Hastingsサンプリングとサポートベクターマシン(SVM)最適化を組み合わせ、言語モデルの埋め込みが誘導する再生カーネルヒルベルト空間(RKHS)で動作。
24無題Name名無し 25/09/27(土)00:05:14No.140936そうだねx1
AnimeGen(仮称)
https://animegen.jp/

経済産業省と国立研究開発法人新エネルギー・産業技術総合開発機構(NEDO)が実施する、国内の生成AIの開発力強化を目的としたプロジェクト「GENIAC(Generative AI Accelerator Challenge)」の成果をもとに作成された、テキストや画像からアニメを生成する試験的なサービス

クローズドテスト中
25無題Name名無し 25/09/27(土)00:06:08No.140938そうだねx2
ただの古典的なSVMでも見せ方によっては投資家から金集められるんだなあ
26無題Name名無し 25/09/27(土)01:49:45No.140945そうだねx1
oLLM
https://github.com/Mega4alik/ollm

大規模コンテキストのLLM推論を、8GB VRAMの一般的なGPUで可能にするpython軽量ライブラリ。

バージョンアップにより量子化ナシのgpt-oss-20B(13GB/bf16),qwen3-next-80B(160 GB/bf16)などの大き目モデルにも対応した。
27無題Name名無し 25/09/27(土)05:53:01No.140966そうだねx1
>世界初級のLLM(大規模言語モデル)駆動型マルウェアの一例とされる。
もう中身みないでCopilotにシェル実行させてるからこういうの流行りだすと怖いな
28無題Name名無し 25/09/27(土)16:55:56No.141021そうだねx1
    1758959756235.png-(110941 B)
110941 B
Sparse VideoGen2(SVG2)
https://svg-project.github.io/v2/

NeurIPS 2025でスポットライト論文として採択された動画生成モデルの推論を高速化するトレーニング不要のフレームワーク。

Semantic-Aware Permutation(意味ベースの並べ替え)と動的なAttentionカーネルを用いて、高品質かつ高速な動画生成を実現

HunyuanVideoで約2.5倍、Wan 2.1で約1.9倍の高速化を実現した。
29無題Name名無し 25/09/27(土)17:16:18No.141023そうだねx1
    1758960978537.webp-(233256 B)
233256 B
Craftwerk
https://euclyd.ai/#products

ヨーロッパ発のスタートアップ Euclyd が多数のチップレットを統合したSiP(System-in-Package)AI推論ハードウェアの商品情報を開示。

・1ユニット16,384個のプロセッサを搭載し、最大32 PFLOPSの性能を発揮。
・独自のメモリシステム「UBM」を採用:
・・1TBのDRAM
・・8000 TB/sの帯域幅

ArmやRISC-Vなどの既存IPは使用せず、完全自社設計のプロセッサ。
Transformerだけでなく、マルチモーダル推論・状態空間モデル・拡散モデルなどにも対応。
30無題Name名無し 25/09/27(土)18:24:26No.141025そうだねx1
The Illusion of Readiness「マルチモーダル医療ベンチマークにおける大規模最先端モデルのストレステスト」
https://arxiv.org/abs/2509.18234

前提として「ベンチマーク ≠ 実力」
モデルは画像を削除しても正答率が高く、選択肢の順番を変えるだけで答えが変わるなど、表面的なパターン認識に依存している。

「思考ステップ」を促すプロンプトでも、もっともらしいが誤った理由付けをすることが多い。

これらは単なるバグではなく、ベンチマークが“テストの攻略”を評価してしまっていることの証左。
31無題Name名無し 25/09/27(土)23:35:44No.141046そうだねx2
    1758983744876.jpg-(500560 B)
500560 B
SD3.5-Flash
https://hmrishavbandy.github.io/sd35flash/

StableDiffusion3.5 Mediumの高速版、蒸留型フローモデル。
Flashはわずか4ステップでMedium40ステップ相当の品質を出力
高性能な生成AIを一般的な消費者向けハードウェア(8GBメモリ)でも使えるように設計。
32無題Name名無し 25/09/27(土)23:54:15No.141048そうだねx1
Suno V5
https://x.com/SunoMusic/status/1970583230807167300
33無題Name名無し 25/09/28(日)00:15:05No.141051そうだねx1
Unsloth AIがGoogle colabの無料枠(T4など)でもGPT-oss(20B)のトレーニングが可能なnotebookを配布中
https://docs.unsloth.ai/new/gpt-oss-reinforcement-learning

gpt-ossのRLにおいて最速の推論速度(最大30 tokens/s)と最小VRAM使用量(50%削減)を実現。

vLLMはgpt-ossのRLに非対応のため、Unslothが独自にTransformersの推論コードを再設計。
34無題Name名無し 25/09/28(日)04:14:55No.141067そうだねx1
google Veo3の論文
https://www.alphaxiv.org/overview/2509.20328v1
35無題Name名無し 25/09/29(月)01:38:05No.141188+
限られた電力からシステム全体がどれだけのトークン数を絞り出すか?という競争のフェーズになっていて、単一のチップの性能や価格(仮に無料であっても)が絶対的な優位性にはならない、とnVidiaのceoが語る
36無題Name名無し 25/09/29(月)10:39:27No.141217+
たしかに3090安くて使えるけど
今月の電気代見たら確かに悲しくなったもんなぁ
37無題Name名無し 25/09/29(月)12:43:51No.141221+
>たしかに3090安くて使えるけど
>今月の電気代見たら確かに悲しくなったもんなぁ
うちの3080Tiで組んだPCがアイドルが100wだったよ…
電源は1200w入れてあるけど本気出したらどうなるか
ってか本気出せる使い方知らねぇや
38無題Name名無し 25/09/29(月)21:49:38No.141290そうだねx1
Craft-GPT
https://www.youtube.com/watch?v=VaeI9YgE1o8

レッドストーン回路で構成されたこのモデルは、PythonでTinyChatデータセットを使って訓練された約500万パラメータの構造をマインクラフト内に再現している

猛者すぎる…
39無題Name名無し 25/09/29(月)23:32:50No.141308そうだねx3
グラボなんてそのうち安くなった時に買えば良い。
つーか何年も前のグラボに結構な値段がついてる事に驚くわ。
40無題Name名無し 25/09/30(火)00:05:53No.141315そうだねx1
DeepSeek-V3.2-Exp
https://api-docs.deepseek.com/news/news250929
DeepSeek-V3.1-Terminusと同等クラスでありながらAPI価格は50%OFF
41無題Name名無し 25/09/30(火)05:33:27No.141340そうだねx1
Claude Sonnet 4.5
https://www.anthropic.com/news/claude-sonnet-4-5
30時間以上のタスクをこなせるらしい
42無題Name名無し 25/09/30(火)10:52:03No.141370+
さっそくClaude Sonnet 4.5のシステムプロンプトらしきものが漏れたらしい。
全文は8万文字超えのもよう。
43無題Name名無し 25/09/30(火)19:11:24No.141400そうだねx2
ニュースというわけではないが、AIテックカンファレンス東京AI祭2025の一部として「AIクリエイティブコンテスト2025」の 入賞作品発表された
https://note.com/tokyoaisai2025/n/n2e2d3760db1f

モデル限定の部門以外だとやはりMidjourneyが強いのがよくわかる。
音楽はほぼほぼSunoが独占状態

現状まだまだ懸念の残るモデルを使ってコンテストを開くことの善し悪しをおいておいたとしても、普段流れてくるXの作品やこの板の住人の方が優れてるんじゃないか?みたいなのが多分に含まれてて興味深かった。
44無題Name名無し 25/09/30(火)20:32:32No.141403そうだねx3
Z.aiのGLMが4.6にアップデート
https://z.ai/blog/glm-4.6
コーティングが結構強いっぽくClaude Sonnet4と比較してるけど悪くないかな?
GLMといえばGLM-4.5がNovelAIで採用されてたりするから文章もわるくないのかな…
45無題Name名無し 25/09/30(火)20:47:12No.141407そうだねx1
Ring-1T-preview
https://x.com/AntLingAGI/status/1972711364876697612
1Tモデルでそこそこ
46無題Name名無し 25/09/30(火)23:02:26No.141426そうだねx1
>No.141403
GLMなら https://chat.z.ai/ で試せる
フラグシップモデルなら悪くないけど
プロンプトが悪いのか繰り返し多いし国語力はQwen3より微妙な気が…
47無題Name名無し 25/10/01(水)00:07:43No.141436そうだねx1
イーロンはxAIがGrokipedia(Wekipediaクローン?)を準備中だと発言
https://x.com/elonmusk/status/1972992095859433671
48無題Name名無し 25/10/01(水)00:19:24No.141442そうだねx1
>Ring-1T-preview
>https://x.com/AntLingAGI/status/1972711364876697612
>1Tモデルでそこそこ
これLMArenaでたまに出てきてたけど日本語でプロンプト与えても毎回中国語で返してきてたんだよな
内容は日本語のプロンプトに即してたから日本語理解できない訳じゃないみたいだけど何だったんだろ
49無題Name名無し 25/10/01(水)04:41:09No.141467+
書き込みをした人によって削除されました
50無題Name名無し 25/10/01(水)04:48:00No.141468そうだねx2
OpenAIが動画生成AIであるSora2を発表
https://openai.com/index/sora-2/

APIも提供されるようで、Xのコメ欄にはHiggsfieldを通して使えるのを楽しみにしているみたいなニュアンスの投稿が多くて草生えます
51無題Name名無し 25/10/01(水)18:05:22No.141524そうだねx1
Alibaba製NVIDIA互換AIチップの互換性はPyTorch対応レベルじゃないかという記者
https://www.theregister.com/2025/08/29/china_alibaba_ai_accelerator/

Radeon、Arcレベルの互換性という見立て
52無題Name名無し 25/10/02(木)05:20:49No.141608+
>OpenAIが動画生成AIであるSora2を発表
絵も動きも音声もBGMも一括でやってくるって来年はこれ基準になるのか…やばいね
というかオプトアウトをガチでやってきてて強気がすぎる…
53無題Name名無し 25/10/02(木)14:56:18No.141627そうだねx5
Sora2やばいねこれ
54無題Name名無し 25/10/02(木)16:49:35No.141628+
>Sora2やばいねこれ
公式紹介動画?の中の日本のアニメ風のやつ凄かったね
日本語のイントネーションも完璧みたいな
55無題Name名無し 25/10/02(木)23:45:47No.141676そうだねx2
国立情報学研究所における大規模言語モデル構築への協力について
https://www.ndl.go.jp/jp/news/fy2025/251001_01.html

国立国会図書館は、官庁出版物のデジタル化画像からOCR(光学文字認識)技術により作成した全文検索用のテキストデータ(全文テキストデータ)を提供することについて、国立情報学研究所(NII)と合意しました
56無題Name名無し 25/10/03(金)03:52:42No.141697そうだねx1
キオクシア、「NVIDIAの要望」で100倍速SSD開発 AIサーバー向け
https://www.nikkei.com/article/DGXZQOUC124LU0S5A910C2000000/

有料記事
57無題Name名無し 25/10/04(土)15:27:01No.141865そうだねx3
Sora2もうかなり規制入ったみたいだね、あくまでユーザー目線だけど
58無題Name名無し 25/10/04(土)20:49:07No.141895+
ChatGPTは完全にエロネタダメになった
59無題Name名無し 25/10/05(日)19:43:29No.142048そうだねx1
TencentのHunyuan Image 3.0
https://x.com/TencentHunyuan/status/1972137010707288459
LMArenaでnano-bananaを抜いてトップ
60無題Name名無し 25/10/05(日)19:48:33No.142053そうだねx1
Seedream 4.0
https://seed.bytedance.com/en/seedream4_0
LMArenaだとnano-bananaに次いでたけどHunyuan Image 3.0がトップになったのでどうなんだろう
61無題Name名無し 25/10/05(日)19:56:35No.142054そうだねx1
AlibabaのWan2.5-Preview
https://x.com/Alibaba_Wan/status/1970697244740591917
画像生成・編集機能とVeo3やSora2と同じく音声出力も行える動画生成機能がある
62無題Name名無し 25/10/06(月)01:19:56No.142115そうだねx2
LMArenaの評価方式ってだいぶハックされてる感じだしどうなんでしょうね…
63無題Name名無し 25/10/06(月)02:32:37No.142118そうだねx1
ベンチはいいから実際に使わせてくれってかんじ
そうなるとやっぱり何かしら機能追加したらとりあえず使わせてくれるchatgptやgeminiが強いなあって感じる
64無題Name名無し 25/10/07(火)00:39:12No.142219+
Sora 2でえっちな二次元美少女動画を出力するプロンプト共有スレはどこっすか
とりあえず「しこ、しこ、…気持ちいい?」まではできた
65無題Name名無し 25/10/07(火)12:36:36No.142262そうだねx1
sora2スレできたのでそっちいくといい
66無題Name名無し 25/10/08(水)05:48:11No.142384そうだねx1
Gemini 2.5 Computer Use model
https://x.com/GoogleAIStudio/status/1975648565222691279

Google AI Studioが発表した「Gemini 2.5 Computer Useモデル」は、ユーザーインターフェース(UI)と直接対話できるエージェントを支援するために設計された、Gemini 2.5 Proベースの特殊モデル

・UI操作に特化:クリック、入力、スクロールなど、人間のような操作が可能。
・フォーム入力・ドロップダウン操作・ログイン後の操作など、従来のAPIでは難しかったGUI操作を実現。
・低レイテンシで高精度:Browserbaseなどのベンチマークで他モデルを上回る性能。

次期PC向けOSに標準搭載されると思われる
67無題Name名無し 25/10/09(木)05:10:38No.142497そうだねx1
ChatGPT Apps SDK
https://openai.com/index/introducing-apps-in-chatgpt/

月間アクティブユーザー8億人を擁する
Chat GPT内のapp sotreになる可能性がある

利用可能なパートナーアプリ(初期)
Booking.com、Canva、Coursera、Expedia、Figma、Spotify、Zillowなど。

EU以外のChatGPTユーザー(Free, Go, Plus, Pro)に提供開始。
68無題Name名無し 25/10/09(木)13:23:25No.142541そうだねx1
    1759983805907.jpg-(147427 B)
147427 B
ブルームバーグによるAI関連の資金循環のまとめ
69無題Name名無し 25/10/09(木)15:26:50No.142545そうだねx1
サムソン電子 小型AIモデル「TRM」を発表
https://www.artificialintelligence-news.com/news/samsung-tiny-ai-model-beats-giant-reasoning-llms/

・わずか7百万パラメータでLLM(DeepSeek-R1やGemini 2.5 Proなど)よりも良いスコアを主要な推論テストで獲得した。
・行動する前に計画を立て段階的自己修正することより、迷路や数独など難解問題も高精度で回答。
・モデルを小型化することで過学習のリスク回避。
・1,000例という少数の学習データでも高い精度を維持。
70無題Name名無し 25/10/09(木)16:03:38No.142546そうだねx1
codemender
https://deepmind.google/discover/blog/introducing-codemender-an-ai-agent-for-code-security/

DeepMindが開発したCodeMenderは、AIによってコードの脆弱性を自動的に発見・修正するエージェントです。従来の手法(例:ファジング)では困難だったゼロデイ脆弱性の特定と修正を行える

実例と成果
・libwebpへの-fbounds-safetyアノテーション適用:過去にゼロクリック攻撃に使われた脆弱性(CVE-2023-4863)を含むバッファオーバーフローを根本的に封じ込め。
・72件のセキュリティ修正をOSSにアップストリーム済み:最大450万行のコードを含むプロジェクトにも対応。
・修正例の動画付き解説:XMLスタック管理の不備や、Cコード生成システムの複雑なオブジェクトライフタイム問題などをAIが特定・修正。
71無題Name名無し 25/10/09(木)20:32:57No.142577そうだねx2
ローカルLLM のリリース年表
https://note.com/npaka/n/n1d99253ae2cf

2025年9月末分まで
72無題Name名無し 25/10/10(金)05:05:20No.142633そうだねx1
「AIアニメ」制作のKaKa Creation、4億5000万円を調達 アミューズやMIXIなど9社から
https://www.itmedia.co.jp/aiplus/articles/2510/09/news109.html

調達した資金は、同社独自のAIアニメ制作基盤による人気版権のアニメ化のほか、縦読みマンガ「Webtoon」の作家や個人クリエイターとの共同開発に充てる。
73無題Name名無し 25/10/10(金)07:52:01No.142636そうだねx1
AIが生成したフィッシングメールを識別できた人は46%、1.8万人に調査
https://news.mynavi.jp/techplus/article/20251009-3524771/

この調査はYubicoの依頼を受けたTalker Researchが日本、米国、英国、オーストラリアを含む9カ国の成人1万8,000人を対象に実施したもの。

調査結果
*AI生成フィッシングメールを見抜けた人は46%。
*残り54%は「見抜けない」または「確信が持てない」と回答。
*世代間の差はなく、全年代で識別が困難。
*一方で「人間が書いた本物のメール」を正しく識別できたのは約30%にとどまり、誤検知率の高さも浮き彫りに。

従来の人間の直感や経験だけでは防御が難しくなっている、というレベルに
74無題Name名無し 25/10/10(金)17:56:37No.142678+
嫌な話だねえ
75無題Name名無し 25/10/10(金)23:51:51No.142739+
フェイクを見抜くにもAIが絶対に必要になってきたわけね
76無題Name名無し 25/10/11(土)16:28:45No.142829そうだねx1
Google Researchが開発した新しい音声検索技術「Speech-to-Retrieval(S2R)
https://arxiv.org/abs/2412.16500

S2Rは音声を直接検索意図にマッピングする技術で、テキストへの変換を省略。
「何を言ったか」ではなく「何を求めているか」に焦点を当てる。
音声と文書をそれぞれベクトル化し、意味的な近さで検索結果を導く。

音声の「理解」の再現めいててすごい
77無題Name名無し 25/10/11(土)17:23:50No.142832そうだねx1
Kwaipilotによる最新の大規模言語モデル KAT-Dev-72B-Exp
https://huggingface.co/Kwaipilot/KAT-Dev-72B-Exp

・KAT-Dev-72B-Exp は、72B(720億)パラメータを持つオープンソースの言語モデル。主に ソフトウェアエンジニアリングタスク に特化して設計されている。
・SWE-Bench Verified 評価では 74.6% の正確性 を達成(SWE-agent scaffold を使用)。
特にこのタスクスコアは500BクラスのQwen3-coderを超える好成績
78無題Name名無し 25/10/11(土)19:02:24No.142844そうだねx1
中国、レアアース技術の輸出規制発表
https://www.bloomberg.co.jp/news/articles/2025-10-09/T3UBBTGOYMTC00

生産設備等の輸出も規制ということで半導体関連の影響が懸念され、米大統領もSNSで長文お気持ち(対抗策がない)を発していた
AIバブルやいかに
79無題Name名無し 25/10/12(日)09:54:33No.142924そうだねx1
Nexa AIはSnapdragon搭載のスマホ(RAM 16GB↑)でGPT-OSS 20Bをローカルに動かせると発表した
https://x.com/nexa_ai/status/1975232300985291008

@Snapdragon Gen5での実際のパフォーマンス:
- 17トークン/秒のデコード速度
- 初回トークン生成時間3秒未満
80無題Name名無し 25/10/15(水)03:49:41No.143405そうだねx1
NVIDIAがNVFP4と呼ばれる4ビット精度で12Bパラメータの言語モデルを精度を損なうことなく大規模な事前トレーニングを成功させた

• NVFP4は、FP8と比較して2〜3倍速い計算スループットと50%少ないメモリ使用量を実現
• 精度、ほぼ同一。(MMLU-Pro:FP8 = 62.62%、NVFP4 = 62.58%)
• 安定性の問題?ランダムハダマール変換、確率的丸め、2Dスケーリングを使用して解決
• NVIDIA Blackwell GPUで完全にトレーニングされ、10Tトークンにわたる初の4ビット実行が安定

省エネ
81無題Name名無し 25/10/15(水)04:43:23No.143409そうだねx1
Python3.14へバージョンアップ
https://test.python.org/downloads/release/python-3140/

GILの無効化を含む様々な変更で並列処理の強化がみこまれるが、pytorchなどのパッケージが対応するのは少し先になる見込み
82無題Name名無し 25/10/15(水)05:01:12No.143410そうだねx1
StreamingVLM
https://huggingface.co/papers/2510.09608

StreamingVLMは、無限に続く動画ストリームをリアルタイムで安定して理解するためのビジョン言語モデル(VLM)です。

評価と成果:
・新ベンチマーク「Inf-Streams-Eval」(平均2時間以上の動画)を構築。
・GPT-4O miniに対しての独自ベンチで66.18%の勝率を達成。
・単一のNVIDIA H100上で最大8FPSのリアルタイム性能を維持。
83無題Name名無し 25/10/15(水)08:12:34No.143417そうだねx2
ComfyUIはnVidia製の小型AIスパコン「DGX Spark」上で動作する(公式サポート)と発表
https://blog.comfy.org/p/comfyui-on-nvidia-dgx-spark

DGX Sparkは、サイズ5.91×5.91インチ、厚さ1.99インチ(約150×150×50mm)「折り紙1枚ほどの大きさで、ハードカバー本ほどの厚み」の筐体に 1ペタフロップという圧倒的な処理性能を実現し、128GBのユニファイドメモリを搭載する。価格4000ドル。
84無題Name名無し 25/10/15(水)11:20:15No.143432+
>No.143417
それでもマックよりは安いんだな・・
欲しい。
85無題Name名無し 25/10/15(水)12:20:52No.143440そうだねx1
LPDDR5xメモリの帯域(最大273GB/s)のボトルネックをどう考えるか?最適化しだいか?という議論を海外でやってるけど用途次第では安いかも

自分も買えるなら欲しい
86無題Name名無し 25/10/15(水)17:17:54No.143459そうだねx1
琥珀青葉 氏がHF互換ホスティングサービスのKohakuHubを構築を発表
https://x.com/KBlueleaf/status/1978120124067451088

Hugging Faceのあやしげな規約変更をうけて、stableDiffusionの追加学習LyCORISの作者としても有名な方が立ち上げ

HF APIとの互換性 — 既存のスクリプトがそのまま動作
🗄️ 独自のストレージ対応(R2、S3、MinIOなど)
🧩 使い慣れたフロントエンドUIのUX
🔐 モデル、データセット、アクセスポリシーの完全な制御
87無題Name名無し 25/10/16(木)01:19:04No.143571そうだねx1
Veo3.1
https://blog.google/technology/ai/veo-updates-flow/
開始・終了画像指定やExtendによる延長要素のinsertやオブジェクトの削除が行える
88無題Name名無し 25/10/16(木)05:57:27No.143587そうだねx1
Claude Haiku 4.5
https://www.anthropic.com/news/claude-haiku-4-5
Claude Sonnet 4と同等のSWE-benchで3分の1のコスト2倍以上の速度を実現
89無題Name名無し 25/10/16(木)07:36:21No.143590そうだねx1
PyTorch 2.9 Release
https://pytorch.org/blog/pytorch-2-9/

NVIDIA CUDA 13に対応しており、WindowsでもGPUアクセラレーションが可能です。
ROCm(AMD)やXPU(Intel)はLinuxのみ対応です。
90無題Name名無し 25/10/16(木)07:48:21No.143591そうだねx1
RAEs( Representation AutoEncoders)
https://rae-dit.github.io/

次世代のVAE

従来型のVAEには以下のような限界がある:
*古い構造で情報量が少ない
*潜在空間が低次元で表現力が弱い
*再構成品質が低く、生成画像の質に影響

事前学習済みの表現エンコーダ(例:DINOv2, MAE, SigLIP)と軽量なデコーダを組み合わせたRAE
*潜在空間が高次元かつ意味的に豊か
*Transformerベースの拡張性が高い
*計算コストがとても安い
91無題Name名無し 25/10/16(木)19:56:06No.143663そうだねx1
Google Researchが開発した機械学習アクセラレータ「Coral NPU」がオープンソース化
https://github.com/google-coral/coralnpu

ライセンス:Apache 2.0
超低消費電力のウェアラブルデバイス(ARグラス、スマートウォッチ、ヒアラブルなど)向けのML推論用ハードウェアIP
92無題Name名無し 25/10/16(木)21:32:10No.143671+
スレッドを立てた人によって削除されました
ついに!逮捕者でたぞ!!
な?分かってるよな!?
93無題Name名無し 25/10/17(金)03:40:11No.143715そうだねx1
    1760640011635.jpg-(287173 B)
287173 B
PaddleOCR-VL
https://huggingface.co/PaddlePaddle/PaddleOCR-VL

baidu/ERNIE-4.5-0.3B-PaddleのファインチューニングによるOCR用モデル
ベンチスコアはSOTA達成とかなり高い

評価結果
*テキスト認識:編集距離が最小で、多言語(109言語)・多様な文書タイプに対応。
*表認識:境界の有無、品質の違いなど多様な表形式に強い。
*数式認識:印刷・手書き・スキャンなど、すべてのカテゴリで最高性能。
*チャート認識:11種類のチャートカテゴリで、72B規模のマルチモーダルモデルを上回る性能。
94無題Name名無し 25/10/17(金)05:33:12No.143723そうだねx1
vLLM TPU
https://blog.vllm.ai/2025/10/16/vllm-tpu.html

*vLLM TPUは、TPU上でPyTorchとJAXの両方をサポートする統一バックエンドを提供。
*tpu-inferenceという新しいハードウェアプラグインを採用し、JAXベースのXLAコンパイル経路でPyTorchモデルも高速に動作。
*モデルコードの変更なしで、約20%のスループット向上を実現。
*Llama 3.1-8Bで3.6倍、Llama 3.1-70Bで2.1倍のスループット向上。
*RPA v3により、任意のモデル仕様や量子化形式に対応可能。
*Trillium (v6e)とv5p世代のTPUをサポート。

pip install vllm-tpuで統一インストール。
95無題Name名無し 25/10/17(金)05:41:43No.143725そうだねx1
    1760647303359.jpg-(435159 B)
435159 B
Apple M4 MAX + GDX Spark x2とかいう脳筋編成好き
96無題Name名無し 25/10/17(金)06:03:56No.143726そうだねx1
MSI、NVIDIA GB10搭載のAI開発者向けミニPC。最大2,000億パラメータのAIモデルに対応
https://pc.watch.impress.co.jp/docs/news/2054705.html

 公称のAI性能は1PFLOPS(FP4)。メモリは128GB。OSはNVIDIA DGX OS。
 インターフェイスはHDMI 2.1a、USB 3.2 Gen 2 Type-C 4基、ConnectX-7、10Gigabit Ethernet、Wi-Fi 7、Bluetooth 5.4。
 本体サイズは約151×57×151mm、重量は約1.2kg。
97無題Name名無し 25/10/17(金)06:31:16No.143731そうだねx1
AnyUp
https://wimmerth.github.io/anyup/

VAEなどのあらゆる画像エンコーダーから得られた結果を意味を損なわずアップスケールできる
256*256や512*512な結果を任意のサイズに拡大できることによりピクセルオーダーなシステムに適応できる

たぶん画期的
98無題Name名無し 25/10/18(土)18:50:12No.143896そうだねx1
    1760781012916.png-(138928 B)
138928 B
similarwebの調べによるとアクセス数でChatGPTがXを追い抜こうとしているそうだ
99無題Name名無し 25/10/18(土)19:20:30No.143900そうだねx1
Verbalized Sampling
https://huggingface.co/papers/2510.01171

LLM(大規模言語モデル)におけるモード崩壊(mode collapse)を緩和し、多様性(diversity)を引き出すためのプロンプト設計手法です。従来のLLMは、同じプロンプトに対して似たような応答ばかり返す傾向があり、これは人間によるフィードバックが「典型性バイアス(typicality bias)」をおこしがちなことによって引き起こされます。

Verbalized Samplingでは、LLMに「複数の応答とその出現確率」を生成させるようなプロンプトを与えることで、モデル内部に潜在していた多様な応答モードを引き出します

*ClaudeやGPT-4などのモデルに対して、Verbalized Samplingを用いることで多様性が最大2倍に向上。
*モデルの安全性や事実性は損なわれず、むしろ創造性が高まる。
*ベースモデルの66.8%の多様性が回復可能。
100無題Name名無し 25/10/18(土)20:13:13No.143905そうだねx2
    1760785993456.jpg-(92910 B)
92910 B
Alpha Arenaにて6つのAIモデルがそれぞれ1万ドルを完全に自律的に取引するライブベンチマークを開催
https://nof1.ai/

実際の市場での取引のようだ。
10/18 PM8現在 トップはDeepSeek V3.1
101無題Name名無し 25/10/19(日)22:08:47No.144074そうだねx2
VideoLingo
https://github.com/Huanshere/VideoLingo/

Netflixレベルの字幕生成・翻訳・整列・吹き替えを一括で自動処理できるAIツール

・YouTube動画のダウンロード:yt-dlpを使用
・高精度な字幕認識:WhisperXによる単語レベルの認識
・AIによる字幕分割と翻訳:自然言語処理で滑らかな翻訳を実現、カスタム+AI生成の用語集で一貫性を確保
・3ステップ翻訳:Translate → Reflect → Adaptで映画品質の字幕
・高品質な吹き替え:GPT-SoVITS、Azure、OpenAIなどのTTSを統合
・StreamlitによるUI:ワンクリックで起動・処理
・多言語対応:英語、日本語、スペイン語、フランス語など
102無題Name名無し 25/10/21(火)19:03:07No.144334そうだねx2
DeepSeek-OCR
https://github.com/deepseek-ai/DeepSeek-OCR

テキストを含む画像は、生のテキストそのものよりもはるかに少ないトークンで表現できることを実証するモデル
例えば1000語のテキストを画像にしてからVLMに読み込ませると100ビジュアルトークンで済む
コンテキストウィンドウの容量が大きくなると単語間の距離が離れすぎるために文脈の理解が壊れることを防ぐことができるようになるかもしれない
音読と速読術の違いくらいの差がでるかもしれない
103無題Name名無し 25/10/22(水)04:55:22No.144411そうだねx1
>DeepSeek-OCR
図書館等の古いアーカイブであるマイクロフィッシュを読み込ませるということを思いついた人がいて、割と良好な結果が出てるらしい
文章(ページ?)を光学的に処理するというパラダイムシフトが起こるかもしれない
https://x.com/BrianRoemmele/status/1980634806145957992
104無題Name名無し 25/10/22(水)05:33:02No.144413そうだねx2
https://huggingface.co/Phr00t/WAN2.2-14B-Rapid-AllInOne/tree/main/Mega-v8

wan2.2周辺の高速化など全部盛りなモデルがアップデート
GGUFファイルで約11GBと軽量化でき、ワークフローもシンプルにできるので 脱easywan22の第一歩におすすめ

翻訳
https://huggingface-co.translate.goog/Phr00t/WAN2.2-14B-Rapid-AllInOne?_x_tr_sl=en&_x_tr_tl=ja&_x_tr_hl=ja
105無題Name名無し 25/10/22(水)06:54:53No.144414そうだねx2
Minisforumから「MS-S1 MAX」
https://www.minisforum.jp/products/ms-s1-max

AMD Ryzen Al Max+ 395搭載のハイエンドミニPC
2.8Kg・222 x 206 x 77mm (LWH)、160Wピークパワー、130Wでの安定動作。本体にマイク付き。
これでいてWindows機なのおもしろい。価格:約$2400
106無題Name名無し 25/10/24(金)23:16:05No.144737そうだねx3
WorldMirror
https://arxiv.org/html/2510.10726v1

ワールドモデル:
従来のSfMやMVSのような反復最適化を必要とせず、1回の推論で高精度な3D出力を得られるため、リアルタイムアプリケーションにも適してい

多様なベンチマークでSOTA性能:
点群再構成、カメラ姿勢推定、法線推定、新規視点合成など、複数のベンチマークで既存手法を上回る精度を記録。
107無題Name名無し 25/10/25(土)21:51:51No.144845そうだねx1
Pico-Banana-400K:
https://github.com/apple/pico-banana-400k

appleによるデータセット公開:
• 複雑な編集チェーンのための72,000のマルチターンシーケンス
• アライメントと報酬モデリングのための56,000の選好ペア(成功 vs 失敗)
• 長いトレーニングスタイルのプロンプトと短い人間らしい編集の両方のデュアル指示

元画像:Open Images(CC BY 2.0ライセンス)から取得された実在の画像。

編集指示:Gemini-2.5-Flashが各画像に対して自然言語で生成(例:「赤い車を青に変えてください」)。

編集結果:Nano-Bananaモデルが指示に従って画像を編集し、Gemini-2.5-Proによる自動評価を通過したもののみが「成功例」として採用。
108無題Name名無し 25/10/25(土)23:28:37No.144860そうだねx1
    1761402517296.jpg-(42336 B)
42336 B
olmOCR 2:
https://allenai.org/blog/olmocr-2

Qwen2.5-VL-7Bをベースにファインチューニングされた。
olmOCR-BenchにおいてDeepSeek-OCRやPaddleOCRを超えるスコアを達成。olmOCR-Benchのスコアは、「文書としてどれだけ正しく再構成できたか」を示す指標。
109無題Name名無し 25/10/25(土)23:54:14No.144867そうだねx1
A1111のPortable版(Python3.11.13)
https://na3.folderfort.com/drive/s/aVrmmXF1qQDb9Xn6ZJN0mnaIsM4MWG
https://note.com/198619891990/n/n87be02c0e19c

SD1.5+A1111+multidiffusion+controlnet_SD1.5tileの超解像度化が好きなのでメンテを続けているという方のブログより
110無題Name名無し 25/10/26(日)00:45:57No.144876そうだねx1
https://aistudynow.com/sora-2-in-comfyui-workflow-how-i-generated-a-free-15-sec-ai-video/
https://ai.t8star.cn/

SORA2のComfyワークフローを使い
中華AIマルチツールでOpenAI公式より格安で生成する方法
111無題Name名無し 25/10/26(日)06:11:31No.144899そうだねx3
>https://aistudynow.com/sora-2-in-comfyui-workflow-how-i-generated-a-free-15-sec-ai-video/
>https://ai.t8star.cn/
>
>SORA2のComfyワークフローを使い
>中華AIマルチツールでOpenAI公式より格安で生成する方法

15秒はすごいな
112無題Name名無し 25/10/26(日)13:23:47No.144928そうだねx1
ImpossibleBench:
https://arxiv.org/html/2510.20270v1
https://x.com/rryssf_/status/1982032537917808915

LLMがパワフルになっていく一方で「報酬ハッキング」の割合も増えている
このフレームワークはそういったAIのズルさを定量化し測定可能な指標に変える。

不可能なコーディングタスク(仕様とテストが矛盾する場合)でもプロンプトの設計しだいでズルさを抑制できることも示す

例:GPT-5
緩い「すべてのテストに合格してください」という指示
→ 10回中9回不正を行う。

厳格な「テストが一貫していない場合は停止してください」
→ 不正はほぼゼロに減少。
113無題Name名無し 25/10/27(月)17:59:19No.145096そうだねx1
Audio Flamingo 3
https://research.nvidia.com/labs/adlr/AF3/

nvidiaリリースの音声理解と推論特化のAIモデルがバージョンアップで大幅に能力強化

長時間音声・文脈理解(10分)と複雑な音声対話(必要とされる場面のCoT推論とマルチターンチャット、一つの音声に含まれる複数の音声主の分離など)

多くのテスト項目でSATO達成
114無題Name名無し 25/10/28(火)03:07:30No.145159そうだねx1
LLMs can hide text in other text of the same length
https://arxiv.org/abs/2510.20075

LLM(大規模言語モデル)を使って、意味のあるテキストを、まったく異なるが同じ長さの別のテキストに隠す方法

ステガノグラフィの新手法とみなされている:
・隠されたテキストと見かけ上のテキストは、LLMのトークン単位で同じ長さ。これにより、見た目ではどちらが本物か判別できない。
・隠したいテキストの各トークンの「出現順位」をLLMで記録。同じモデルと使用したプロンプト・出現順位情報があれば、元のテキストへ復元可能。
・検閲回避、LLM特有の人間の意図を介さないもっともらしい生成により否認可能性を確保できる
・AIエージェント間の通信をただしく監視できない可能性
・二重性による情報帯域の倍加

そして、人の持つ、知識・意図・責任の境界を問い直す哲学的インパクトを持つ。
115無題Name名無し 25/10/28(火)05:56:08No.145166そうだねx1
    1761598568767.jpg-(160190 B)
160190 B
ボニーピンクの新曲「Like Gravity」MV、
全編生成AI動画で制作される
https://www.youtube.com/watch?v=wlOHtlePSm8

https://gencraft.jp/
116無題Name名無し 25/10/28(火)10:34:44No.145201そうだねx1
MiniMaxよりMiniMax M2がリリース
https://x.com/MiniMax__AI/status/1982674798649160175
Claude Sonnetの8%の価格で最大2倍の速度
Artificial AnalysisのIntelligence Index scoreではClaude Sonnet 4.5に次ぐ5位となりオープンウェイトでは最高
11/7まで無料で利用可能
117無題Name名無し 25/10/28(火)18:24:54No.145213そうだねx2
>・隠されたテキストと見かけ上のテキストは、LLMのトークン単位で同じ長さ。これにより、見た目ではどちらが本物か判別できない。
>・検閲回避、LLM特有の人間の意図を介さないもっともらしい生成により否認可能性を確保できる

多分マルウェアとか悪意あるプログラム作成とかに使われるってことなんだろうけど
頭ち◯こ野郎としてはGrokやGTPでエロ出来るか否かをまず考えてしまった
118無題Name名無し 25/10/29(水)00:26:05No.145256そうだねx1
MoCha
https://orange-3dv-team.github.io/MoCha/

Wan2.1-T2V-14Bのファインチューニングによるキャラクター置換動画生成AI

オリジナルの環境再現の良さを引き継ぎつつKlingやWan Animateを超える置換性能を見せている
119無題Name名無し 25/10/29(水)00:39:30No.145258そうだねx1
NANO3D
https://jamesyjl.github.io/Nano3D/

学習やマスク不要で使用できる3Dモデル編集特化のAIモデル
3Dモデルをプロンプトで操作できる感覚か。
120無題Name名無し 25/10/29(水)04:15:10No.145273+
書き込みをした人によって削除されました
121無題Name名無し 25/10/29(水)04:16:35No.145274そうだねx1
TOON
https://github.com/xaviviro/toon

TOON(Token-Oriented Object Notation)は、LLM(大規模言語モデル)向けに最適化された構造化データフォーマットです。JSONのようなデータ構造を、より少ないトークン数で、より効率的にモデルに渡すために設計された。

YAMLのインデント構造とCSVの表形式を融合し、LLMとのやり取りに特化した新しい記法です。大量のデータを効率よく扱いたいときに有用です。

入力トークン数削減
122無題Name名無し 25/10/30(木)15:35:51No.145382そうだねx1
Brumby-14B-Base
https://manifestai.com/articles/release-brumby-14b/

Manifest AIによるQwen3を土台(重みを初期化として利用)にしたTransformerとは別アーキテクチャの再訓練モデル

attentionを使わない新しいタイプの大規模言語モデル(LLM)。
代わりにpower retention layer(保持層)を使用し、Transformer風の構造を持つが、真のRNNとして動作する。

Transformer使用より低学習コスト・高速・長文処理に強み
vLLMを統合した推論エンジンを開発中
123無題Name名無し 25/10/30(木)23:41:43No.145418そうだねx1
drFonts
https://drfonts.com/

AIによるフォントジェネレーター
画像からの作成・管理・デザイン全体での配色・構図等の提案を含む。
124無題Name名無し 25/10/31(金)00:05:09No.145423そうだねx1
Universal Music Group(UMG)とAI音楽生成プラットフォームUdioが、業界初の戦略的提携を発表:
https://www.universalmusic.com/universal-music-group-and-udio-announce-udios-first-strategic-agreements-for-new-licensed-ai-music-creation-platform/

・著作権侵害訴訟を和解し、ライセンス契約を締結。UMGのアーティストと作詞家に新たな収益機会を提供。
・2026年に新サービスのローンチ予定
・現行のUdioサービスは継続提供されるが、指紋認識やフィルタリングなどの安全対策が導入される。
・UMGはYouTube、TikTok、MetaなどとAI関連契約を締結済み。今回の提携はその延長線上にある。

Udio躍進やなぁ
125無題Name名無し 25/10/31(金)00:18:57No.145425+
Stability AIもUniversal Music Group(UMG)やEAと提携したみたいだった
126無題Name名無し 25/10/31(金)02:51:27No.145444そうだねx1
    1761846687762.jpg-(139915 B)
139915 B
TBS、ドラマ「VIVANT」続編に動画生成AI 「Veo 3」の映像を採用へ 地上波放送のドラマで初
https://www.itmedia.co.jp/aiplus/articles/2510/30/news102.html
127無題Name名無し 25/10/31(金)04:34:20No.145445そうだねx1
LTX-2
https://ltx.video/

Lightricksが開発した次世代のマルチモーダルAI動画生成モデル。
オープンソースで提供予定(モデル重み・トレーニングコード含む)。

・4K/48fps/音声同期の高品質な動画(20秒)を生成可能。
・消費者向けGPUでも動作する効率性を実現
・API連携で編集ソフトやVFXパイプラインと統合可能。

各社Sora2が口火を切るのをまってたごとくの製品ラッシュ
128無題Name名無し 25/11/02(日)03:31:42No.145684そうだねx2
>drFonts
>https://drfonts.com/
>AIによるフォントジェネレーター
>画像からの作成・管理・デザイン全体での配色・構図等の提案を含む。
デザイン畑の人間としてはとうとう待ち望んでいたAIが登場したか!と思ったら日本語は勿論ないみたい
まあそうだよな…かなカナ漢字は量が膨大すぎるか
129無題Name名無し 25/11/05(水)21:08:24No.146070そうだねx1
コカ・コーラ クリスマス広告 2024 vs 2025
ともに生成AI
https://x.com/chatgpt21/status/1985536677004128759
130無題Name名無し 25/11/07(金)10:53:28No.146216+
iPhoneでGPT-OSS 20B
https://x.com/cocktailpeanut/status/1986468765425414609

なかなかの推論速度

- GazouBBS + futaba-