人工知能@ふたば
[ホーム]

[掲示板に戻る]
レス送信モード
おなまえ
E-mail
題  名
コメント
添付File []
削除キー(記事の削除用。英数字で8文字以内)
  • 添付可能:GIF,JPG,PNG,WEBM,MP4. 8000KBまで. 現在33人くらいが見てます.
  • スレッドを立てた人がレスを削除してスレッド内のみアク禁にできます.
  • メール欄に「id表示」と入れてスレッドを立てるとid表示にできます.
  • メール欄に「ip表示」と入れてスレッドを立てるとip表示にできます.
  • 削除依頼が閾値を超えるとidを表示します.
  • 生成系AI,ChatGPT,Stable Diffusion,自動運転など
  • 管理人への連絡は準備板 ご意見へ. 削除依頼は記事番号を押しdelを押して下さい.
  • スマホ・携帯ふたば入口 この板の保存数は20000件です. 規約
  • 新しい板: 人工知能 ZOIDS

画像ファイル名:1758338166177.png-(35946 B)
35946 B無題Name名無し25/09/20(土)12:16:06No.140247そうだねx7 1月28日頃消えます
AI関連のニューススレ
立ってないようなので
削除された記事が2件あります.見る
1無題Name名無し 25/09/20(土)12:17:44No.140248そうだねx3
Grok 4 Fast
https://x.ai/news/grok-4-fast
安くて2Mもあって性能も結構あるよ
2無題Name名無し 25/09/20(土)14:48:28No.140266そうだねx2
前スレ記録。
記録スレにあります
https://dec.2chan.net/bin/jump.php?https://megalodon.jp/2025-0919-0254-37/https://c3.ftbucket.info:443/other/cont/dec.2chan.net_85_res_120078/index.htm
3無題Name名無し 25/09/20(土)16:05:36No.140270そうだねx2
Wan2.2-Animate
https://x.com/Alibaba_Wan/status/1968921551392432175
Wan2.2の派生でキャラクター画像と参照動画でキャラクターをアニメーションできる
4無題Name名無し 25/09/21(日)23:50:11No.140427そうだねx1
IBMが開発した軽量マルチモーダルモデル Granite-Docling-258M
https://huggingface.co/ibm-granite/granite-docling-258M

タイプ:画像+テキスト → テキスト変換のマルチモーダルモデル
ベース構造:IDEFICS3を基盤に、以下を改良
・視覚エンコーダ:siglip2-base-patch16-512
・言語モデル:Granite 165M LLM

文書解析・変換に特化
5無題Name名無し 25/09/22(月)00:14:11No.140430そうだねx2
MCP Toolbox for Databases
https://github.com/googleapis/genai-toolbox

Googleのデータベース向けMCPツールボックスがオープンソースに
Python、JS、Go、LangChainなどと互換性
6無題Name名無し 25/09/23(火)03:03:05No.140550そうだねx4
MalTerminal
https://gbhackers.com/malterminal-new-gpt-4/

世界初級のLLM(大規模言語モデル)駆動型マルウェアの一例とされる。

OpenAIの GPT-4 API を利用し、実行時に ランサムウェアやリバースシェルのコードを動的生成。

従来型の「コード埋め込み型マルウェア」と異なり、実行ごとに異なる悪意コードを生成するため、静的シグネチャ検知がほぼ不可能。
7無題Name名無し 25/09/23(火)09:06:47No.140556そうだねx1
ネイティブなオムニモーダルモデルのQwen3-Omni
https://qwen.ai/blog?id=65f766fc2dcba7905c1cb69cc4cab90e94126bf4&from=research.latest-advancements-list
複数画像編集をサポートしたQwen-Image-Edit-2509
https://qwen.ai/blog?id=7a90090115ee193ce6a7f619522771dd9696dd93&from=research.latest-advancements-list
8無題Name名無し 25/09/23(火)09:08:41No.140557そうだねx1
DeepSeek-V3.1-Terminus
https://api-docs.deepseek.com/news/news250922
エージェント能力がアップ
9無題Name名無し 25/09/24(水)02:29:25No.140665そうだねx2
Teaching LLMs to Plan
提案手法:PDDL-INSTRUCT
https://arxiv.org/abs/2509.13351

「LLMは計画を立てるのが苦手」→「考える過程を言語化させ、外部でチェックして鍛える」→「論理的に正しい計画を作れるようになった」

問題を解くときに答えだけ書くのではなく、途中式を全部書かせて、先生が逐一チェックして直させる ことで、 「ちゃんと筋道を立てて考える力」を身につけさせたと言い換えられる。

評価
ベンチマーク:PlanBench(Blocksworld, Mystery Blocksworld, Logistics)
モデル:Llama-3, GPT-4
結果: 計画妥当性が最大 94% に到達(従来比 +66% 改善)。特に難しい Mystery Blocksworld で劇的な改善(1% → 64%)
10無題Name名無し 25/09/24(水)06:17:43No.140670そうだねx2
モデレーション用のQwen3Guard
https://qwen.ai/blog?id=f0bbad0677edf58ba93d80a1e12ce458f7a80548&from=research.research-list
視覚言語モデルのQwen3-VL
https://qwen.ai/blog?id=99f0335c4ad9ff6153e517418d48535ab6d8afef&from=research.latest-advancements-list
リアルタイムマルチモーダル翻訳モデルQwen3‑LiveTranslate‑Flash
https://qwen.ai/blog?id=b2de6ae8555599bf3b87eec55a285cdf496b78e4&from=research.latest-advancements-list
Qwen3-Max
https://qwen.ai/blog?id=241398b9cd6353de490b0f82806c7848c5d2777d&from=research.latest-advancements-list
11無題Name名無し 25/09/24(水)07:43:10No.140671そうだねx1
Gemini Liveモデルがアップデートしてgemini-2.5-flash-native-audio-preview-09-2025
https://x.com/googleaidevs/status/1970550144719536423
12無題Name名無し 25/09/25(木)02:41:36No.140761そうだねx1
「Nemotron-Personas-Japan: Synthesized Data for Sovereign AI」
https://huggingface.co/blog/nvidia/nemotron-personas-japan

nvidiaによる日本の人口統計・文化的背景を反映した 初の大規模オープン合成データセット。
個人情報を含まず、プライバシー保護・規制対応を前提に設計したという

オープン性:CC BY 4.0 ライセンスで商用・非商用利用可能
規制対応:日本の個人情報保護法(PIPA)に準拠
13無題Name名無し 25/09/25(木)02:52:40No.140762そうだねx1
    1758736360975.png-(151218 B)
151218 B
さくらインターネットのAI Engine
https://www.sakura.ad.jp/aipf/ai-engine/

テキスト生成・分類・埋め込み・音声認識(whisper)に対応
APIですぐ利用
・サーバー構築・運用は不要
無料で使える
・リクエスト制限内での利用が無料
複数の基盤モデル
・目的に応じたモデルを選択できる
セキュアな国内完結
・データが外部に出ない安心基盤
14無題Name名無し 25/09/25(木)03:15:14No.140763そうだねx1
awesome-ai-tools
https://github.com/mahseema/awesome-ai-tools

目的:
世界中の最新・有力なAIツールを分野ごとに整理した「キュレーションリスト」

特徴:
誰でも無料でツールを追加できる(Pull Request歓迎)
定期的にニュースレターで更新情報を配信
各カテゴリごとに代表的なAIサービスやOSSを紹介
15無題Name名無し 25/09/25(木)03:25:10No.140764そうだねx2
>No.140556
>No.140670
それぞれのモデルのちょっとした解説
https://x.com/0x__tom/status/1970360009826672690
16無題Name名無し 25/09/25(木)03:38:53No.140765そうだねx1
PlayCanvas Open Sources SOG: The WebP of Gaussian Splatting
https://blog.playcanvas.com/playcanvas-open-sources-sog-format-for-gaussian-splatting/

3D Gaussian Splatの新フォーマット「SOG」登場
SOG = Spatially Ordered Gaussians(点群ベースの3D表現)の圧縮フォーマット
従来の SOGS を改良した次世代仕様

特徴と利点
・ 圧縮が容易:CUDA不要、WebGPUで動作 → どこでも利用可能
・ 高精度:同じビット数でもアーティファクトを最小化

圧縮効果の例
・元データ(PLY形式):1GB
・SOG圧縮後:42MB(約95%削減)
17無題Name名無し 25/09/25(木)03:58:19No.140766そうだねx2
gambo
https://www.gambo.ai/

AIゲームビルダー、ワンストップ開発でデプロイ
広告収入も狙えるらしい
だけどこれ開発素材が著作権ぶっちぎりすぎてヤバい
18無題Name名無し 25/09/25(木)13:42:17No.140808+
>https://www.gambo.ai/
>AIゲームビルダー、ワンストップ開発でデプロイ
>広告収入も狙えるらしい
>だけどこれ開発素材が著作権ぶっちぎりすぎてヤバい
トップページからヤバすぎる
19無題Name名無し 25/09/25(木)17:23:21No.140819そうだねx2
Moondream 3
最先端の物体検出と強力な視覚的推論
https://moondream.ai/blog/moondream-3-preview
https://x.com/moondreamai/status/1970922304730431742

新アーキテクチャ:9BのMixture-of-Experts(MoE)モデルで、2Bのアクティブパラメータのみ使用。高速かつ低コストで推論可能。

オブジェクト検出:「紫の靴下を履いたランナー」など複雑なクエリにも対応。
ポインティング(指差し):画像内の対象物を直接指し示す能力。
構造化出力:32Kトークンの長文コンテキストにより、JSONなどの構造化データを生成可能。
OCR(文字認識):小さなフォントには課題があるが、実用レベルに到達。
20無題Name名無し 25/09/25(木)22:15:52No.140840そうだねx1
独立行政法人情報処理推進機構 セキュリティセンターが
米国国立標準技術研究所(NIST: National Institute of Standards and Technology)の発行するSP800シリーズ(SP: Special Publications)とFIPS(Federal Information Processing Standards)の中から、日本において参照するニーズが高いと想定される文書の翻訳・監修を行い、公開した
https://www.ipa.go.jp/security/reports/oversea/nist/about.html
21無題Name名無し 25/09/26(金)23:39:32No.140932そうだねx1
Gemini 2.5 FlashとFlash-Liteのアップデート
https://developers.googleblog.com/en/continuing-to-bring-you-our-latest-models-with-an-improved-gemini-2-5-flash-and-flash-lite-release/
22無題Name名無し 25/09/26(金)23:40:52No.140933そうだねx1
Gemini Robotics 1.5
https://deepmind.google/discover/blog/gemini-robotics-15-brings-ai-agents-into-the-physical-world/
23無題Name名無し 25/09/26(金)23:56:25No.140935そうだねx2
    1758898585513.jpg-(77722 B)
77722 B
世界初!日本企業(株式会社I.Y.P Consulting)がGPUを不要とする生成AI (LLM) の開発に成功。/2025年10月10日の都内イベントで先行発表
https://prtimes.jp/main/html/rd/p/000000009.000169148.html
https://neurips.cc/virtual/2025/poster/115463

Support Vector Generation (SVG) は、凍結された言語モデルを使って、解釈可能かつ学習不要なゼロショット分類器を構築する新しいカーネルベースの手法。

SVGは、Metropolis–Hastingsサンプリングとサポートベクターマシン(SVM)最適化を組み合わせ、言語モデルの埋め込みが誘導する再生カーネルヒルベルト空間(RKHS)で動作。
24無題Name名無し 25/09/27(土)00:05:14No.140936そうだねx1
AnimeGen(仮称)
https://animegen.jp/

経済産業省と国立研究開発法人新エネルギー・産業技術総合開発機構(NEDO)が実施する、国内の生成AIの開発力強化を目的としたプロジェクト「GENIAC(Generative AI Accelerator Challenge)」の成果をもとに作成された、テキストや画像からアニメを生成する試験的なサービス

クローズドテスト中
25無題Name名無し 25/09/27(土)00:06:08No.140938そうだねx2
ただの古典的なSVMでも見せ方によっては投資家から金集められるんだなあ
26無題Name名無し 25/09/27(土)01:49:45No.140945そうだねx1
oLLM
https://github.com/Mega4alik/ollm

大規模コンテキストのLLM推論を、8GB VRAMの一般的なGPUで可能にするpython軽量ライブラリ。

バージョンアップにより量子化ナシのgpt-oss-20B(13GB/bf16),qwen3-next-80B(160 GB/bf16)などの大き目モデルにも対応した。
27無題Name名無し 25/09/27(土)05:53:01No.140966そうだねx1
>世界初級のLLM(大規模言語モデル)駆動型マルウェアの一例とされる。
もう中身みないでCopilotにシェル実行させてるからこういうの流行りだすと怖いな
28無題Name名無し 25/09/27(土)16:55:56No.141021そうだねx1
    1758959756235.png-(110941 B)
110941 B
Sparse VideoGen2(SVG2)
https://svg-project.github.io/v2/

NeurIPS 2025でスポットライト論文として採択された動画生成モデルの推論を高速化するトレーニング不要のフレームワーク。

Semantic-Aware Permutation(意味ベースの並べ替え)と動的なAttentionカーネルを用いて、高品質かつ高速な動画生成を実現

HunyuanVideoで約2.5倍、Wan 2.1で約1.9倍の高速化を実現した。
29無題Name名無し 25/09/27(土)17:16:18No.141023そうだねx1
    1758960978537.webp-(233256 B)
233256 B
Craftwerk
https://euclyd.ai/#products

ヨーロッパ発のスタートアップ Euclyd が多数のチップレットを統合したSiP(System-in-Package)AI推論ハードウェアの商品情報を開示。

・1ユニット16,384個のプロセッサを搭載し、最大32 PFLOPSの性能を発揮。
・独自のメモリシステム「UBM」を採用:
・・1TBのDRAM
・・8000 TB/sの帯域幅

ArmやRISC-Vなどの既存IPは使用せず、完全自社設計のプロセッサ。
Transformerだけでなく、マルチモーダル推論・状態空間モデル・拡散モデルなどにも対応。
30無題Name名無し 25/09/27(土)18:24:26No.141025そうだねx1
The Illusion of Readiness「マルチモーダル医療ベンチマークにおける大規模最先端モデルのストレステスト」
https://arxiv.org/abs/2509.18234

前提として「ベンチマーク ≠ 実力」
モデルは画像を削除しても正答率が高く、選択肢の順番を変えるだけで答えが変わるなど、表面的なパターン認識に依存している。

「思考ステップ」を促すプロンプトでも、もっともらしいが誤った理由付けをすることが多い。

これらは単なるバグではなく、ベンチマークが“テストの攻略”を評価してしまっていることの証左。
31無題Name名無し 25/09/27(土)23:35:44No.141046そうだねx2
    1758983744876.jpg-(500560 B)
500560 B
SD3.5-Flash
https://hmrishavbandy.github.io/sd35flash/

StableDiffusion3.5 Mediumの高速版、蒸留型フローモデル。
Flashはわずか4ステップでMedium40ステップ相当の品質を出力
高性能な生成AIを一般的な消費者向けハードウェア(8GBメモリ)でも使えるように設計。
32無題Name名無し 25/09/27(土)23:54:15No.141048そうだねx1
Suno V5
https://x.com/SunoMusic/status/1970583230807167300
33無題Name名無し 25/09/28(日)00:15:05No.141051そうだねx1
Unsloth AIがGoogle colabの無料枠(T4など)でもGPT-oss(20B)のトレーニングが可能なnotebookを配布中
https://docs.unsloth.ai/new/gpt-oss-reinforcement-learning

gpt-ossのRLにおいて最速の推論速度(最大30 tokens/s)と最小VRAM使用量(50%削減)を実現。

vLLMはgpt-ossのRLに非対応のため、Unslothが独自にTransformersの推論コードを再設計。
34無題Name名無し 25/09/28(日)04:14:55No.141067そうだねx1
google Veo3の論文
https://www.alphaxiv.org/overview/2509.20328v1
35無題Name名無し 25/09/29(月)01:38:05No.141188+
限られた電力からシステム全体がどれだけのトークン数を絞り出すか?という競争のフェーズになっていて、単一のチップの性能や価格(仮に無料であっても)が絶対的な優位性にはならない、とnVidiaのceoが語る
36無題Name名無し 25/09/29(月)10:39:27No.141217+
たしかに3090安くて使えるけど
今月の電気代見たら確かに悲しくなったもんなぁ
37無題Name名無し 25/09/29(月)12:43:51No.141221+
>たしかに3090安くて使えるけど
>今月の電気代見たら確かに悲しくなったもんなぁ
うちの3080Tiで組んだPCがアイドルが100wだったよ…
電源は1200w入れてあるけど本気出したらどうなるか
ってか本気出せる使い方知らねぇや
38無題Name名無し 25/09/29(月)21:49:38No.141290そうだねx1
Craft-GPT
https://www.youtube.com/watch?v=VaeI9YgE1o8

レッドストーン回路で構成されたこのモデルは、PythonでTinyChatデータセットを使って訓練された約500万パラメータの構造をマインクラフト内に再現している

猛者すぎる…
39無題Name名無し 25/09/29(月)23:32:50No.141308そうだねx3
グラボなんてそのうち安くなった時に買えば良い。
つーか何年も前のグラボに結構な値段がついてる事に驚くわ。
40無題Name名無し 25/09/30(火)00:05:53No.141315そうだねx1
DeepSeek-V3.2-Exp
https://api-docs.deepseek.com/news/news250929
DeepSeek-V3.1-Terminusと同等クラスでありながらAPI価格は50%OFF
41無題Name名無し 25/09/30(火)05:33:27No.141340そうだねx1
Claude Sonnet 4.5
https://www.anthropic.com/news/claude-sonnet-4-5
30時間以上のタスクをこなせるらしい
42無題Name名無し 25/09/30(火)10:52:03No.141370+
さっそくClaude Sonnet 4.5のシステムプロンプトらしきものが漏れたらしい。
全文は8万文字超えのもよう。
43無題Name名無し 25/09/30(火)19:11:24No.141400そうだねx2
ニュースというわけではないが、AIテックカンファレンス東京AI祭2025の一部として「AIクリエイティブコンテスト2025」の 入賞作品発表された
https://note.com/tokyoaisai2025/n/n2e2d3760db1f

モデル限定の部門以外だとやはりMidjourneyが強いのがよくわかる。
音楽はほぼほぼSunoが独占状態

現状まだまだ懸念の残るモデルを使ってコンテストを開くことの善し悪しをおいておいたとしても、普段流れてくるXの作品やこの板の住人の方が優れてるんじゃないか?みたいなのが多分に含まれてて興味深かった。
44無題Name名無し 25/09/30(火)20:32:32No.141403そうだねx3
Z.aiのGLMが4.6にアップデート
https://z.ai/blog/glm-4.6
コーティングが結構強いっぽくClaude Sonnet4と比較してるけど悪くないかな?
GLMといえばGLM-4.5がNovelAIで採用されてたりするから文章もわるくないのかな…
45無題Name名無し 25/09/30(火)20:47:12No.141407そうだねx1
Ring-1T-preview
https://x.com/AntLingAGI/status/1972711364876697612
1Tモデルでそこそこ
46無題Name名無し 25/09/30(火)23:02:26No.141426そうだねx1
>No.141403
GLMなら https://chat.z.ai/ で試せる
フラグシップモデルなら悪くないけど
プロンプトが悪いのか繰り返し多いし国語力はQwen3より微妙な気が…
47無題Name名無し 25/10/01(水)00:07:43No.141436そうだねx1
イーロンはxAIがGrokipedia(Wekipediaクローン?)を準備中だと発言
https://x.com/elonmusk/status/1972992095859433671
48無題Name名無し 25/10/01(水)00:19:24No.141442そうだねx1
>Ring-1T-preview
>https://x.com/AntLingAGI/status/1972711364876697612
>1Tモデルでそこそこ
これLMArenaでたまに出てきてたけど日本語でプロンプト与えても毎回中国語で返してきてたんだよな
内容は日本語のプロンプトに即してたから日本語理解できない訳じゃないみたいだけど何だったんだろ
49無題Name名無し 25/10/01(水)04:41:09No.141467+
書き込みをした人によって削除されました
50無題Name名無し 25/10/01(水)04:48:00No.141468そうだねx2
OpenAIが動画生成AIであるSora2を発表
https://openai.com/index/sora-2/

APIも提供されるようで、Xのコメ欄にはHiggsfieldを通して使えるのを楽しみにしているみたいなニュアンスの投稿が多くて草生えます
51無題Name名無し 25/10/01(水)18:05:22No.141524そうだねx1
Alibaba製NVIDIA互換AIチップの互換性はPyTorch対応レベルじゃないかという記者
https://www.theregister.com/2025/08/29/china_alibaba_ai_accelerator/

Radeon、Arcレベルの互換性という見立て
52無題Name名無し 25/10/02(木)05:20:49No.141608+
>OpenAIが動画生成AIであるSora2を発表
絵も動きも音声もBGMも一括でやってくるって来年はこれ基準になるのか…やばいね
というかオプトアウトをガチでやってきてて強気がすぎる…
53無題Name名無し 25/10/02(木)14:56:18No.141627そうだねx5
Sora2やばいねこれ
54無題Name名無し 25/10/02(木)16:49:35No.141628+
>Sora2やばいねこれ
公式紹介動画?の中の日本のアニメ風のやつ凄かったね
日本語のイントネーションも完璧みたいな
55無題Name名無し 25/10/02(木)23:45:47No.141676そうだねx2
国立情報学研究所における大規模言語モデル構築への協力について
https://www.ndl.go.jp/jp/news/fy2025/251001_01.html

国立国会図書館は、官庁出版物のデジタル化画像からOCR(光学文字認識)技術により作成した全文検索用のテキストデータ(全文テキストデータ)を提供することについて、国立情報学研究所(NII)と合意しました
56無題Name名無し 25/10/03(金)03:52:42No.141697そうだねx1
キオクシア、「NVIDIAの要望」で100倍速SSD開発 AIサーバー向け
https://www.nikkei.com/article/DGXZQOUC124LU0S5A910C2000000/

有料記事
57無題Name名無し 25/10/04(土)15:27:01No.141865そうだねx3
Sora2もうかなり規制入ったみたいだね、あくまでユーザー目線だけど
58無題Name名無し 25/10/04(土)20:49:07No.141895+
ChatGPTは完全にエロネタダメになった
59無題Name名無し 25/10/05(日)19:43:29No.142048そうだねx1
TencentのHunyuan Image 3.0
https://x.com/TencentHunyuan/status/1972137010707288459
LMArenaでnano-bananaを抜いてトップ
60無題Name名無し 25/10/05(日)19:48:33No.142053そうだねx1
Seedream 4.0
https://seed.bytedance.com/en/seedream4_0
LMArenaだとnano-bananaに次いでたけどHunyuan Image 3.0がトップになったのでどうなんだろう
61無題Name名無し 25/10/05(日)19:56:35No.142054そうだねx1
AlibabaのWan2.5-Preview
https://x.com/Alibaba_Wan/status/1970697244740591917
画像生成・編集機能とVeo3やSora2と同じく音声出力も行える動画生成機能がある
62無題Name名無し 25/10/06(月)01:19:56No.142115そうだねx2
LMArenaの評価方式ってだいぶハックされてる感じだしどうなんでしょうね…
63無題Name名無し 25/10/06(月)02:32:37No.142118そうだねx1
ベンチはいいから実際に使わせてくれってかんじ
そうなるとやっぱり何かしら機能追加したらとりあえず使わせてくれるchatgptやgeminiが強いなあって感じる
64無題Name名無し 25/10/07(火)00:39:12No.142219+
Sora 2でえっちな二次元美少女動画を出力するプロンプト共有スレはどこっすか
とりあえず「しこ、しこ、…気持ちいい?」まではできた
65無題Name名無し 25/10/07(火)12:36:36No.142262そうだねx1
sora2スレできたのでそっちいくといい
66無題Name名無し 25/10/08(水)05:48:11No.142384そうだねx1
Gemini 2.5 Computer Use model
https://x.com/GoogleAIStudio/status/1975648565222691279

Google AI Studioが発表した「Gemini 2.5 Computer Useモデル」は、ユーザーインターフェース(UI)と直接対話できるエージェントを支援するために設計された、Gemini 2.5 Proベースの特殊モデル

・UI操作に特化:クリック、入力、スクロールなど、人間のような操作が可能。
・フォーム入力・ドロップダウン操作・ログイン後の操作など、従来のAPIでは難しかったGUI操作を実現。
・低レイテンシで高精度:Browserbaseなどのベンチマークで他モデルを上回る性能。

次期PC向けOSに標準搭載されると思われる
67無題Name名無し 25/10/09(木)05:10:38No.142497そうだねx1
ChatGPT Apps SDK
https://openai.com/index/introducing-apps-in-chatgpt/

月間アクティブユーザー8億人を擁する
Chat GPT内のapp sotreになる可能性がある

利用可能なパートナーアプリ(初期)
Booking.com、Canva、Coursera、Expedia、Figma、Spotify、Zillowなど。

EU以外のChatGPTユーザー(Free, Go, Plus, Pro)に提供開始。
68無題Name名無し 25/10/09(木)13:23:25No.142541そうだねx1
    1759983805907.jpg-(147427 B)
147427 B
ブルームバーグによるAI関連の資金循環のまとめ
69無題Name名無し 25/10/09(木)15:26:50No.142545そうだねx1
サムソン電子 小型AIモデル「TRM」を発表
https://www.artificialintelligence-news.com/news/samsung-tiny-ai-model-beats-giant-reasoning-llms/

・わずか7百万パラメータでLLM(DeepSeek-R1やGemini 2.5 Proなど)よりも良いスコアを主要な推論テストで獲得した。
・行動する前に計画を立て段階的自己修正することより、迷路や数独など難解問題も高精度で回答。
・モデルを小型化することで過学習のリスク回避。
・1,000例という少数の学習データでも高い精度を維持。
70無題Name名無し 25/10/09(木)16:03:38No.142546そうだねx1
codemender
https://deepmind.google/discover/blog/introducing-codemender-an-ai-agent-for-code-security/

DeepMindが開発したCodeMenderは、AIによってコードの脆弱性を自動的に発見・修正するエージェントです。従来の手法(例:ファジング)では困難だったゼロデイ脆弱性の特定と修正を行える

実例と成果
・libwebpへの-fbounds-safetyアノテーション適用:過去にゼロクリック攻撃に使われた脆弱性(CVE-2023-4863)を含むバッファオーバーフローを根本的に封じ込め。
・72件のセキュリティ修正をOSSにアップストリーム済み:最大450万行のコードを含むプロジェクトにも対応。
・修正例の動画付き解説:XMLスタック管理の不備や、Cコード生成システムの複雑なオブジェクトライフタイム問題などをAIが特定・修正。
71無題Name名無し 25/10/09(木)20:32:57No.142577そうだねx2
ローカルLLM のリリース年表
https://note.com/npaka/n/n1d99253ae2cf

2025年9月末分まで
72無題Name名無し 25/10/10(金)05:05:20No.142633そうだねx1
「AIアニメ」制作のKaKa Creation、4億5000万円を調達 アミューズやMIXIなど9社から
https://www.itmedia.co.jp/aiplus/articles/2510/09/news109.html

調達した資金は、同社独自のAIアニメ制作基盤による人気版権のアニメ化のほか、縦読みマンガ「Webtoon」の作家や個人クリエイターとの共同開発に充てる。
73無題Name名無し 25/10/10(金)07:52:01No.142636そうだねx1
AIが生成したフィッシングメールを識別できた人は46%、1.8万人に調査
https://news.mynavi.jp/techplus/article/20251009-3524771/

この調査はYubicoの依頼を受けたTalker Researchが日本、米国、英国、オーストラリアを含む9カ国の成人1万8,000人を対象に実施したもの。

調査結果
*AI生成フィッシングメールを見抜けた人は46%。
*残り54%は「見抜けない」または「確信が持てない」と回答。
*世代間の差はなく、全年代で識別が困難。
*一方で「人間が書いた本物のメール」を正しく識別できたのは約30%にとどまり、誤検知率の高さも浮き彫りに。

従来の人間の直感や経験だけでは防御が難しくなっている、というレベルに
74無題Name名無し 25/10/10(金)17:56:37No.142678+
嫌な話だねえ
75無題Name名無し 25/10/10(金)23:51:51No.142739+
フェイクを見抜くにもAIが絶対に必要になってきたわけね
76無題Name名無し 25/10/11(土)16:28:45No.142829そうだねx1
Google Researchが開発した新しい音声検索技術「Speech-to-Retrieval(S2R)
https://arxiv.org/abs/2412.16500

S2Rは音声を直接検索意図にマッピングする技術で、テキストへの変換を省略。
「何を言ったか」ではなく「何を求めているか」に焦点を当てる。
音声と文書をそれぞれベクトル化し、意味的な近さで検索結果を導く。

音声の「理解」の再現めいててすごい
77無題Name名無し 25/10/11(土)17:23:50No.142832そうだねx1
Kwaipilotによる最新の大規模言語モデル KAT-Dev-72B-Exp
https://huggingface.co/Kwaipilot/KAT-Dev-72B-Exp

・KAT-Dev-72B-Exp は、72B(720億)パラメータを持つオープンソースの言語モデル。主に ソフトウェアエンジニアリングタスク に特化して設計されている。
・SWE-Bench Verified 評価では 74.6% の正確性 を達成(SWE-agent scaffold を使用)。
特にこのタスクスコアは500BクラスのQwen3-coderを超える好成績
78無題Name名無し 25/10/11(土)19:02:24No.142844そうだねx1
中国、レアアース技術の輸出規制発表
https://www.bloomberg.co.jp/news/articles/2025-10-09/T3UBBTGOYMTC00

生産設備等の輸出も規制ということで半導体関連の影響が懸念され、米大統領もSNSで長文お気持ち(対抗策がない)を発していた
AIバブルやいかに
79無題Name名無し 25/10/12(日)09:54:33No.142924そうだねx1
Nexa AIはSnapdragon搭載のスマホ(RAM 16GB↑)でGPT-OSS 20Bをローカルに動かせると発表した
https://x.com/nexa_ai/status/1975232300985291008

@Snapdragon Gen5での実際のパフォーマンス:
- 17トークン/秒のデコード速度
- 初回トークン生成時間3秒未満
80無題Name名無し 25/10/15(水)03:49:41No.143405そうだねx1
NVIDIAがNVFP4と呼ばれる4ビット精度で12Bパラメータの言語モデルを精度を損なうことなく大規模な事前トレーニングを成功させた

• NVFP4は、FP8と比較して2〜3倍速い計算スループットと50%少ないメモリ使用量を実現
• 精度、ほぼ同一。(MMLU-Pro:FP8 = 62.62%、NVFP4 = 62.58%)
• 安定性の問題?ランダムハダマール変換、確率的丸め、2Dスケーリングを使用して解決
• NVIDIA Blackwell GPUで完全にトレーニングされ、10Tトークンにわたる初の4ビット実行が安定

省エネ
81無題Name名無し 25/10/15(水)04:43:23No.143409そうだねx1
Python3.14へバージョンアップ
https://test.python.org/downloads/release/python-3140/

GILの無効化を含む様々な変更で並列処理の強化がみこまれるが、pytorchなどのパッケージが対応するのは少し先になる見込み
82無題Name名無し 25/10/15(水)05:01:12No.143410そうだねx1
StreamingVLM
https://huggingface.co/papers/2510.09608

StreamingVLMは、無限に続く動画ストリームをリアルタイムで安定して理解するためのビジョン言語モデル(VLM)です。

評価と成果:
・新ベンチマーク「Inf-Streams-Eval」(平均2時間以上の動画)を構築。
・GPT-4O miniに対しての独自ベンチで66.18%の勝率を達成。
・単一のNVIDIA H100上で最大8FPSのリアルタイム性能を維持。
83無題Name名無し 25/10/15(水)08:12:34No.143417そうだねx2
ComfyUIはnVidia製の小型AIスパコン「DGX Spark」上で動作する(公式サポート)と発表
https://blog.comfy.org/p/comfyui-on-nvidia-dgx-spark

DGX Sparkは、サイズ5.91×5.91インチ、厚さ1.99インチ(約150×150×50mm)「折り紙1枚ほどの大きさで、ハードカバー本ほどの厚み」の筐体に 1ペタフロップという圧倒的な処理性能を実現し、128GBのユニファイドメモリを搭載する。価格4000ドル。
84無題Name名無し 25/10/15(水)11:20:15No.143432+
>No.143417
それでもマックよりは安いんだな・・
欲しい。
85無題Name名無し 25/10/15(水)12:20:52No.143440そうだねx1
LPDDR5xメモリの帯域(最大273GB/s)のボトルネックをどう考えるか?最適化しだいか?という議論を海外でやってるけど用途次第では安いかも

自分も買えるなら欲しい
86無題Name名無し 25/10/15(水)17:17:54No.143459そうだねx1
琥珀青葉 氏がHF互換ホスティングサービスのKohakuHubを構築を発表
https://x.com/KBlueleaf/status/1978120124067451088

Hugging Faceのあやしげな規約変更をうけて、stableDiffusionの追加学習LyCORISの作者としても有名な方が立ち上げ

HF APIとの互換性 — 既存のスクリプトがそのまま動作
🗄️ 独自のストレージ対応(R2、S3、MinIOなど)
🧩 使い慣れたフロントエンドUIのUX
🔐 モデル、データセット、アクセスポリシーの完全な制御
87無題Name名無し 25/10/16(木)01:19:04No.143571そうだねx1
Veo3.1
https://blog.google/technology/ai/veo-updates-flow/
開始・終了画像指定やExtendによる延長要素のinsertやオブジェクトの削除が行える
88無題Name名無し 25/10/16(木)05:57:27No.143587そうだねx1
Claude Haiku 4.5
https://www.anthropic.com/news/claude-haiku-4-5
Claude Sonnet 4と同等のSWE-benchで3分の1のコスト2倍以上の速度を実現
89無題Name名無し 25/10/16(木)07:36:21No.143590そうだねx1
PyTorch 2.9 Release
https://pytorch.org/blog/pytorch-2-9/

NVIDIA CUDA 13に対応しており、WindowsでもGPUアクセラレーションが可能です。
ROCm(AMD)やXPU(Intel)はLinuxのみ対応です。
90無題Name名無し 25/10/16(木)07:48:21No.143591そうだねx1
RAEs( Representation AutoEncoders)
https://rae-dit.github.io/

次世代のVAE

従来型のVAEには以下のような限界がある:
*古い構造で情報量が少ない
*潜在空間が低次元で表現力が弱い
*再構成品質が低く、生成画像の質に影響

事前学習済みの表現エンコーダ(例:DINOv2, MAE, SigLIP)と軽量なデコーダを組み合わせたRAE
*潜在空間が高次元かつ意味的に豊か
*Transformerベースの拡張性が高い
*計算コストがとても安い
91無題Name名無し 25/10/16(木)19:56:06No.143663そうだねx1
Google Researchが開発した機械学習アクセラレータ「Coral NPU」がオープンソース化
https://github.com/google-coral/coralnpu

ライセンス:Apache 2.0
超低消費電力のウェアラブルデバイス(ARグラス、スマートウォッチ、ヒアラブルなど)向けのML推論用ハードウェアIP
92無題Name名無し 25/10/16(木)21:32:10No.143671+
スレッドを立てた人によって削除されました
ついに!逮捕者でたぞ!!
な?分かってるよな!?

- GazouBBS + futaba-