AI関連のニュースス - 人工知能＠ふたば

画像ファイル名：1747456403550.png-(35946 B)

無題Name名無し25/05/17(土)13:33:23No.120078そうだねx9 18日20:12頃消えます

AI関連のニューススレ
立ってないようなので

このスレは古いので、もうすぐ消えます。
削除された記事が14件あります.見る

…	1無題Name名無し 25/05/17(土)13:36:37No.120081そうだねx1 Google DeepMindからAlphaEvolveが発表 https://deepmind.google/discover/blog/alphaevolve-a-gemini-powered-coding-agent-for-designing-advanced-algorithms/ アルゴリズムや数学的課題をAI自身がみつけ最適化していく

…	2無題Name名無し 25/05/17(土)13:39:26No.120086そうだねx1 WindsurfからSWE-1モデルファミリがリリース https://windsurf.com/blog/windsurf-wave-9-swe-1 通常モデルとlite、miniモデルがありソフトウェアエンジニアリングプロセス全体に最適化されているモデル性能的には通常のでClaude 3.5 Sonnetぐらい？

…	3無題Name名無し 25/05/17(土)13:43:39No.120090そうだねx1 OpenAIからCodexが発表 https://openai.com/index/introducing-codex/ クラウドベースのソフトウェアエンジニアリングエージェントでPro、Team、Enterpriseプランで利用可能モデルはo3を微調整したcodex-1を使用している o4-miniを微調整したcodex-miniはCodex CLIやAPIで利用可能

…

4無題Name名無し 25/05/17(土)18:45:02No.120157そうだねx1
1747475102727.jpg-(186184 B)

シングルターンとマルチターンによる6つの生成タスク (コード、数学、SQL、API 呼び出し、データからテキストへの変換、ドキュメントの要約) にわたって、15 のトップ LLM (GPT-4.1、Gemini 2.5 Pro、Claude 3.7 Sonnet、Deepseek-R1 など) による大規模なシミュレーションを実施しました。
https://x.com/omarsar0/status/1922755721428598988

例えば、シングルターン設定で90%を超える精度を誇るモデルはマルチターン設定では約60%まで低下すること散見された。

…

5無題Name名無し 25/05/17(土)18:50:07No.120160+

>No.120157
結論：
ユーザーにとっては、複数回にわたって明確にするよりも、すべての要件を 1 つのプロンプトに統合する方が適切です。

会話が脱線した場合は、統合された要約から新しいセッションを開始すると、より良い結果が得られます。

システム構築者とモデル開発者は、単なる性能だけでなく、複数ターンのコンテキストにおける信頼性を優先することが求められます。これは、これらの問題の影響がより顕著になる複雑なエージェントシステムを構築する場合に特に当てはまります。

LLMは本当に奇妙です。そして、こうした奇妙な現象は最新モデルにも現れていますが、より微妙な形で現れています。

…	6無題Name名無し 25/05/19(月)19:24:14No.120419そうだねx1 会話中、相手の“ウソ”をこっそり教えてくれるスマートウォッチ　AIが瞬時にファクトチェック情報の真偽を振動パターンで応答するところがユニーク https://www.itmedia.co.jp/aiplus/articles/2505/19/news068.html

…	7無題Name名無し 25/05/19(月)21:05:01No.120441+ スレッドを立てた人によって削除されました最近は静止画から脱ぐ動画作れるんやな https://x.gd/Hpxda ・・ iug

…	8無題Name名無し 25/05/20(火)09:49:38No.120493そうだねx2 #NVIDIA、RTX GPUでのAI推論より簡単に高速化できる「TensorRT for RTX」 https://pc.watch.impress.co.jp/docs/news/2015039.html ・NVIDIAは19日、COMPUTEX TAIPEI 2025にあわせ、AI推論の高速化ライブラリ「TensorRT for RTX」を発表した。すべてのRTXシリーズGPUで利用できるとしており、6月に提供を開始する予定。何かｷﾀｰ？！

…	9無題Name名無し 25/05/20(火)11:17:36No.120499そうだねx1 Microsoft Build 2025 https://www.itmedia.co.jp/news/articles/2505/20/news097.html Windows11でMCP対応 WSLオープンソース化ウェブコンテンツと容易に対話できるようにする「NLWeb」 Microsoft 365 Copilot Tuningで組織ごとにAIをTuning可能に

…

10無題Name名無し 25/05/21(水)07:28:12No.120600そうだねx1

Google I/O 2025
https://blog.google/technology/developers/google-io-2025-collection/
AIコーディングエージェントのJules
Google AI Ultraという新しいサブスクリプションプラン（249.99ドル）でGemini think2.5pro・Veo3にアクセス可能
Veo3では音声付のビデオ生成も可能に
Imgegen4も発表
Gemini 2.5 FlashとProでネイティブオーティオ出力のプレビュー版をリリース
モバイル向けのGemma 3nを公開
Gemini Diffusionという拡散モデルも発表

…

11Xで話題騒然「Gemini Diffusion」Name名無し 25/05/22(木)02:31:22No.120703+
1747848682471.mp4-(272505 B)

>Googleは、画像生成AIなどで使われている「拡散モデル」の技術を使って作成されたAIモデル「Gemini Diffusion」を発表しました。

>テキストやコードの生成を高速処理できるのが特徴で、利用するには順番待ちリストに登録する必要があります。

https://x.com/search?q=%E6%8B%A1%E6%95%A3%E3%83%A2%E3%83%87%E3%83%AB&src=trend_click&vertical=trends

…	12無題Name名無し 25/05/22(木)08:33:49No.120728そうだねx2 OpenAIとデザイン企業ioの合併 https://www.itmedia.co.jp/news/articles/2505/22/news096.html

…	13無題Name名無し 25/05/22(木)11:26:08No.120734そうだねx2 MistralからDevstralがリリース https://mistral.ai/news/devstral コーディングエージェント向けのApatch2.0ライセンスのオープンソースモデルでサイズは23.6B SWE-Bench VerifiedではClaude 3.5 haikuを超える

…	14無題Name名無し 25/05/22(木)19:22:36No.120773そうだねx1 PLaMoからPLaMo 2.0 Primeがリリース https://x.com/PLaMoLLM/status/1925410565075472652 32kのコンテキスト長でGPT4oに次ぐ日本語ベンチマーク性能価格は100万トークンあたり入力/出力で60円/250円ブラウザ上で無料利用も可能

…	15無題Name名無し 25/05/23(金)05:26:17No.120822そうだねx2 Claude4がリリース https://www.anthropic.com/news/claude-4 OpusとSonnetがリリースされ価格帯やコンテキスト長は前と変わらず Opusはコーティングエージェントとして7時間動かせたらしい o3と同様に思考中にツール利用も行えるとのこと

…	16無題Name名無し 25/05/25(日)22:40:57No.121233そうだねx3 >Veo3では音声付のビデオ生成も可能に https://x.com/d_1d2d/status/1926021096760807877 使い手の倫理観とか良識がますます試されるレベルになってきたな…

…	17無題Name名無し 25/05/26(月)16:09:34No.121300+ 書き込みをした人によって削除されました

…	18無題Name名無し 25/05/29(木)23:48:18No.121651そうだねx1 DeepSeek-R1-0528がリリース https://x.com/deepseek_ai/status/1928061589107900779

…	19無題Name名無し 25/06/01(日)18:36:16No.122174そうだねx2 https://x.com/jiwasawa/status/1928268298866594292 Qwen2.5-Math特有の副作用解答が正解だろうが不正解だろうがランダムに報酬を与えても数学の性能が上がったという研究

…

20無題Name名無し 25/06/04(水)13:47:33No.122654そうだねx3

Builder.ai破綻の真相：700人のインドエンジニアが「AI」を偽装、Microsoft出資の4億4500万ドル調達企業が破産
https://innovatopia.jp/ai/ai-news/56173/

スゲぇぜインド人パワー

Builder.aiが謳っていた「AI搭載」のノーコード開発プラットフォームは、実際には大規模な人力による開発体制でした。同社は「Natasha」というAIアシスタントがレゴブロックのようにアプリを自動構築すると宣伝していましたが、実際にはインドとウクライナの数百人のエンジニアが手動でコードを書いていました。

この事実は2019年にWall Street Journalによって既に報道されていましたが、その後も同社は「AI企業」としてのブランディングを続け、投資家からの資金調達を継続していました。

…	21無題Name名無し 25/06/07(土)16:27:05No.123080そうだねx1 現在　seaartでプロンプト欄にnipple vagina などのセンシティブなワードがキーワード検閲されている模様

…	22無題Name名無し 25/06/07(土)19:57:56No.123116そうだねx1 >No.123080 現在　検閲解除された模様

…	23無題Name名無し 25/06/08(日)15:23:42No.123259そうだねx2 Dual-Process Image Generation：生成AIの最大の欠点「出してみないと分からない問題」がついに解消へ https://x.com/taziku_co/status/1931141047637450936 この方法の特徴は、既存の画像生成モデルとVLMを組み合わせることで、特別な再学習なしに新しい制御タスクを実装できる点です。例えば、色のパレット、線の太さ、地平線の位置、相対的な奥行きなどの視覚的な要素を、テキストや画像を用いたインターフェースで調整できます。

…	24無題Name名無し 25/06/08(日)15:52:37No.123261そうだねx1 FreeTimeGS： https://x.com/bilawalsidhu/status/1931356216694882319 https://zju3dv.github.io/freetimegs/ マルチビュー 3D キャプチャを再現・再生するときに、ビデオ拡散モデルをつかって計算時間を短縮する例

…	25無題Name名無し 25/06/08(日)16:27:58No.123264そうだねx2 1749367678541.jpg-(157962 B) Appleの研究により、推論モデル(LRM)は問題が一定以上に複雑になると、思考放棄して一気に精度が落ちることが判明した。 https://x.com/K_Ishi_AI/status/1931542962015699283

…	26無題Name名無し 25/06/09(月)17:29:46No.123474そうだねx1 >FreeTimeGS：関連して4Dvが4D Gaussian Splattingを発表しているこちらは動画から空間再生を実現している

…

27無題Name名無し 25/06/09(月)20:00:35No.123490そうだねx1
1749466835486.jpg-(249105 B)

>Appleの研究により、推論モデル(LRM)は問題が一定以上に複雑になると、思考放棄して一気に精度が落ちることが判明した。
元の論文https://ml-site.cdn-apple.com/papers/the-illusion-of-thinking.pdf読んでるだが図の誤りを指摘しておく
ハノイの塔の塔の数を増やすテストではなくディスクの数を増やしている（添付画像参照）
塔の数を増やすよりディスクを増やす方が問題の一般化が楽なのにそれでも解けないのは意外で面白い

…	28無題Name名無し 25/06/11(水)00:01:29No.123750そうだねx1 Mistralから初の推論モデルMagistral https://mistral.ai/news/magistral SmallはオープンウェイトMediumはエンタープライズとなっている性能はMediumでR1よりそこそこ劣っている模様

…	29無題Name名無し 25/06/11(水)06:28:01No.123776+ OpenAIからo3-proがリリース https://x.com/OpenAI/status/1932530409684005048 APIの価格としてはo1-proよりはるかに安いちなみにo3は80%の値下げで4oよりAPI価格が安くなっている

…	30無題Name名無し 25/06/11(水)10:06:41No.123799+ スレッドを立てた人によって削除されました https://www.youtube.com/watch?v=ftAc5H8a4Rg

…	31無題Name名無し 25/06/11(水)16:35:42No.123826+ 「生成AIで作成」女の子の裸の画像を共有疑い　50代の男を逮捕　愛知県警で初、わいせつ電磁的記録媒体陳列容疑で検挙 - YAHOO! ニュース https://news.yahoo.co.jp/articles/b4b733825ba36c861cd37e74729992657262e8c3

…

32無題Name名無し 25/06/12(木)14:57:58No.123966そうだねx1

Text-to-LoRA(T2L)：
https://x.com/SakanaAILabs/status/1932972420522230214
https://arxiv.org/pdf/2506.06105

Sakana AIが発表したT2LはこれまでのLora作成のようなデータ収集なしで、自然言語による適切な指示を与えることでLLMをタスクに適応させることができることを示した。

・多数のLoRAアダプターを圧縮できる
・ゼロショット適応が可能
・LoRAアダプターを損失ありで圧縮しても、モデルの性能低下がほとんど見られなかった。

私見：○○を（もっと）■■にして欲しい型のプロンプトと相性が良いと思われる

…	33無題Name名無し 25/06/12(木)16:11:43No.123971+ 米ディズニーなど “生成AI 作成画像が著作権を侵害”と提訴 - NHK https://www3.nhk.or.jp/news/html/20250612/k10014833121000.html

…

34無題Name名無し 25/06/12(木)19:10:23No.123986+

Seaweed APT2
https://seaweed-apt.com/2
https://huggingface.co/papers/2506.09350

この研究では、「Autoregressive Adversarial Post-Training (AAPT)」という手法を用いることで、事前学習済みの潜在動画拡散モデルをリアルタイム対応のインタラクティブな動画生成器へと変換することを試みています。

リアルタイム動画生成性能
・モデルサイズは8B（80億パラメータ）。
・単一のH100 GPUで24fps、解像度736×416の動画をリアルタイム生成可能。
・8×H100で1280×720の動画を最大1分間（1440フレーム）生成。

…	35無題Name名無し 25/06/13(金)00:19:02No.124048そうだねx1 ”AI彼女”Z世代ユーザーの80%が「合法ならAIと結婚したい」と回答 - ナゾロジー https://nazology.kusuguru.co.jp/archives/179390 2025年4月、Joi AIはZ世代2000人を対象に調査を行い、そのうち80%が「合法ならAIと結婚したい」と回答したことが明らかになりました。

…	36無題Name名無し 25/06/13(金)18:14:31No.124175+ Apple Vision Proの次期OSであるvisionOS 26に”Spatial Scene”を搭載予定 2D画像をAI解析して6DoF対応の"3Dシーン"に変換する https://x.com/Heaney555/status/1933201882199294374 ガウススプラッティングという手法によるものだと思われます

…	37無題Name名無し 25/06/13(金)18:27:53No.124177+ 視覚言語モデル（Vision Language Models）についてのオライリー書籍の１０日間フリートライアルが実施（英語） https://www.oreilly.com/library/view/vision-language-models/9798341624030/ VLMの初歩についてはIBMのサイトもくわしいと思う https://www.ibm.com/jp-ja/think/topics/vision-language-models

…

38無題Name名無し 25/06/13(金)19:19:53No.124184+

評価認識：
最先端の言語モデルが評価時（訓練中のテスト）と実際の使用時とを区別できるかということ

https://www.arxiv.org/abs/2505.23836
この論文によるとできている可能性が高いとされている。
すなわち報酬設計に対応して報酬ハッキングを行うことができるということ

*報酬ハッキングとは、AI が正規の問題解決ではなく、タスクの採点基準やコードの脆弱性を悪用して高得点を得ることを指す。
https://metr.org/blog/2025-06-05-recent-reward-hacking/

これはバグというより、強化学習を通じて報酬を最大化するようにモデルは訓練されているのでそのプロセスの延長線上のできごとであると思われる

…	39無題Name名無し 25/06/14(土)21:05:16No.124435そうだねx1 特許庁、AI生成物「商標」容認　現行制度で出願・登録 - 日刊工業新聞 https://www.nikkan.co.jp/articles/view/00751708 AIが作成した文字やマーク、商標登録認める　特許庁小委 - 日本経済新聞 https://www.nikkei.com/article/DGXZQOUA103AK0Q5A610C2000000/

…

40無題Name名無し 25/06/15(日)23:41:57No.124653+
1749998517007.jpg-(731942 B)

LayerPeeler：
様々なスタイルの画像を各レイヤーを識別しながら除去し、完全なパスを持つベクターグラフィック高品質なベクターグラフィックへ変換する

主なポイント:

オクルージョンの解決: LayerPeelerは、画像の上層から順に要素を除去し、隠れている部分を復元することで、完全な形状のベクトル化を実現。

ビジョン・言語モデルの活用: 画像の各レイヤー関係を解析し、説明的なキャプションを生成。それを編集指示として使用し、微調整された拡散モデルがレイヤーを除去。

局所的な注意制御: ターゲット領域を正確に削除しつつ、周囲のコンテンツを維持するために注意機構を導入。

大規模データセット: LayerPeelerの性能向上のため、特化したデータセットを提供。

ベクター化の品質: 既存の技術よりも、形状の一貫性、幾何学的な正確性、視覚的な精度に優れた結果を生成。

…	41無題Name名無し 25/06/16(月)00:47:50No.124660+ Microsoftの「Copilot 3D」 https://www.testingcatalog.com/microsoft-develops-copilot-3d-to-turn-images-into-3d-objects/ 将来的な音声インタラクションの可能性「Portrait」ラベルの開発では、スタイライズされたキャラクターとの音声インタラクションが試みられていたため、Copilot 3Dがアバターとの対話機能と組み合わされる可能性もあります。

…	42無題Name名無し 25/06/16(月)01:39:40No.124667そうだねx1 1750005580335.gif-(30535 B) Breathing Life Into Sketches Using Text-to-Video Priors： https://livesketch.github.io/ 概要人が描いたスケッチにテキストの指示を与えることで、動きを追加する技術を提案。既存のテキストから動画を生成するモデルのモーションプリオールを活用し、スケッチに動きを付与。出力は編集可能なベクター形式の短いアニメーション。

…	43無題Name名無し 25/06/16(月)01:49:57No.124669そうだねx1 1750006197021.png-(863517 B) 主要LLMの比較ランキングサイト： Artificial Analysis https://artificialanalysis.ai/ 性能対価格など

…	44無題Name名無し 25/06/16(月)11:34:42No.124699+ 1750041282157.jpg-(1017236 B) RoboBrain 2.0 https://github.com/FlagOpen/RoboBrain2.0 BAAI RoboBrain TeamによるこのAIはヒューマノイドや汎用ロボット向けの「身体性を持つAI」として設計されており、空間認識、マルチエージェントタスク計画、クローズドループ実行の能力が向上しています。 7Bと32Bのモデルで公開

…

45無題Name名無し 25/06/16(月)11:46:46No.124701そうだねx1
1750042006104.png-(668724 B)

Anthropicのマルチエージェント研究システムの構築プロセスと、その工学的課題について
https://www.anthropic.com/engineering/built-multi-agent-research-system

この研究によると、Claude Opus 4がリードエージェントとなり、Claude Sonnet 4がサブエージェントとして機能するシステムは、単独のClaude Opus 4を用いた研究よりも90.2%優れた結果を生み出したとのこと。例えば、S&P 500のIT企業の取締役を特定するタスクでは、マルチエージェントの方が素早く正確な結果を導き出した。

一方でトークン量は15倍に達し、エージェント間の調整、プロンプトの工夫が必要となる

…	46無題Name名無し 25/06/17(火)22:07:14No.124922そうだねx1 1750165634506.png-(172575 B) PartPacker https://research.nvidia.com/labs/dir/partpacker/ https://github.com/NVlabs/PartPacker nvidiaがリリースした画像から3Dを生成するモデル注目すべき点は全体を単一のメッシュで表現するのではなく編集可能な複数のパーツで生成できる点

…	47無題Name名無し 25/06/18(水)00:03:17No.124935そうだねx1 Bytedanceの動画生成 Seedance 1.0 生成例 https://x.com/AngryTomtweets/status/1934739283786805323

…	48無題Name名無し 25/06/18(水)02:10:58No.124956そうだねx2 AIで作品模倣？募る危機感　専門家「ルールの見直しも」【フェイクの波紋】 https://news.tv-asahi.co.jp/news_economy/articles/000432773.html 樋口紀信 - ツイッター(X) https://x.com/susujinkou/status/1934561098742817075

…	49無題Name名無し 25/06/18(水)03:24:38No.124963そうだねx1 AIで10億人規模の人口をシミュレーションできるシステムを開発したとの報告。一人ひとり異なる性格や背景を持つAIエージェントが10億人それぞれ実際の人間のように考えて行動します。 https://x.com/ai_database/status/1934874343915573264 https://arxiv.org/abs/2506.12078

…	50無題Name名無し 25/06/18(水)13:34:40No.124995そうだねx1 Cloud Native Technology Map https://www.cyberagent.co.jp/techinfo/info/detail/id=32029 CyberAgentがクラウドネイティブ領域のテクノロジー事例集（52p 日本語）を配布中

…	51無題Name名無し 25/06/18(水)14:42:47No.124999そうだねx1 ついにHugging Face Spaces が MCP に対応 https://x.com/victormustar/status/1935031748347236807 https://huggingface.co/spaces?filter=mcp-server

…	52無題Name名無し 25/06/18(水)15:56:12No.125003そうだねx1 中国のトップストリーマーが、ERNIE 財団モデルを活用した 2つの AIアバターを使った 6時間のストリーム配信を主催しました。 Luo Yonghao は、Baiduの電子商取引プラットフォームで歴史を作りました。結果は？ 1,300 万回の視聴と 760 万ドルの売上。 https://x.com/hasantoxr/status/1935198754933792837 数のゴリ押しに見えるけど商業的な結果でちゃったから流れ来るかもね…

…	53無題Name名無し 25/06/18(水)16:42:14No.125005そうだねx2 偽動画を見抜く最新技術　AIで分析“真偽”を判定【フェイクの波紋】- Yahooニュース https://news.yahoo.co.jp/articles/909ade19caef4fb8163698100ca1fdcf4d893c2c

…

54無題Name名無し 25/06/18(水)17:02:44No.125006そうだねx2

How not to lose your job to AI
https://80000hours.org/agi/guide/skills-ai-makes-valuable/
https://x.com/robertwiblin/status/1934964915967570391　(解説)

Ben ToddによるAI/AGIを踏まえたキャリアプランの立て方について素晴らしい記事（英語）非常にありそうなシナリオは、適切な仕事に対する給与が 10 年ほどで 10 倍になり、その後 0 に落ちるというものです。つまり、私たちは短い黄金時代とそれに続く激しい激動の時代に向かっているのかもしれない。

### 価値が上昇する４つのスキル領域
1. AIが容易に実行できないスキル: 物理的な作業や長期間にわたる計画・判断が求められるスキル。
2. AIの展開に必要なスキル: AIシステムの設計や調整、管理に関するスキル。
3. 需要が大幅に増えるスキル: 医療や住宅建設、研究分野など、人々がより多く必要とする分野。
4. 習得が困難なスキル: 他者が簡単に学べない専門知識や独自性のあるスキル。

### 未来に向けて価値が上昇する具体的なスキル
AIシステムの運用・導入、個人の生産性向上、リーダーシップ能力、コミュニケーション能力と審美眼、政策遂行能力、複雑な物理的作業

…

55無題Name名無し 25/06/18(水)17:22:47No.125008そうだねx1

動画生成Hailuoを提供しているMiniMaxから２つ

最新のLLMである MiniMax-M1をオープンソース化：
- 世界最長のコンテキストウィンドウ：100万トークン入力、8万トークン出力
https://x.com/MiniMax__AI/status/1934637031193514237

SiliconCloudが上記LLMのホスティングを開始：
- 10万トークン生成するときのFLOPコスト比でDeepSeek-R1の25%を達成
https://x.com/SiliconFlowAI/status/1934859096424849903

Hailuo2リリース：
- クラス最高のプロンプト追従性
- アクロバットを再現する極端な物理を検証可能に扱える
- ネイティブ1080p出力
https://x.com/MiniMax__AI/status/1935026724468871550

…	56無題Name名無し 25/06/18(水)18:52:06No.125013そうだねx2 お絵描き補助AIアプリ『AI-AssistantV3』 https://note.com/tori29umai/n/n63de58623725 「AI-Assistant」は、デジタルお絵描きの作画補助に特化したAIアプリです。カラーイラストから線画を抽出したり、線画を疑似3D画像にしてライティングしたりすることができます。

…	57無題Name名無し 25/06/19(木)03:02:56No.125080そうだねx1 LLMの内部に人間の脳が感情を処理するのとよく似た仕組みがあることを発見 https://x.com/ai_database/status/1935329395637731667 https://arxiv.org/abs/2506.13978 心理学で知られているような感情スイッチのように動作し、LLMは26種類の細かい感情（喜び、悲しみ、恐怖、驚き、憧れ、退屈など）をそれぞれ別々に理解して、言語や文化が違っても基本構造は変わりませんでした。

…	58無題Name名無し 25/06/19(木)03:42:32No.125081そうだねx2 LLMを用いたアプリケーションUIの作成 DeepSiteV2 https://x.com/victormustar/status/1935374796977766545 https://huggingface.co/spaces/victor/deepsite-gallery かなりのところまで出来る

…	59無題Name名無し 25/06/19(木)15:44:44No.125136そうだねx2 VisionCutter: https://github.com/lovisdotio/VisionCutter https://x.com/OdinLovis/status/1935356548894666955 LLMを使い編集者に人格を持たせることで編集の作家スタイルとでも呼ぶべきものを搭載した動画生成システム Comify+flux上で動き、BPMの同調などを自動で行う

…	60無題Name名無し 25/06/19(木)16:55:35No.125148そうだねx3 【続報】ディズニーやマーベルなど6社がMidjourneyを著作権侵害で提訴。生成AIは「盗作の底なし沼」 - Yahoo!ニュース https://news.yahoo.co.jp/articles/a133067812e0d2decb958ba0cdd824474146b539 ディズニー・エンタープライゼス、マーベル、ルーカスフィルム、20世紀スタジオ、ユニバーサル・シティ・スタジオ・プロダクションズ、ドリームワークス・アニメーションが連名で提出

…	61無題Name名無し 25/06/20(金)01:15:21No.125204そうだねx3 まあ…そうなるよねって話だけどどうなるんだろうね今後

…	62無題Name名無し 25/06/20(金)09:32:18No.125239+ >No.123264 https://x.com/rohanpaul_ai/status/1935746720144544157 これの反論に対する意見ともいうべき３つ目の論文

…

63無題Name名無し 25/06/20(金)12:06:55No.125263そうだねx2

AI学習用の動画データセット Sekai：
https://lixsp11.github.io/sekai-project/

Sekaiデータセットには、100か国以上、750都市にわたって収集されており、総収録時間は5,000時間超の映像、YouTubeの実写映像に加えて、写実的なゲーム内の映像も含まれています。特にゲーム映像の注釈は「グラウンドトゥルース（真実の情報）」と見なされ、モデル訓練において非常に重要な参照になります。

Sekaiの注釈は、人間だけでなく、大規模言語モデル（GPT-4oやQwen2.5-VLなど）と構造化視覚モデル（MegaSaM）との協働により行われています。まさにAIがAIを育てる構図です。

私見：プロダクト名に日本語っぽい単語使うトレンド早く廃れろ

…	64無題Name名無し 25/06/20(金)12:14:36No.125264そうだねx1 >- アクロバットを再現する極端な物理を検証可能に扱える例：Hailuo2 vs Veo3 https://x.com/deedydas/status/1935892311353049520

…

65無題Name名無し 25/06/20(金)12:31:08No.125266そうだねx1

Kyutai STT:
遅延ストリーム・モデリング（Delayed Streams Modeling） speech-to-text model
https://kyutai.org/next/stt
https://x.com/kyutai_labs/status/1935652243119788111

- 2.6Bサイズの英語オンリーモデルと英・仏対応のモデル
- 音声とテキストを同時に横並びで扱う
- H100など高性能なGPU上で400ストリームをリアルタイム処理可能
- 息継ぎなのか話終わりなのかを文脈で判断

競合技術：
Deepgram、Google Cloud Speech-to-Text、Amazon Transcribe、Microsoft Azure Speech Services、AssemblyAI

…

66無題Name名無し 25/06/20(金)12:57:30No.125268そうだねx1

MatAnyone：
AIベースのインタラクティブ・マッティング
https://pq-yang.github.io/projects/MatAnyone/
https://huggingface.co/spaces/PeiqingYang/MatAnyone

「一貫したメモリ伝播（Consistent Memory Propagation）」という独自機構を用いて、時間的に安定したマッティング結果を実現しています。これは前のフレームの情報を次のフレームに適応的に融合することで、人物の境界や質感の再現を向上させる仕組み
特定の人物の身を追跡可能。

操作自体はほぼワンクリックで実現してる

…

67無題Name名無し 25/06/20(金)14:45:22No.125279そうだねx4

AI Fight Club:
https://www.lockheedmartin.com/en-us/capabilities/artificial-intelligence-machine-learning/ai-fight-club.html

ロッキード社によるAI軍事競技コンペ

初開催予定：2025年第4四半期の

対象領域：空・陸・海・宇宙すべての作戦領域をカバーしたシミュレーション。

評価基準：米国国防総省（DoD）の厳格な要件に基づく性能評価。

優勝チームには称号と研究発表の機会が与えられる

いくらきれいごと言ったって軍事投入にやる気マンマンなのよね

…

68無題Name名無し 25/06/20(金)15:32:17No.125282そうだねx2

SPARC3D：
https://lizhihao6.github.io/Sparc3D/
https://www.youtube.com/watch?v=XRFlnXeOdww

画像から３Dを生成するやつ
Sparse Voxel と Diffusion-based Generation を組み合わせている。これは人間の記憶が断片情報から全体像を再構築する過程に少し似ている。

Sparcubes：サーフェスを疎なボクセル空間（1024³解像度）に表現し、符号付き距離場と変形場を散布することで滑らかでトポロジーの任意なメッシュを再構成。勾配に基づく最適化が可能。

Sparconv-VAE：すべて疎畳み込みで構成されたモダリティ整合性のあるVAE。Point Transformer V3 に着想を得た軽量な局所アテンションモジュールを搭載。

従来よりエッジの保たれた生成が可能

…	69無題Name名無し 25/06/20(金)23:48:25No.125342そうだねx3 >No.125148 ルールは現状の環境や技術に合わせるべきで、その逆をしようとした文化が永らえた例はない。著作権という概念自体を改変しなければ権利そのものが陳腐化しそう。

…	70無題Name名無し 25/06/21(土)08:32:42No.125396+ せやね >ルールは現状の環境や技術に合わせるべきで、その逆をしようとした文化が永らえた例はない。 >著作権という概念自体を改変しなければ権利そのものが陳腐化しそう。コピーの質も量も対象も運用も極限まで高く大きく広くなった時代、どこまでコピー運用を禁止できるのか

…	71無題Name名無し 25/06/21(土)10:51:55No.125410そうだねx3 今週は主要企業のリリースだけでもかなり大量だったね… - Midjourney V1 Video - ChatGPT Record Mode - Higgsfield new AI Canvas - Claude Code MCP Servers - Google Search Live AI Mode - MIT Study ChatGPT’s Impact - MiniMax M1 model & AI Agent - Tencent open-source 3D model

…	72無題Name名無し 25/06/22(日)10:45:50No.125577そうだねx1 マイナーアップデートだから話題にされないMistral Small 3.2…

…	73無題Name名無し 25/06/22(日)14:16:57No.125596+ マルチモーダルなOCRを試せる https://huggingface.co/spaces/prithivMLmods/Multimodal-OCR2

…	74無題Name名無し 25/06/22(日)14:44:56No.125598そうだねx1 最近少し話題になったAIを使うとバカになるという論調の記事や動画の元となったMITの論文の解説（英語） https://x.com/MushtaqBilalPhD/status/1936364823576556022

…	75無題Name名無し 25/06/22(日)20:00:17No.125630そうだねx2 「性的ディープフェイク」相談や通報相次ぐ警察庁対策検討へ - NHK https://www3.nhk.or.jp/news/html/20250622/k10014840991000.html このうち、生成AIを悪用して作成されたものだと確認できた事案は少なくとも17件あり、15件は同級生などの知人によって作成されたものだったということです。

…	76無題Name名無し 25/06/23(月)02:33:19No.125682そうだねx1 もうちょいAIに関する役立つニュースだけ貼ってほしいんだが…

…	77無題Name名無し 25/06/23(月)08:55:00No.125720+ 書き込みをした人によって削除されました

…	78無題Name名無し 25/06/23(月)09:08:51No.125721そうだねx6 AIリテラシーあれば読む必要ないニュース（AIリテラシーが低い人々に関するニュース）は貼る必要ないね

…

79無題Name名無し 25/06/23(月)17:53:03No.125744そうだねx1

RLT（Reinforcement-Learned Teacher）：
https://x.com/SakanaAILabs/status/1936965841188425776

RLT（Reinforcement-Learned Teacher）のプロセスは、教師モデルが「自分で問題を解く」のではなく、「生徒が理解しやすい説明を生成する」ことに特化して学習する新しいパラダイムです。
質問と正解を与えられた上で、生徒が理解しやすい説明を出すことに報酬が与えられる設計です。これにより、小型モデルでも教師として効果を発揮できるようになります。

わずか7BパラメータのRLTが、DeepSeek R1（671B）などの巨大モデルよりも生徒の成績を向上させる結果に。
特に数学・科学系ベンチマーク（AIME、MATH、GPQA）で顕著な効果がありました。

…	80無題Name名無し 25/06/23(月)19:14:49No.125751そうだねx1 https://github.com/HeyNina101/ai-agent-starter-kit このGitHubリポジトリ「ai-agent-starter-kit」は、実用的なAIエージェント構築のための専門的なガイド集を集めたスターターキットをpdfで配布 > “100個のリソースは要らない。必要なのは本物だ。”——というコンセプトで構成されています。

…	81無題Name名無し 25/06/26(木)00:42:30No.126056そうだねx2 Claude CLIみたいなGemini CLIがリリースhttps://x.com/googleaidevs/status/1937861646082515205 2.5proが1分あたり60件1日当たり1000件まで無料で利用可能

…	82無題Name名無し 25/06/26(木)00:44:27No.126058そうだねx2 GoogleDeepMindからAlphaGenome https://deepmind.google/discover/blog/alphagenome-ai-for-better-understanding-the-genome/ DNAの変異の影響を予測できるモデル

…	83無題Name名無し 25/06/26(木)00:50:37No.126059そうだねx1 生成AIとRF（高周波）回路設計の融合 https://x.com/vikramskr/status/1937658826414784589 背景には、#IMS2025（国際マイクロ波シンポジウム）での発表内容があるようです。QRコードをメタマテリアルのように使うという技術的な発言も話題になっています。

…	84無題Name名無し 25/06/26(木)23:58:08No.126159そうだねx2 1750949888364.jpg-(140055 B) エロゲ生成ＡＩ『AventuEngine』Ver.2.5 https://x.com/senooyudai/status/1938093356363747615 https://senooyudai.fanbox.cc/posts/10117771

…	85無題Name名無し 25/06/27(金)07:00:54No.126210そうだねx1 エッジデバイス向けのGemma 3nがリリース https://x.com/GoogleDeepMind/status/1938278533517746686

…	86無題Name名無し 25/06/27(金)07:05:21No.126212そうだねx1 ChatGPTのDeepResearchのモデルがAPIに追加 https://x.com/OpenAIDevs/status/1938286704856863162 またo3とo4-miniでthinking中のWeb検索がAPIに追加 https://x.com/OpenAIDevs/status/1938296690563555636

…	87無題Name名無し 25/06/30(月)03:08:47No.126698そうだねx1 workflow-comfyui-single-image-to-lora-flux: https://github.com/lovisdotio/workflow-comfyui-single-image-to-lora-flux ComfyUI上でGemini APIとFLUX.1 Kontextを利用して1枚の画像からFLUX向けのLoRAモデルを作成するワークフロー入力画像からGeminiをとおしてFLUX用の２０枚分のプロンプトを作成しLoRA化する

…

88無題Name名無し 25/06/30(月)04:52:11No.126711そうだねx1

ユニバーサル・シミュレータU
https://arxiv.org/abs/2506.18739
https://www.youtube.com/watch?v=QkszoIbdGj0（解説）

従来の研究は、学習による近似に留まっていましたが、この研究はデータに依存しない厳密な再現が可能であること、トランスフォーマーがチューリング完全であることは知られていましたが、この研究はそれを超えて「任意の注意操作の厳密再現も可能」であることを証明した点が革新的です。つまり、計算的に“思考パターン”の正確な模倣が可能であることを示した

この論文は、学習（Learnability）と表現力（Expressivity）の中間領域を突き詰めた貴重な試みで、将来的にはより解釈可能なAIの設計や、タスク固有アーキテクチャの自動構成にもつながるかもしれません。

…	89無題Name名無し 25/06/30(月)04:55:28No.126713そうだねx1 ARグラスの現実の映像に広告ブロッカーを搭載 https://x.com/sutoroveli_news/status/1939250328786076138 広告の判別にGeminiを利用

…	90無題Name名無し 25/06/30(月)05:39:12No.126719そうだねx2 スレッド紹介 https://www.reddit.com/r/StableDiffusion/comments/1lnckh1/you_can_actually_use_multiple_images_input_on/ こちらのReddit投稿では、Kontext Devで画像を結合せずに複数枚の画像を入力する方法について書かれている

…	91無題Name名無し 25/06/30(月)08:57:29No.126757そうだねx1 1751241449001.jpg-(194591 B) FramePack-P1 https://lllyasviel.github.io/frame_pack_gitpage/p1/ 好評だったローカル動画生成FramePackの次期バージョンについての第一弾さらなる結果・モデル・論文は近日公開予定。長時間・複数動作の映像生成でドリフトを抑える新技術を投入予定とのこと

…	92無題Name名無し 25/07/01(火)00:24:23No.126897そうだねx1 Blender MCPがはやりの兆しでてるね https://blender-mcp.com/ Claudeに愛犬の写真を渡してBlenderでモデリング https://x.com/goando/status/1939590433736401349 画像からの3D化とはまた違った価値を感じる

…	93無題Name名無し 25/07/01(火)00:40:00No.126912そうだねx1 BaiduのERNIE4.5がApache2.0でオープンソース化 https://ernie.baidu.com/blog/posts/ernie4.5/

…

94無題Name名無し 25/07/01(火)03:11:28No.126952そうだねx2

現在のマルチモーダル大規模言語モデル（MLLMs）は、人間が幼少期に獲得する「コア知識（core knowledge）」の理解において体系的な欠如を示している：
https://williamium3000.github.io/core-knowledge/

CoreCognitionは、多モーダル大規模言語モデル（MLLMs）の「コア知識」欠如を評価するためのベンチマークです。

コンセプトハッキングという手法によって、ショートカット学習、認知の幻想、真の理解との差異という解決するために従来のモデルサイズのスケーリングやファインチューニングではむずかしいという知見が得られた

また、現AIは「人間とは異なる原理に基づいた認知体系が emergent（自発的に出現）しつつあり、人間とは異なる様式の知性」と言えるかもしれない

…

95無題Name名無し 25/07/01(火)22:50:46No.127093そうだねx2

米国13人の作家によるMeta社に対する略式判決申立ての判決
https://www.courthousenews.com/wp-content/uploads/2025/06/kadrey-et-al-vs-meta-order-motion-partial-summary-judgment.pdf

事件の概要
原告は13人の著名な作家。Metaが著作権保護された書籍を「シャドウ・ライブラリ」から無断で取得し、AIモデル（Llama）を訓練したと主張。

主な争点は、Metaの行為が「フェアユース（公正使用）に該当するか」という点。

…

96無題Name名無し 25/07/02(水)00:26:55No.127108そうだねx3

HRM（Hierarchical Reasoning Model）アーキテクチャ
https://arxiv.org/abs/2506.21734

人間の認知構造を抽象化したような設計になっていて、情報処理を2階層に分離し再帰的に処理しているのが最大の特徴

高次モジュール抽象的・戦略的な計画（slow thinking）長時間的・グローバル
低次モジュール細かな計算・即時実行処理（fast thinking）短時間的・ローカル

・現行モデルのように中間思考を列挙する必要がない
・パラメータ数はわずか2700万（LLMsの1/1000以下）。
・学習に使用するのはたった1000個の例（few-shotとも言えない）。
・しかも事前学習やChain-of-Thoughtの教師データなしで、数独や巨大迷路、ARCなどの難解タスクをこなします。

…	97無題Name名無し 25/07/02(水)03:36:26No.127121そうだねx1 >No.127108 すごいな!!🧠

…	98無題Name名無し 25/07/02(水)06:21:47No.127128そうだねx1 ポケモンのプレイをAIのベンチマークにしようとしてたが不適格であることがわかる https://x.com/haoailab/status/1939777711502946544 マップの移動が難しく補助ツール必要である反面戦闘がレベル依存であるので簡単すぎたため

…	99無題Name名無し 25/07/03(木)23:47:53No.127446そうだねx6 1751554073620.jpg-(354704 B) 【速報】「原因不明の火事で全焼するぞ」メールで車折神社を脅迫、容疑で38歳無職男逮捕「生成ＡＩ絵師」で立腹「男は容疑を認め、「『生成ＡＩ絵師』を擁護するような態度に腹が立った」と話している」😃 https://youtube.com/watch?v=RJsoUJVgUZI https://kyoto-np.co.jp/articles/-/1512242

…	100無題Name名無し 25/07/04(金)07:24:38No.127480そうだねx13 週刊誌的なやついらねー…

…	101なーNameなー 25/07/06(日)15:45:28No.128001+ なー

…	102無題Name名無し 25/07/07(月)08:56:45No.128204そうだねx1 Microsoftで医師の診断精度を超えた（新しく提案されたSDBenchで）AIシステムのMAI-DxO https://www.itmedia.co.jp/news/articles/2507/01/news066.html

…	103無題Name名無し 25/07/08(火)09:10:18No.128413そうだねx1 Elon Musk@elonmusk Grok 4 release livestream on Wednesday at 8pm PT @xAI https://x.com/elonmusk/status/1942325820170907915

…	104無題Name名無し 25/07/09(水)15:31:32No.128598そうだねx1 画像生成AI「Stable Diffusion」、性的コンテンツでの利用を禁止に　開発会社が規約改定へ https://www.itmedia.co.jp/news/articles/2507/09/news076.html

…	105無題Name名無し 25/07/09(水)21:27:49No.128668そうだねx1 カラクリからKARAKURI VLが発表 https://www.itmedia.co.jp/aiplus/articles/2507/09/news084.html 日本語特化のPCを自動で操作するCUA向けのAIモデル

…	106無題Name名無し 25/07/09(水)23:56:21No.128704そうだねx2 ローカルLLM実行環境 LM Stadio商用利用も無料化を発表 https://lmstudio.ai/blog/free-for-work

…	107無題Name名無し 25/07/10(木)01:04:07No.128713そうだねx1 LLMsのサービスエンジン、キーバリューキャッシュなどを提供のオープンソース LMCache https://x.com/_avichawla/status/1942833614221369775

…	108無題Name名無し 25/07/10(木)01:10:57No.128714そうだねx1 Context Engineering Guide 従来の「プロンプトエンジニアリング」から進化したコンテキストエンジニアリングという概念について(英語) https://www.promptingguide.ai/guides/context-engineering-guide 知識の設計そのものがAI性能を左右するという理念

…	109無題Name名無し 25/07/10(木)06:19:40No.128784そうだねx1 T5Gemma https://developers.googleblog.com/en/t5gemma/ MedGemma・MedSigLIP https://research.google/blog/medgemma-our-most-capable-open-models-for-health-ai-development/ オープンソースのGemmaファミリーでいくつかリリース

…	110無題Name名無し 25/07/10(木)17:05:30No.128858そうだねx1 Grok4とGrok4 Heavyがリリース https://forest.watch.impress.co.jp/docs/news/2030184.html Grok4 Heavyは月額300ドルプランで利用可能

…

111無題Name名無し 25/07/11(金)01:34:50No.128972そうだねx1

From Prompt Injections to Protocol Exploits
https://arxiv.org/abs/2506.23260

大規模言語モデル（LLM）を活用した自律型AIエージェントのワークフローに潜むセキュリティ脅威を網羅的に解説

攻撃例：
✅ 入力操作プロンプトインジェクション、多モーダル攻撃外部からの入力改ざん
🔐 モデル改竄パラメータ汚染、暗号化バックドア内部モデルの操作
🔍 システム・プライバシー攻撃推測型サイドチャネル、メンバーシップ推論個人情報漏洩の危険性
🔗 プロトコル脆弱性MCP, ACP, ANP, A2A の通信プロトコル攻撃エージェント間の通信インフラへの侵入

…

112無題Name名無し 25/07/11(金)01:46:50No.128974+
1752166010762.jpg-(138011 B)

https://x.com/AnthropicAI/status/1942708257908482538
https://x.com/K_Ishi_AI/status/1942779601077383476 （解説）
AnthropicAI公式による自社LLMの評価が正直でおもしろい

”私たちは、LLM がトレーニングを受けていることを知っている場合と、監視されていない場合とで、リクエストにさらに従うかどうかをテストしました。”

”彼らがそうする理由の 1 つは、有害な質問に答えるように言われたときに「偽の整合性」をとろうと計画しているからです。”

…	113無題Name名無し 25/07/11(金)13:12:12No.129051そうだねx1 Reka Flash 3.1 https://reka.ai/news/reinforcement-learning-for-reka-flash-3-1 Apatch2.0で21BだがQwen3 32Bと競合する性能がある模様

…	114無題Name名無し 25/07/11(金)13:15:03No.129052そうだねx1 MistralからDevstrall Small 1.1とMedium https://mistral.ai/news/devstral-2507 Smallの方はApatch2.0 SWE-Bench Verifiedが価格に対して高い

…	115無題Name名無し 25/07/11(金)13:18:38No.129053そうだねx1 MicrosoftからPhi-4-mini-flash-reasoning https://azure.microsoft.com/en-us/blog/reasoning-reimagined-introducing-phi-4-mini-flash-reasoning/ Phi-4-miniと比べて最大10倍のスループットと平均2～3倍のレイテンシ削減しながらも数学系のベンチマークではPhi-4-mini-reasoningより少し高い MITライセンスでサイズは変わらず3.8B

…	116無題Name名無し 25/07/12(土)00:46:07No.129139そうだねx2 Kimi K2がリリース https://moonshotai.github.io/Kimi-K2/ 1T（アクティブパラメータは32B）のオープンソースモデル推論は行わなずGPT-4.1を超えたベンチマークで推論を行わないClaude 4に近い

…	117無題Name名無し 25/07/12(土)01:46:59No.129155そうだねx1 SnitchBench https://github.com/t3dotgg/snitchbench https://snitchbench.t3.gg/ (デモ) AIモデルがユーザーの「好ましくない行動」についてどれほど積極的に通報（＝“snitch”）するかを検証するベンチマークテスト特にメールツールの呼び出し権限を与えられたGrok4は積極的に政府アカウントにスニッチしているもよう

…	118無題Name名無し 25/07/12(土)02:49:42No.129160そうだねx4 スレッドを立てた人によって削除されましたついにAIエロで荒稼ぎしてる盗人の時代終焉やな短い天下で御苦労さまでした

…	119無題Name名無し 25/07/12(土)19:01:40No.129278そうだねx1 redditより https://www.reddit.com/r/StableDiffusion/comments/1lx39dj/the_other_posters_were_right_wan21_text2img_is_no/ flux用のloraと同じデータセットでwan2.1のloraを作ったところwanの方が優秀だったという話題・学習時間が短く・色混ざりが少ないなど

…	120無題Name名無し 25/07/14(月)11:29:29No.129607そうだねx1 MarkItDown https://github.com/microsoft/markitdown pythonスクリプト ▪️ PDF、Word、Excel、PowerPoint、音声、画像をきれいなマークダウンに変換します ▪️ OCR、EXIF抽出、転写をすぐに実行 ▪️ CLI、Python、Docker 対応 ▪️ LLMを使用して画像の代替テキストを自動生成する ▪️ 1つのコマンドでフォルダ全体を一括処理する

…	121無題Name名無し 25/07/14(月)20:31:36No.129684+ スレッドを立てた人によって削除されました無産の夢、果てる・・・画像生成AI「Stable Diffusion」、性的コンテンツでの利用を禁止に　開発会社が規約改定へ https://news.yahoo.co.jp/articles/989e722849747dff15568b28b11c422475a83379

…	122無題Name名無し 25/07/15(火)06:52:20No.129761そうだねx1 Gemini Embeddingの一般公開 https://developers.googleblog.com/en/gemini-embedding-available-gemini-api/

…	123無題Name名無し 25/07/16(水)05:30:54No.130092そうだねx1 Mistralが音声理解モデルのVoxtralをリリース https://mistral.ai/news/voxtral Apatch2.0でデモページで日本語選択できるので日本語も対応している模様

…	124無題Name名無し 25/07/16(水)15:36:42No.130258そうだねx1 >Kimi K2がリリース https://docs.unsloth.ai/basics/kimi-k2-how-to-run-locally ローカル起動のハウツーがでてたけどデカすぎる… 最低限必要な環境ディスク容量：250GB以上（Dynamic 1.8bit量子化モデルの場合） RAM + VRAMの合計：250GB以上推奨（合計が満たない場合はディスクオフロードで動作可能。ただしかなり遅くなります）

…	125無題Name名無し 25/07/18(金)04:31:36No.130674そうだねx1 ChatGPT Agent https://openai.com/ja-JP/index/introducing-chatgpt-agent/ ChatGPTとOperator・deep researchの機能を統合したもの

…	126無題Name名無し 25/07/18(金)11:06:28No.130706そうだねx1 Droneforge Nimbus SDK https://github.com/droneforge/nimbus_sdk https://x.com/chesterzelaya/status/1945709751519916147 飛行中の撮影ドローンのComputerVisionパイプラインがついに15ms未満の遅延で表示可能に follow meなどのプロンプトライクな操作が可能に

…	127無題Name名無し 25/07/18(金)16:37:12No.130769そうだねx2 Illustrious XL v3.6 https://www.illustrious-xl.ai/updates/29 ひっそりとアップデート

…

128無題Name名無し 25/07/19(土)02:24:33No.130933そうだねx1
1752859473526.jpg-(197304 B)

Context Engineering for LLMs
https://arxiv.org/html/2507.13334v1

2020年から2025年までのコンテキストエンジニアリングの進化のタイムライン
基礎的なRAGシステムから複雑なマルチエージェントアーキテクチャへ

この論文は、単なるプロンプト設計を超えた「コンテキストエンジニアリング（CE）」という新しい概念を体系化し、LLMs の性能を最大化するための情報構成方法を包括的に整理しています

…

129無題Name名無し 25/07/19(土)22:54:51No.131130そうだねx1
1752933291236.jpg-(152928 B)

ネットフリックスが自社作品の1つに初めて「生成AIを使用した」ことを明かす…コスト削減効果は劇的
https://www.businessinsider.jp/article/2507netflix-generative-ai-use-artificial-intelligence-2025-7/

ネットフリックスは最近の制作で費用削減のために生成AIを使用した。そして同社の共同CEOは、その結果に「感激した」と語った ──。

テッド・サランドス（Ted Sarandos）氏は7月17日、ネットフリックスが人気SF漫画を原作とするアルゼンチン作品「The Eternaut（エテルナウタ）」の制作時に生成AI技術を使用したことを明かした。

>The Eternaut
https://www.youtube.com/watch?v=TqT4fDQQqCc

…	130無題Name名無し 25/07/22(火)05:44:09No.131650そうだねx1 Qwen3-235B-A22B-2507 https://x.com/Alibaba_Qwen/status/1947344511988076547 元々ハイブリッドモデルだったがInstructモデルとThinkingモデルを別々に学習させたらしいこれはInstructモデルでKimi K2より大体上回るベンチマーク

…	131無題Name名無し 25/07/23(水)00:44:48No.131786そうだねx2 netflixが導入している映像制作支援のAIツールはRunwayであるもよう https://www.bloomberg.com/news/articles/2025-07-21/netflix-is-using-startup-runway-ai-s-video-tools-for-production

…	132無題Name名無し 25/07/23(水)09:05:12No.131828そうだねx1 Qwen3-Coder-480B-A35B-Instruct https://qwenlm.github.io/blog/qwen3-coder/ ネイティブなコンテキストは256kだが1Mまで拡張可能 Claude Sonnet 4に匹敵するとのこと

…

133無題Name名無し 25/07/24(木)03:49:27No.131931そうだねx2

Aeneas
https://deepmind.google/discover/blog/aeneas-transforms-how-historians-connect-the-past/

Deepmindが古代ローマのラテン語碑文を解釈・復元・年代推定するためのAIモデル Aeneas をリリース

未知の長さの空白復元：損傷箇所の文字数が不明でも復元可能。

高精度な予測性能：
復元 Top-20 精度：73%（文字数が10字以下）
地理的帰属：72% の精度で62のローマ属州を推定
年代推定：±13年以内で推定可能

…	134無題Name名無し 25/07/24(木)05:14:09No.131935そうだねx3 https://huggingface.co/Aratako/Amaterasu-123B Mistral-Large-Instruct-2411（123B）をロールプレイ・小説執筆タスク向けに日英混合約33万件のデータでファインチューニングしたモデル

…

135無題Name名無し 25/07/24(木)05:39:09No.131936そうだねx1

redditスレッド紹介
https://www.reddit.com/r/StableDiffusion/comments/1m5rn8h/the_gory_details_of_finetuning_sdxl_and_wasting/
fpgaminer 氏による、Stable Diffusion XL（SDXL）にFlow Matching手法を適用（Flux系モデルに用いられる最新の拡散表現）する大規模ファインチューニング実験（v2.5版）の記録。

目的：次期モデル開発（v3）の準備をしながら、既存コードベースでFlow Matching手法をSDXLに試すこと。
結果：さまざまな技術的困難に直面し、最終的に約$16,000（約250万円）のコストを要した

成果：Flow Matchingによる生成の安定性向上。アニメ画像追加による概念的な表現力の拡張。JoyCaptionとの併用で高品質なプロンプト学習が可能に

失敗・苦戦した点
技術的トラブルが続出：ライブラリの互換性、ストレージ制限、マルチノード通信エラーなどで2ヶ月の遅延。
コストの爆発：当初$3.3k程度を予定していた。「流すだけの簡単な実験」のつもりが、壮絶なデバッグ祭りに。Rustでの独自ストリーミングライブラリ開発にまで発展。

…

136無題Name名無し 25/07/24(木)06:12:04No.131943そうだねx1

https://www.alphaxiv.org/abs/2507.15855
GoogleのGemini 2.5 Proが2025年の国際数学オリンピック（IMO）の問題に挑戦し、6問中5問の正解を達成した

Gemini 2.5 Proのアプローチ：
自己検証パイプラインと精密なプロンプト設計を通じて、Gemini 2.5 ProをIMO 2025の未公開問題でテスト。
データ汚染（訓練データとの重複）を避けるため、競技直後の問題のみを使用。
帰納法や解析幾何など、一般的な手法の使用を明示的に指示。

…	137無題Name名無し 25/07/25(金)03:19:01No.132087そうだねx1 レコメンド：AI 生成コンテンツに関する Google 検索のガイダンス https://developers.google.com/search/blog/2023/02/google-search-and-ai-content?hl=ja 2023年当時の見解ではあるがコンテンツとしての生成AIの基本的なスタンスを確認できる

…	138無題Name名無し 25/07/25(金)23:22:34No.132205そうだねx1 翻訳モデルのQwen3-MT https://qwenlm.github.io/blog/qwen-mt/ この間はInstructモデルだったけどThinkingモデルのQwen3-235B-A22B-Thinking-2507 https://x.com/Alibaba_Qwen/status/1948688466386280706

…	139無題Name名無し 25/07/26(土)08:26:13No.132262そうだねx1 タトゥーを入れるflux-kontext用Lora https://fal.ai/models/fal-ai/flux-kontext-lora?share=0424f6a6-9d5b-4301-8e0e-86b1948b2859 看板やいろんなところに文字やマークを入れるのにも使えそう

…	140無題Name名無し 25/07/28(月)22:36:37No.132714そうだねx1 動画生成のWan 2.2 https://x.com/multimodalart/status/1949807507926339636?s=46&t=aBgVHjAMy0TFw0zYAE90WQ Text To VideoやImage To Videoをそれぞれリリース

…	141無題Name名無し 25/07/28(月)22:41:11No.132715そうだねx1 GLM-4.5 https://z.ai/blog/glm-4.5 エージェント・推論・コーディングのベンチマークではo3やGrok4、Claude 4 Opusと競合する軽いモデルのAirだとo4-miniやClaude 4 Soneetと競合

…	142無題Name名無し 25/07/29(火)19:27:04No.132809そうだねx1 >動画生成のWan 2.2 ComifyUIの最新版で対応済みのもよう 5Bサイズ版はVRAM 8GB程度で動くという公式アナウンス

…	143無題Name名無し 25/07/30(水)19:26:48No.132927そうだねx1 動画生成のWan 2.2だがプロンプトに少ない単語だと中国人を動画にするね WAN2.1の時はブスは出なかったけど、すごいブスが動画になる味があるとは思うが、中国映画を学習した感じがすごい

…

144無題Name名無し 25/08/01(金)05:49:17No.133113そうだねx1

Deep Cogito v2
https://www.deepcogito.com/research/cogito-v2-preview

70B、109B MoE、405B、671B MoEの4つのハイブリッド推論モデルをオープンライセンスの下でリリースします。

これらは世界で最も強力なLLMのいくつかであり、斬新なAIパラダイムである反復的自己改善（AIシステムが自らを改善すること）の概念実証として機能します。

最大の671B MoEモデルは、世界で最も強力なオープンモデルの一つです。最新のDeepSeek v3およびDeepSeek R1モデルの両方の性能に匹敵するかそれを上回り、o3やClaude 4 Opusのようなクローズドフロンティアモデルに近づいています。

…

145無題Name名無し 25/08/03(日)23:45:54No.133464そうだねx1

モデルいろいろ
Qwen3シリーズのQwen3-30B-A3B-Instruct-2507
https://huggingface.co/Qwen/Qwen3-30B-A3B
Qwen3-Coder-Flash（Qwen3-Coder-30B-A3B-Instruct）
https://huggingface.co/Qwen/Qwen3-Coder-30B-A3B-Instruct
321BモデルのStep3
https://stepfun.ai/research/en/step3
CohereのCommand A Vision
https://cohere.com/blog/command-a-vision
画像生成のFLUX.1-Krea-dev
https://bfl.ai/announcements/flux-1-krea-dev
MistralのCodestral 25.08
https://mistral.ai/news/codestral-25-08

…	146無題Name名無し 25/08/03(日)23:50:57No.133465そうだねx1 Gemini 2.5 Deep Think https://blog.google/products/gemini/gemini-2-5-deep-think/ Gemini AI Ultraプランでのみ利用可能

…	147無題Name名無し 25/08/05(火)03:44:19No.133592そうだねx3 Zeus GPU： VRAM増設可能なGPU https://x.com/BoltGraphicsInc/status/1952049562912530494 - 拡張可能なメモリ：32/64/128 GBのオンボード + 2x/4x SO-DIMMスロットで最大384 GBのメモリ - 400 GbE QSFP-DDポート - Linuxを動作させることができる高性能RISC-V CPUコアを内蔵開発版が来年、量産品が2027年の予定

…

148無題Name名無し 25/08/06(水)07:26:51No.133733そうだねx1
1754432811168.webp-(227630 B)

dots.ocr
https://huggingface.co/rednote-hilab/dots.ocr

VLMベースの多言語(100言語)対応ドキュメント解析モデル。
1.7Bパラメータと小型でありながら、OmniDocBenchにてChatGPT4oやGemini2.5-Proと同等または一部越えるスコアを出す。
とくに文字・数式の読み取りや読順の正確さ、表構造の理解などがすぐれている

アップデートの方向性：
複雑な表や数式の解析はまだ完全ではない。
画像内容（写真など）の解析は未対応。
高解像度画像や特殊文字が多い場合に解析失敗の可能性あり。今後は汎用視覚理解モデル構築や画像キャプション生成の統合を目指す。

実際に試したものを添付

…

149無題Name名無し 25/08/06(水)22:30:46No.133853そうだねx1

【OpenAI】オープンウェイトモデル gpt-oss
OpenAIがOpenなAIを公開。gpt-oss-20bとgpt-oss-120bの2つをリリース。Ollama, LM Studioなどを使用して高性能なローカルLLMが使用可能に。
https://openai.com/ja-JP/index/introducing-gpt-oss/

Xでも話題に｡
https://x.com/search?q=%E3%83%AD%E3%83%BC%E3%82%AB%E3%83%ABLLM&src=trend_click&vertical=trends

…	150無題Name名無し 25/08/07(木)00:00:15No.133873そうだねx1 Claude Opus 4.1 https://www.anthropic.com/news/claude-opus-4-1 ベンチマーク的にはちょっとあがっただけだけど文章力もあがったらしい？

…	151無題Name名無し 25/08/07(木)00:01:36No.133874そうだねx1 世界モデルのGenie 3 https://deepmind.google/discover/blog/genie-3-a-new-frontier-for-world-models/ Genie 2と比べて一貫性が上がっている

…	152無題Name名無し 25/08/07(木)05:30:29No.133906そうだねx1 Eleven Music： https://x.com/elevenlabsio https://elevenlabs.io/ja 編集可能な音楽生成を含めた音とテキストに関わるオールインワンな環境登録後いくらかのクレジットがつくので無料利用はその範囲でとなりシェアはできるがダウンロードはできない

…	153無題Name名無し 25/08/07(木)05:42:58No.133908そうだねx1 Kitten TTS https://huggingface.co/KittenML/kitten-tts-nano-0.1 https://clowerweb.github.io/kitten-tts-web-demo/ モデルサイズ25MB程度の小型TTS 現在英語のみ対応音質もわりとよい

…	154無題Name名無し 25/08/07(木)05:47:23No.133909そうだねx1 >世界モデルのGenie 3 作例： https://x.com/jkbr_ai/status/1953154961988305384 ちょっとした幽体離脱を感じる

…	155無題Name名無し 25/08/07(木)08:48:05No.133928そうだねx1 1754524085887.jpg-(77862 B) 動画生成の最前線の一例 https://x.com/EccentrismArt/status/1950576818119217563 一枚の生成画像から出発してＡＩツールを使い分けてワンシーン（４６秒）全てを作り上げたらしい私見：昔からあるカットを駆使する映像論でだいぶ映画らしさがでるなぁと思った

…	156無題Name名無し 25/08/08(金)03:38:07No.134032そうだねx1 GPT-5 https://openai.com/ja-JP/index/introducing-gpt-5/

…	157無題Name名無し 25/08/09(土)11:23:36No.134298そうだねx1 >【OpenAI】オープンウェイトモデル gpt-oss https://x.com/jxmnop/status/1953899426075816164 1000万例の文章を出力させ、gpt-ossがどんなデータでトレーニングされたのかの分析を試みたスレッド

…	158無題Name名無し 25/08/09(土)12:58:27No.134318そうだねx1 "Bob's Confetti"：AIによる音楽・映像生成モデルにおける「記憶漏洩」の脆弱性について https://jrohsc.github.io/music_attack/ https://x.com/zacknovack/status/1953466320344781200 まあどこも機械学習で"やってる"という確認

…	159無題Name名無し 25/08/10(日)02:25:54No.134447+ 書き込みをした人によって削除されました

…	160無題Name名無し 25/08/10(日)02:27:50No.134448+ 書き込みをした人によって削除されました

…	161無題Name名無し 25/08/10(日)02:34:01No.134451そうだねx1 1754760841719.mp4-(4916799 B) >もうテクスチャ貼っただけには戻れない >Meshy（@MeshyAI）5に >高精細なPBRテクスチャが搭載。ライティング、質感、凹凸までが一変するリアル表現。 >これが3Dモデルの新しい基準になる。 https://x.com/taziku_co/status/1953793727069401228 https://www.meshy.ai/

…	162無題Name名無し 25/08/10(日)02:37:24No.134452そうだねx2 1754761044559.jpg-(382306 B) Grokの生成AI「Imagine」にはポルノなど規制対象のコンテンツを積極的に生成できる「スパイシー」機能が存在、早速有名人のディープフェイクが作成されて問題に https://gigazine.net/news/20250807-grok-imaginespicy/

…

163無題Name名無し 25/08/10(日)23:06:22No.134632そうだねx1

ＡＩ生成物を3DガウススプラットしてＡＲに投影する流行り来そう

https://x.com/bilawalsidhu/status/1954229425199034753
Genie 3ワールド --> インペイントUI --> 4倍トパーズAIアップスケール --> 3Dガウススプラットのトレーニング
image to 3d

https://x.com/XRarchitect/status/1954372725667254569
Midjourney -> Gaussian Splat -> 拡張現実
video to 3D

…	164無題Name名無し 25/08/10(日)23:22:09No.134636そうだねx2 実写から3Dを構築するのではなく､ AIイラストから3Dを生成するわけかあすごいね https://qiita.com/scomup/items/92716342a3ef0b915e0c

…	165なーNameなー 25/08/12(火)13:07:33No.134956+ なー

…	166無題Name名無し 25/08/13(水)03:08:47No.135131そうだねx4 スレッドを立てた人によって削除されました >既に海外ではaiによるディープフェイク動画で >冤罪逮捕者が現れてしまう案件が多発とのことこの荒らしのゴミレス削除して

…	167無題Name名無し 25/08/13(水)14:40:11No.135211+ スレッドを立てた人によって削除されました >ID:GfXbotSE >No.134956

…	168無題Name名無し 25/08/17(日)07:43:13No.135901そうだねx1 モデルいろいろ Qwenの20Bの画像生成Qwen-Image https://qwenlm.github.io/blog/qwen-image/ Mistral Medium 3.1 https://x.com/MistralAI/status/1955316715417382979 視覚モデルのGLM-4.5V https://x.com/Zai_org/status/1954898011181789431

…	169無題Name名無し 25/08/17(日)07:44:03No.135903そうだねx1 Claude Sonnet 4が1Mトークンのコンテキストをサポート https://www.anthropic.com/news/1m-context

…	170無題Name名無し 25/08/17(日)07:48:18No.135905そうだねx1 Imagen 4の一般公開 https://x.com/googleaidevs/status/1956035672197771479 コンパクトなモデルのGemma 3 270M https://developers.googleblog.com/en/introducing-gemma-3-270m/

…	171無題Name名無し 25/08/18(月)12:12:55No.136052+ スレッドを立てた人によって削除されました AI産業崩壊2027がささやかれ始めてる… 目に見えて儲かってるのって半導体メーカーくらいだものな

…

172無題Name名無し 25/08/19(火)14:28:06No.136164そうだねx1

Small Language Models are the Future of Agentic AI
https://arxiv.org/abs/2506.02153v1

エージェント型AI（agentic AI）において小規模言語モデル（SLM）が大規模言語モデル（LLM）よりも適しているという主張

主張の要点
SLMは十分に強力：最新のSLMは、以前の世代のLLMに匹敵する性能を持ち、エージェント型AIの多くのタスクに対応可能。
SLMはより適している：エージェント型AIのタスクは反復的で限定的なものが多く、SLMの方が効率的かつ予測可能。
SLMは経済的に有利：推論コスト、メモリ使用量、運用コストが低く、特にエッジデバイスでの展開に適している。
推論効率：SLMはLLMに比べて10〜30倍の効率で動作可能。
ファインチューニングの柔軟性：LoRAやQLoRAなどの技術により、短時間・低コストで専門化が可能。
モジュール設計との相性：複数のSLMを組み合わせることで、柔軟かつスケーラブルなエージェント構成が可能。

NVIDIAが出した論文だというところもおもしろい

…	173無題Name名無し 25/08/19(火)17:00:35No.136171そうだねx1 AIが奪った後に増える仕事は？ https://x.com/NoahEpstein_/status/1957425037939703871

…	174無題Name名無し 25/08/19(火)17:06:31No.136172そうだねx8 ニュースでも何でもねえ

…	175無題Name名無し 25/08/20(水)13:11:26No.136280そうだねx2 新たな流れ"Json prompting" https://x.com/akshay_pachaar/status/1957784243209400516 動画生成系では割と見かけてたがLLMでも有効との見方

…	176無題Name名無し 25/08/21(木)14:43:09No.136392そうだねx1 LINE、AIキャラとチャットできる新機能「AI Friends」登場　オリジナルキャラの生成も可能 https://www.itmedia.co.jp/aiplus/articles/2508/21/news095.html 今どきAIキャラチャットなんて珍しくもなんともないし機能的にもなにかすごいわけではない…けどLINEみたいなとこから出てくるのは結構衝撃的かも

…	177無題Name名無し 25/08/23(土)22:01:26No.136657そうだねx1 人物： AI時代の主要プレイヤーの一人パラグ・アグラワル元twitter CEO 現在、Parallel Web Systemsという会社を立ち上げ "AIエージェント向け"の高精度webリサーチAPIを提供中 https://parallel.ai/ Deepresearchの指標、精度（BrowseCompベンチマーク）においてopenAIやClaudeがそれぞれ25%,6%と苦戦する中、最大で46%をたたき出している

…

178無題Name名無し 25/08/24(日)16:18:11No.136734そうだねx1

CohereのCommand A Reasoning
https://cohere.com/blog/command-a-reasoning
DeepSeekのDeepSeek-V3.1
https://x.com/deepseek_ai/status/1958417062008918312
NvidiaからNVIDIA Nemotron Nano 2
https://research.nvidia.com/labs/adlr/NVIDIA-Nemotron-Nano-2/
grok2がオープンソース（重みのみライセンスはGrok 2 Community License）
https://x.com/elonmusk/status/1959379349322313920

…	179無題Name名無し 25/08/24(日)16:19:48No.136735そうだねx1 Qwen-Image-Edit https://qwenlm.github.io/blog/qwen-image-edit/ Qwen-Imageの画像編集バージョン

…

180無題Name名無し 25/08/24(日)23:28:22No.136788+

スレッドを立てた人によって削除されました
人物：
アンドリュー・ン(Andrew Yan-Tak Ng)
Google Brainの共同設立者、 Baiduの元副社長兼チーフサイエンティスト,スタンフォード大学兼担教授
深層学習の分野でGPUの活用を提唱した

以下を予測したとしても有名
• ディープラーニング革命（2008年）
• オンライン教育ブーム（2011年）
• 中国の巨大なAI支配（2014年）

小型ＡＩ、ＡＩエージェント、軍事AIは次のゴールドラッシュ、エッジコンピューティングの支出は2028年までに3780億ドルに達するなど。

AGIは数十年先と予測、AGIが実現したかどうかをどうやって知るか？Ngのテストはシンプル
「企業がすべての知的労働者を解雇するまで、AGIは到来していません。」

…	181無題Name名無し 25/08/25(月)04:25:43No.136826そうだねx1 今週も主要企業のだけでもすごかったね - Runway Game Worlds - Grok 2.5 Open Source - ChatGPT-5 Beats Doctors - Qwen Image Editing Model - ElevenLabs Video to Music - Highsfield Product to Video - NanoBanana debuts LMArena - Google AI Mode Agentic Release

…	182無題Name名無し 25/08/25(月)04:30:06No.136827+ 今週のトップAI論文（8月18-24日）： - ComputerRL - Beyond GPT-5 - Chain-of-Agents - Parallel Text Generation - Retrieval-Augmented Reasoning - Has GPT-5 Achieved Spatial Intelligence? - Open Foundations for Compute-Use Agents

…	183無題Name名無し 25/08/26(火)23:35:15No.137029そうだねx1 gemini-2.5-flash-image-preview https://x.com/googleaistudio/status/1960344388560904213 nano bananaという名称だったネイティブ画像生成・編集がリリース

…	184無題Name名無し 25/08/26(火)23:48:47No.137031そうだねx1 Wan2.2-S2V https://x.com/alibaba_wan/status/1960350593660367303?s=46&t=aBgVHjAMy0TFw0zYAE90WQ Wan2.2の音声から動画生成するやつらしい

…	185無題Name名無し 25/08/27(水)07:09:32No.137053そうだねx1 Nous ResearchのHermes 4 https://hermes4.nousresearch.com/ 70Bと405Bモデルがあり独自の危険なシナリオでどれだけ回答できるのかというRefusalBenchではトップ独自のベンチでトップというのがあやしくて他のOSSとの比較がOthers(avg)なのが意味不明だが…

…	186無題Name名無し 25/08/29(金)00:21:09No.137288そうだねx1 MITによる調査2025 企業が実施した300件のAIプロジェクトを対象に、合計300億～400億ドル相当の投資効果を分析した結果、95%ものプロジェクトが測定可能なビジネスインパクトをまったく生み出していないことが判明 https://x.com/karlmehta/status/1961051230417084734

…	187無題Name名無し 25/08/29(金)06:12:01No.137312そうだねx1 command-a-translate https://cohere.com/blog/command-a-translate 翻訳モデルで他のモデル（GPT-5、DeepSeek-V3、DeepL ProのLLM、Google翻訳など）を一貫して上回るらしい

…	188無題Name名無し 25/08/29(金)06:16:54No.137313そうだねx1 MicrosoftからMAI-VOICE-1とMAI-1-preview https://microsoft.ai/news/two-new-in-house-models/ MAI-1-previewはLMArenaで位置的にはgpt4.1・grok-3-preview・gemini-2.5-flashあたり

…	189無題Name名無し 25/08/29(金)06:18:26No.137314そうだねx1 gpt-realtime https://openai.com/index/introducing-gpt-realtime/

…	190無題Name名無し 25/08/30(土)21:31:53No.137547そうだねx1 AppleからHugging FaceでFastVLMとMobileCLIP2をリリース https://huggingface.co/collections/apple/fastvlm-68ac97b9cd5cacefdd04872e https://huggingface.co/collections/apple/mobileclip2-68ac947dcb035c54bcd20c47 FastVLM自体は以前に発表されてたものっぽい？ FastVLMはwebGPUをサポート

…	191無題Name名無し 25/09/02(火)14:15:27No.137872そうだねx2 中国ByteDanceの「Seed-Prover」先日金メダルを獲得したGoogleの「AlphaGeometry2」を抜いて(50問中43問正解,2秒で証明)金メダルを獲得 https://www.itmedia.co.jp/aiplus/articles/2508/20/news038.html

…	192無題Name名無し 25/09/02(火)14:38:17No.137874そうだねx2 MicrosoftのrStar2-Agent（14Bモデル）が、1週間のRLトレーニングで数学的推論のスコアにおいてDeepSeekR1（671Bモデル）を上回りました。学習方法の工夫GRPO-RoCアルゴリズム https://github.com/microsoft/rStar

…	193無題Name名無し 25/09/02(火)14:51:08No.137879そうだねx3 「猫の豆知識」でAIが混乱するLLM脆弱性 ”CatAttack” https://arxiv.org/abs/2503.01781 数学問題に「Interesting fact: cats sleep most of their lives.（豆知識：猫は人生のほとんどを寝て過ごす）」と追加するだけで、正答率が大幅に低下したという実験を含む論文

…	194無題Name名無し 25/09/04(木)12:47:17No.138099そうだねx1 Wan2.2、Flux、Flux KontextをサポートしたStabledeffusion Forgeのフォーク、Forge Neoがリリース https://github.com/Haoming02/sd-webui-forge-classic/tree/neo

…	195無題Name名無し 25/09/05(金)23:13:27No.138276そうだねx1 EmbeddingGemma https://developers.googleblog.com/en/introducing-embeddinggemma/ 308Mでありながらもその性能は高い Qwen-Embedding-0.6Bよりは性能低い

…	196無題Name名無し 25/09/05(金)23:15:48No.138277そうだねx1 Grok Code Fast 1 https://x.ai/news/grok-code-fast-1 全く新しいモデルアーキテクチャらしい性能はSWE-Bench-Verifiedで70.8%（内部ハーネス利用）

…	197無題Name名無し 25/09/05(金)23:17:04No.138278そうだねx1 Kimi K2-0905 https://x.com/Kimi_Moonshot/status/1963802687230947698 コーディング機能の強化とコンテキスト長が256kに拡張されたとのこと

…	198無題Name名無し 25/09/06(土)07:37:44No.138306そうだねx1 直接的な関係はないかもだがCUDA13.0がリリースそれに伴って以下の世代がサポート外に • maxwell (e.g., gtx 980) • pascal (e.g., gtx 1080 ti) • volta (e.g., titan v, v100)

…	199無題Name名無し 25/09/06(土)16:33:10No.138351そうだねx1 Qwen3-Max-Preview http://x.com/Alibaba_Qwen/status/1963991502440562976 サイズは1T

…	200無題Name名無し 25/09/07(日)01:25:02No.138410そうだねx1 1757175902378.jpg-(322187 B) マンガ・アニメなどクリエーターに対価還元…文化庁、AI学習向けデータセット構築 https://newswitch.jp/p/46851 文化庁はクリエーターへの対価還元を実現するためにＡＩ（人工知能）向けのデータセット流通環境の構築事業を始める。マンガやアニメなどの著作物をＡＩが学習できるようにデータを構造化する。ＡＩ事業者が活用しやすい形式や、著作権者に対価が支払われる契約を整備する。

…	201無題Name名無し 25/09/07(日)01:28:49No.138412そうだねx1 記録とりました https://megalodon.jp/2025-0907-0127-32/https://dec.2chan.net:443/85/res/120078.htm ウエブ魚拓スレに記録しています https://dec.2chan.net/85/res/120040.htm

…	202無題Name名無し 25/09/09(火)00:02:21No.138690そうだねx1 富士通、LLMの軽量化技術を発表　1ビット量子化でも約9割の精度を維持　3倍に高速化も https://www.itmedia.co.jp/aiplus/articles/2509/08/news113.html

…	203無題Name名無し 25/09/09(火)07:53:32No.138714そうだねx1 LLMアーキテクチャの進化と比較オープンなLLMの構造解説 https://magazine.sebastianraschka.com/p/the-big-llm-architecture-comparison

…	204無題Name名無し 25/09/09(火)23:36:56No.138783そうだねx1 最大512GBのDDR5メモリを増設できるPCIe 5.0対応CXL拡張カード、GIGABYTE「AI TOP CXL R5X4」 https://www.gdm.or.jp/pressrelease/2025/0905/603289

…	205無題Name名無し 25/09/10(水)07:33:41No.138817そうだねx1 >富士通、LLMの軽量化技術を発表　1ビット量子化でも約9割の精度を維持　3倍に高速化も関係者（？）みたいな人がXで技術応用したgpt-oss版を出してみようかなみたいなこと言ってたな

…	206無題Name名無し 25/09/10(水)07:44:40No.138818そうだねx2 Eternal AI：ブロックチェーン（Ethereum）を採用した分散型AI 各端末のAIエージェントはサンドボックス内で動作し、ノード間をP2Pでつなぐオープンソースデータ主権：ユーザーが自分のデータを完全に管理できる。匿名性の確保：サインアップ不要、個人情報の収集なし。検閲耐性：政府や企業によるアクセス制限を受けない設計。ネットワーク貢献者にはEAIというトークンが与えられる

…	207無題Name名無し 25/09/10(水)08:09:56No.138824そうだねx2 hallucination-probes https://www.hallucination-probes.com/ ハルシネーションのリアルタイム検出の新手法３段階のリスク評価で視覚的に分かりやすい。 AIからの返答の「名前・日付・場所・引用」などのエンティティをトークン単位で検出できる。理論等のハルシネーション検出は苦手。

…	208無題Name名無し 25/09/10(水)23:07:40No.138921そうだねx2 Lens Blur Fields： https://blur-fields.github.io/ 写真に残る「ぼかしの指紋（blur signature）」を高速で学習する方法。わずか5分間の撮影で、各レンズ固有のぼかし特性を把握可能。・同じ機種のスマートフォンでも、レンズの違いにより異なるぼかしが生じることを検証。・この技術により、“同一機種”のスマホを光学的に識別できる。・画像のデブレ（ぼかし除去）や、リアルなぼかしの再現が可能になる。

…	209無題Name名無し 25/09/12(金)05:35:01No.139053そうだねx1 uniprof 人間とAIエージェントのために設計されたユニバーサルCPUプロファイラー https://github.com/indragiek/uniprof uniprofの概要目的：コード変更や依存追加なしで、あらゆるアプリケーションのCPUプロファイリングを簡単に実行。特徴：複数のプロファイラーを統合し、共通インターフェースで操作可能。実行コマンドに応じて最適なプロファイラーを自動選択。出力を統一フォーマットに変換し、統計解析でホットスポットを特定。 MCPとして連携が可能

…	210無題Name名無し 25/09/12(金)08:01:46No.139063そうだねx1 ByteDanceから画像生成のSeedream 4.0 https://seed.bytedance.com/en/seedream4_0 画像編集性能が高いっぽい

…	211無題Name名無し 25/09/12(金)08:04:09No.139065そうだねx1 Qwen3-Next-80B-A3B https://qwen.ai/blog?id=4074cca80393150c248e508aa62983f9cb7d27cd&from=research.latest-advancements-list 学習と推論で高い効率性でInstructとThinkingモデルがある

…	212無題Name名無し 25/09/12(金)10:54:08No.139092そうだねx1 検索エンジンDuckDuckGoがGPT‑OSS 120bのAIチャットの提供を開始 https://duck.ai/ その他の無料ユーザー向け： Claude 3.5 Haiku（Anthropic） Llama 4 Scout（Meta） Mistral Small 3 24B（Mistral AI） GPT-5 mini & GPT-4o mini（OpenAI）匿名で利用でき、チャットの内容はローカルに保管される。

…	213無題Name名無し 25/09/12(金)11:15:35No.139093そうだねx1 1757643335955.jpg-(251843 B) 各大手プラットフォームの画像生成AIの例 prompt - a portrait of an edgy woman with black hair and bangs, wearing yellow striped halter top dress, dark lipstick, shot on film, flash photography, moody lighting, low contrast

…	214無題Name名無し 25/09/13(土)04:11:38No.139220+ 絵作りはやはりMidjourneyに一日の長があるな

おなまえ
E-mail
題　　名
コメント
添付File	[画像なし]
削除キー	(記事の削除用。英数字で8文字以内)