人工知能@ふたば
[ホーム]

[掲示板に戻る]
レス送信モード
おなまえ
E-mail
題  名
コメント
添付File []
削除キー(記事の削除用。英数字で8文字以内)
  • 添付可能:GIF,JPG,PNG,WEBM,MP4. 8000KBまで. 現在36人くらいが見てます.
  • スレッドを立てた人がレスを削除してスレッド内のみアク禁にできます.
  • メール欄に「id表示」と入れてスレッドを立てるとid表示にできます.
  • メール欄に「ip表示」と入れてスレッドを立てるとip表示にできます.
  • 削除依頼が閾値を超えるとidを表示します.
  • 生成系AI,ChatGPT,Stable Diffusion,自動運転など
  • 管理人への連絡は準備板 ご意見へ. 削除依頼は記事番号を押しdelを押して下さい.
  • スマホ・携帯ふたば入口 この板の保存数は20000件です. 規約
  • 新しい板: 人工知能 ZOIDS

画像ファイル名:1747456403550.png-(35946 B)
35946 B無題Name名無し25/05/17(土)13:33:23No.120078そうだねx7 9月24日頃消えます
AI関連のニューススレ
立ってないようなので
削除された記事が3件あります.見る
1無題Name名無し 25/05/17(土)13:36:37No.120081そうだねx1
Google DeepMindからAlphaEvolveが発表
https://deepmind.google/discover/blog/alphaevolve-a-gemini-powered-coding-agent-for-designing-advanced-algorithms/
アルゴリズムや数学的課題をAI自身がみつけ最適化していく
2無題Name名無し 25/05/17(土)13:39:26No.120086そうだねx1
WindsurfからSWE-1モデルファミリがリリース
https://windsurf.com/blog/windsurf-wave-9-swe-1
通常モデルとlite、miniモデルがありソフトウェア エンジニアリング プロセス全体に最適化されているモデル
性能的には通常のでClaude 3.5 Sonnetぐらい?
3無題Name名無し 25/05/17(土)13:43:39No.120090そうだねx1
OpenAIからCodexが発表
https://openai.com/index/introducing-codex/
クラウドベースのソフトウェアエンジニアリングエージェントでPro、Team、Enterpriseプランで利用可能
モデルはo3を微調整したcodex-1を使用している
o4-miniを微調整したcodex-miniはCodex CLIやAPIで利用可能
4無題Name名無し 25/05/17(土)18:45:02No.120157そうだねx1
    1747475102727.jpg-(186184 B)
186184 B
シングルターンとマルチターンによる6つの生成タスク (コード、数学、SQL、API 呼び出し、データからテキストへの変換、ドキュメントの要約) にわたって、15 のトップ LLM (GPT-4.1、Gemini 2.5 Pro、Claude 3.7 Sonnet、Deepseek-R1 など) による大規模なシミュレーションを実施しました。
https://x.com/omarsar0/status/1922755721428598988

例えば、シングルターン設定で90%を超える精度を誇るモデルはマルチターン設定では約60%まで低下すること散見された。
5無題Name名無し 25/05/17(土)18:50:07No.120160+
>No.120157
結論:
ユーザーにとっては、複数回にわたって明確にするよりも、すべての要件を 1 つのプロンプトに統合する方が適切です。

会話が脱線した場合は、統合された要約から新しいセッションを開始すると、より良い結果が得られます。

システム構築者とモデル開発者は、単なる性能だけでなく、複数ターンのコンテキストにおける信頼性を優先することが求められます。これは、これらの問題の影響がより顕著になる複雑なエージェントシステムを構築する場合に特に当てはまります。

LLMは本当に奇妙です。そして、こうした奇妙な現象は最新モデルにも現れていますが、より微妙な形で現れています。
6無題Name名無し 25/05/19(月)19:24:14No.120419そうだねx1
会話中、相手の“ウソ”をこっそり教えてくれるスマートウォッチ AIが瞬時にファクトチェック
情報の真偽を振動パターンで応答するところがユニーク
https://www.itmedia.co.jp/aiplus/articles/2505/19/news068.html
7無題Name名無し 25/05/19(月)21:05:01No.120441+
スレッドを立てた人によって削除されました
最近は静止画から脱ぐ動画作れるんやな
https://x.gd/Hpxda


iug
8無題Name名無し 25/05/20(火)09:49:38No.120493そうだねx2
#NVIDIA、RTX GPUでのAI推論より簡単に高速化できる「TensorRT for RTX」
https://pc.watch.impress.co.jp/docs/news/2015039.html

・NVIDIAは19日、COMPUTEX TAIPEI 2025にあわせ、AI推論の高速化ライブラリ「TensorRT for RTX」を発表した。すべてのRTXシリーズGPUで利用できるとしており、6月に提供を開始する予定。

何かキター?!
9無題Name名無し 25/05/20(火)11:17:36No.120499そうだねx1
Microsoft Build 2025
https://www.itmedia.co.jp/news/articles/2505/20/news097.html
Windows11でMCP対応
WSLオープンソース化
ウェブコンテンツと容易に対話できるようにする「NLWeb」
Microsoft 365 Copilot Tuningで組織ごとにAIをTuning可能に
10無題Name名無し 25/05/21(水)07:28:12No.120600そうだねx1
Google I/O 2025
https://blog.google/technology/developers/google-io-2025-collection/
AIコーディングエージェントのJules
Google AI Ultraという新しいサブスクリプションプラン(249.99ドル)でGemini think2.5pro・Veo3にアクセス可能
Veo3では音声付のビデオ生成も可能に
Imgegen4も発表
Gemini 2.5 FlashとProでネイティブオーティオ出力のプレビュー版をリリース
モバイル向けのGemma 3nを公開
Gemini Diffusionという拡散モデルも発表
11Xで話題騒然「Gemini Diffusion」Name名無し 25/05/22(木)02:31:22No.120703+
    1747848682471.mp4-(272505 B)
272505 B
>Googleは、画像生成AIなどで使われている「拡散モデル」の技術を使って作成されたAIモデル「Gemini Diffusion」を発表しました。

>テキストやコードの生成を高速処理できるのが特徴で、利用するには順番待ちリストに登録する必要があります。

https://x.com/search?q=%E6%8B%A1%E6%95%A3%E3%83%A2%E3%83%87%E3%83%AB&src=trend_click&vertical=trends
12無題Name名無し 25/05/22(木)08:33:49No.120728そうだねx2
OpenAIとデザイン企業ioの合併
https://www.itmedia.co.jp/news/articles/2505/22/news096.html
13無題Name名無し 25/05/22(木)11:26:08No.120734そうだねx2
MistralからDevstralがリリース
https://mistral.ai/news/devstral
コーディングエージェント向けのApatch2.0ライセンスのオープンソースモデルでサイズは23.6B
SWE-Bench VerifiedではClaude 3.5 haikuを超える
14無題Name名無し 25/05/22(木)19:22:36No.120773そうだねx1
PLaMoからPLaMo 2.0 Primeがリリース
https://x.com/PLaMoLLM/status/1925410565075472652
32kのコンテキスト長でGPT4oに次ぐ日本語ベンチマーク性能
価格は100万トークンあたり入力/出力で60円/250円
ブラウザ上で無料利用も可能
15無題Name名無し 25/05/23(金)05:26:17No.120822そうだねx2
Claude4がリリース
https://www.anthropic.com/news/claude-4
OpusとSonnetがリリースされ価格帯やコンテキスト長は前と変わらず
Opusはコーティングエージェントとして7時間動かせたらしい
o3と同様に思考中にツール利用も行えるとのこと
16無題Name名無し 25/05/25(日)22:40:57No.121233そうだねx3
>Veo3では音声付のビデオ生成も可能に
https://x.com/d_1d2d/status/1926021096760807877
使い手の倫理観とか良識がますます試されるレベルになってきたな…
17無題Name名無し 25/05/26(月)16:09:34No.121300+
書き込みをした人によって削除されました
18無題Name名無し 25/05/29(木)23:48:18No.121651そうだねx1
DeepSeek-R1-0528がリリース
https://x.com/deepseek_ai/status/1928061589107900779
19無題Name名無し 25/06/01(日)18:36:16No.122174そうだねx2
https://x.com/jiwasawa/status/1928268298866594292
Qwen2.5-Math特有の副作用
解答が正解だろうが不正解だろうがランダムに報酬を与えても数学の性能が上がったという研究
20無題Name名無し 25/06/04(水)13:47:33No.122654そうだねx2
Builder.ai破綻の真相:700人のインドエンジニアが「AI」を偽装、Microsoft出資の4億4500万ドル調達企業が破産
https://innovatopia.jp/ai/ai-news/56173/

スゲぇぜインド人パワー

Builder.aiが謳っていた「AI搭載」のノーコード開発プラットフォームは、実際には大規模な人力による開発体制でした。同社は「Natasha」というAIアシスタントがレゴブロックのようにアプリを自動構築すると宣伝していましたが、実際にはインドとウクライナの数百人のエンジニアが手動でコードを書いていました。

この事実は2019年にWall Street Journalによって既に報道されていましたが、その後も同社は「AI企業」としてのブランディングを続け、投資家からの資金調達を継続していました。
21無題Name名無し 25/06/07(土)16:27:05No.123080+
現在 seaartでプロンプト欄にnipple vagina などのセンシティブなワードがキーワード検閲されている模様
22無題Name名無し 25/06/07(土)19:57:56No.123116+
>No.123080
現在 検閲解除された模様
23無題Name名無し 25/06/08(日)15:23:42No.123259そうだねx2
Dual-Process Image Generation:
生成AIの最大の欠点「出してみないと分からない問題」がついに解消へ
https://x.com/taziku_co/status/1931141047637450936


この方法の特徴は、既存の画像生成モデルとVLMを組み合わせることで、特別な再学習なしに新しい制御タスクを実装できる点です。例えば、色のパレット、線の太さ、地平線の位置、相対的な奥行き などの視覚的な要素を、テキストや画像を用いたインターフェースで調整できます。
24無題Name名無し 25/06/08(日)15:52:37No.123261そうだねx1
FreeTimeGS:
https://x.com/bilawalsidhu/status/1931356216694882319
https://zju3dv.github.io/freetimegs/

マルチビュー 3D キャプチャを再現・再生するときに、ビデオ拡散モデルをつかって計算時間を短縮する例
25無題Name名無し 25/06/08(日)16:27:58No.123264そうだねx1
    1749367678541.jpg-(157962 B)
157962 B
Appleの研究により、推論モデル(LRM)は問題が一定以上に複雑になると、思考放棄して一気に精度が落ちることが判明した。
https://x.com/K_Ishi_AI/status/1931542962015699283
26無題Name名無し 25/06/09(月)17:29:46No.123474そうだねx1
>FreeTimeGS:
関連して4Dvが4D Gaussian Splattingを発表している
こちらは動画から空間再生を実現している
27無題Name名無し 25/06/09(月)20:00:35No.123490+
    1749466835486.jpg-(249105 B)
249105 B
>Appleの研究により、推論モデル(LRM)は問題が一定以上に複雑になると、思考放棄して一気に精度が落ちることが判明した。
元の論文https://ml-site.cdn-apple.com/papers/the-illusion-of-thinking.pdf読んでるだが図の誤りを指摘しておく
ハノイの塔の塔の数を増やすテストではなくディスクの数を増やしている(添付画像参照)
塔の数を増やすよりディスクを増やす方が問題の一般化が楽なのにそれでも解けないのは意外で面白い
28無題Name名無し 25/06/11(水)00:01:29No.123750そうだねx1
Mistralから初の推論モデルMagistral
https://mistral.ai/news/magistral
SmallはオープンウェイトMediumはエンタープライズとなっている
性能はMediumでR1よりそこそこ劣っている模様
29無題Name名無し 25/06/11(水)06:28:01No.123776+
OpenAIからo3-proがリリース
https://x.com/OpenAI/status/1932530409684005048
APIの価格としてはo1-proよりはるかに安い
ちなみにo3は80%の値下げで4oよりAPI価格が安くなっている
30無題Name名無し 25/06/11(水)10:06:41No.123799+
スレッドを立てた人によって削除されました
https://www.youtube.com/watch?v=ftAc5H8a4Rg
31無題Name名無し 25/06/11(水)16:35:42No.123826+
「生成AIで作成」女の子の裸の画像を共有疑い 50代の男を逮捕 愛知県警で初、わいせつ電磁的記録媒体陳列容疑で検挙 - YAHOO! ニュース
https://news.yahoo.co.jp/articles/b4b733825ba36c861cd37e74729992657262e8c3
32無題Name名無し 25/06/12(木)14:57:58No.123966+
Text-to-LoRA(T2L):
https://x.com/SakanaAILabs/status/1932972420522230214
https://arxiv.org/pdf/2506.06105

Sakana AIが発表したT2LはこれまでのLora作成のようなデータ収集なしで、自然言語による適切な指示を与えることでLLMをタスクに適応させることができることを示した。

・多数のLoRAアダプターを圧縮できる
・ゼロショット適応が可能
・LoRAアダプターを損失ありで圧縮しても、モデルの性能低下がほとんど見られなかった。

私見:○○を(もっと)■■にして欲しい型のプロンプトと相性が良いと思われる
33無題Name名無し 25/06/12(木)16:11:43No.123971+
米ディズニーなど “生成AI 作成画像が著作権を侵害”と提訴 - NHK
https://www3.nhk.or.jp/news/html/20250612/k10014833121000.html
34無題Name名無し 25/06/12(木)19:10:23No.123986+
Seaweed APT2
https://seaweed-apt.com/2
https://huggingface.co/papers/2506.09350

この研究では、「Autoregressive Adversarial Post-Training (AAPT)」という手法を用いることで、事前学習済みの潜在動画拡散モデルをリアルタイム対応のインタラクティブな動画生成器へと変換することを試みています。

リアルタイム動画生成性能
・モデルサイズは8B(80億パラメータ)。
・単一のH100 GPUで24fps、解像度736×416の動画をリアルタイム生成可能。
・8×H100で1280×720の動画を最大1分間(1440フレーム)生成。
35無題Name名無し 25/06/13(金)00:19:02No.124048+
”AI彼女”Z世代ユーザーの80%が「合法ならAIと結婚したい」と回答 - ナゾロジー
https://nazology.kusuguru.co.jp/archives/179390

2025年4月、Joi AIはZ世代2000人を対象に調査を行い、そのうち80%が「合法ならAIと結婚したい」と回答したことが明らかになりました。

- GazouBBS + futaba-