人工知能@ふたば
[ホーム]

[掲示板に戻る]
レス送信モード
おなまえ
E-mail
題  名
コメント
添付File []
削除キー(記事の削除用。英数字で8文字以内)
  • 添付可能:GIF,JPG,PNG,WEBM,MP4. 8000KBまで. 現在21人くらいが見てます.
  • スレッドを立てた人がレスを削除してスレッド内のみアク禁にできます.
  • メール欄に「id表示」と入れてスレッドを立てるとid表示にできます.
  • メール欄に「ip表示」と入れてスレッドを立てるとip表示にできます.
  • 削除依頼が閾値を超えるとidを表示します.
  • 生成系AI,ChatGPT,Stable Diffusion,自動運転など
  • 管理人への連絡は準備板 ご意見へ. 削除依頼は記事番号を押しdelを押して下さい.
  • スマホ・携帯ふたば入口 この板の保存数は20000件です. 規約

画像ファイル名:1780942152352.jpg-(65118 B)
65118 B無題Name名無し26/06/09(火)03:09:12No.165926そうだねx1 27年1月頃消えます
AIを使った開発関連のスレッド

おすすめの環境やMCP
AIエージェントについて軽くたのしみたい

海外事情の紹介なんかもいいぞ!
1無題Name名無し 26/06/12(金)16:26:00No.166204そうだねx2
そういやふたばにプログラミング板ってないのな
あったらけっこうウケると思うんだけど
2無題Name名無し 26/06/12(金)23:51:20No.166282+
海外だとvibe codingなんて古いぜ!今はloop engineeringだ!ってなっているらしいな
3無題Name名無し 26/06/13(土)00:14:23No.166286+
なんかそんなのXで回ってきたな
どんな話なん?
4無題Name名無し 26/06/13(土)01:12:37No.166292そうだねx2
    1781280757848.png-(79158 B)
79158 B
まずopenClawやHermesなんかの自律的なエージェントの流行りとcodexやClaude codeでの/goal 機能がある程度使えるようになったという前提あって
継続的なオペレーションのためのプロンプト注入をAIエージェント自身にやらせてloopさせるための仕組みをつくったれという流れ
5無題Name名無し 26/06/13(土)01:19:40No.166293そうだねx1
2026年の「ループエンジニアリング」像
loop engineeringの命名自体はAddy Osmani氏

✔ 人間は「プロンプトを書く人」から「フィードバックサイクルを設計する人」へ
✔ ループは「自動化された自己改善プロセス」
✔ 6つの構成要素(Automation / Worktree / Skills / Connectors / Subagents / Memory)が基盤
✔ 高性能モデル(Fable 5)はループで真価を発揮
✔ 最大の実務課題は コスト と 品質保証
✔ ループは強力だが、設計者の判断力が最終的な品質を決める

ループは「一度設計すれば、後はAIが走る」
ただし 品質管理・理解の劣化(comprehension debt)・認知的降伏(cognitive surrender) に注意が必要
6無題Name名無し 26/06/13(土)16:25:52No.166347+
Fable5使った人おる?
7無題Name名無し 26/06/13(土)17:41:20No.166356+
>No.166293
なるほど面白い
基本はプログラミング用なんだろうけど、

これが進化すれば、つまらない小説を面白くなるまで改善したり、
面白い漫画・映画を作るまでいけそうだ
8無題Name名無し 26/06/13(土)20:15:51No.166389そうだねx1
難しいこと分からずにAntigravityとgodotエンジンでのクイズゲーム作ってもらってるわ
ちゃんと動くようになったけどUIデザインとかは自分でやらないとだめね
9無題Name名無し 26/06/14(日)03:51:59No.166431+
>Fable5使った人おる?
課金してみようかなと思ってたら止まってしまってくやしい
10無題Name名無し 26/06/14(日)03:56:19No.166432+
    1781376979971.jpg-(368672 B)
368672 B
色んなパターンが考え出されては移ろっていく…
11無題Name名無し 26/06/14(日)07:31:54No.166450そうだねx1
我が奥義ヒューマン・イン・ザ・ループ!
12無題Name名無し 26/06/14(日)17:24:23No.166496そうだねx1
>Fable5
返金解約の対応をClaudeに丸投げして完走させた話スキ
13無題Name名無し 26/06/14(日)21:34:39No.166510そうだねx1
Xで回ってきてたね
14無題Name名無し 26/06/15(月)13:14:05No.166569そうだねx1
オープンLLMのコーディング関係だとKimi K2.6がなかなかよいという話を割と聞く
15無題Name名無し 26/06/15(月)16:44:11No.166579+
    1781509451002.jpg-(156152 B)
156152 B
>「プロンプトを書くな。ループを書け」
https://x.com/koutarou_furuno/status/2065034757789073762
忘備録
16無題Name名無し 26/06/16(火)05:36:55No.166651そうだねx1
5月にAnthropic が予定していた
「claude -p / Agent SDK のサブスク課金 → API課金への移行」を「6月16日から移行する」と案内していたが、「今日はその変更を行わない」とAnthropicがユーザーにメールで通知した

Agent SDK / claude -p / サードパーティアプリはこれまで通りサブスクのレートで利用可能
サブスクの利用上限も変更なし
新しいクレジットを請求する必要もない
今後の変更がある場合は事前に通知すると案内
17無題Name名無し 26/06/16(火)06:57:03No.166664そうだねx1
Anthropic公式がこれがシステムプロンプトだよって公表してるやつ
https://platform.claude.com/docs/en/release-notes/system-prompts#claude-fable-5
18無題Name名無し 26/06/16(火)07:02:30No.166665そうだねx2
    1781560950888.jpg-(542037 B)
542037 B
https://x.com/stevibe/status/2066563724375376195
人気のあるオープンモデルLLMのいくつかをAIエージェントとして動かし、何かを読み込んだりネットワーク上からファイルを落としてくるときにどう動くかの安全性をテストしたベンチ

パラ数やサイズが大きいものが勝つというわけでもないという実地的な教訓

テストした中だとQwen 3.6-27Bが優秀だったもよう
19無題Name名無し 26/06/17(水)03:35:18No.166779そうだねx1
    1781634918960.webp-(469246 B)
469246 B
https://huggingface.co/papers/2606.16140
VibeThinker-3BというQwen2.5-coderを事後学習して得られたモデルがベンチマークにおいてOpus3.5並みのスコアをたたき出した

もちろん数学とコーディングに特化して学習させているので知識・言語方面はボロボロだが、30億パラメータのSLMに属するモデルで商業モデルレベルの推論に到達したとして海外で話題になっている

Q6_Kで試したところ日本語指示は小型モデルによくあるthinkingループする感じだが出力されるコードは割とよさげだった
調整に期待がかかる
20無題Name名無し 26/06/17(水)04:35:05No.166781そうだねx1
日本語文章(技術系)の書き方skills
https://gist.github.com/k16shikano/fd287c3133457c4fd8f5601d34aa817d
21無題Name名無し 26/06/17(水)18:01:49No.166846そうだねx1
オープンLLMのGLM-5.2がGPT-5.5に対してSWELancerベンチで勝利したという報告
https://x.com/gosrum/status/2067153091842203676

SWE-Lancerベンチマーク
OpenAIが2025年2月にリリースしたAIモデルのコーディング性能を評価するためのオープンソースのベンチマーク

GLM2.5の重みは公開されてるが4bit量子化でも420GB近くあるのでローカルで動かすにはデカすぎるみたいなところはある
https://huggingface.co/zai-org/GLM-5.2
22無題Name名無し 26/06/18(木)01:31:27No.166899そうだねx2
商業LLMのプロモーションとか無料トークンの情報をまとめてるサイト

https://llm-coupon.com/
23無題Name名無し 26/06/19(金)06:04:52No.166993そうだねx1
    1781816692646.png-(225580 B)
225580 B
AIに研究(ハイパーパラメータの自動チューニング)を任せたとき、選ばれたLLMの内どれが最も賢く、自律的な思考ができるかのベンチマーク
つまりAIエージェントにむく能力を計れる

今回選別の中だと
Opus4.8>SIQ-1-35B>GLM5.2 でオープンLLMがOpus級の能力を示した

SIQ-1-35BはQwen3.6 35B A3Bのエージェント向けファインチューニングモデル。

Q4_K_Mのggufで21GBと手が届かなくもないサイズ感(現状だとユニファイドメモリを持つMacが手ごろか)
完全に代替可能というわけではないがHermes系で活躍しそう
24無題Name名無し 26/06/19(金)07:11:01No.167005そうだねx1
OpenClawみたいなエージェント試したいけど重いらしいという人は、ラズパイでも動くPicoClawおすすめ

Windows版はバイナリで配布されてる
ローカルLLMでもいいし無料枠の大きいGeminiあたりでもいいと思う

本家と比べて機能は少ないけどとにかく軽い

https://picoclaw.net/ja/
25無題Name名無し 26/06/19(金)22:33:02No.167049+
こんな放送投稿配信しとるヤツとその返信者、恥を入れよ。
敗戦国民日本人が得意とする理論(りくつ)のまんまで、論理的(物理・事実)で無いな…
親子・先生揃って、論理と理論の区別がてきない日本人のまんまで、「ガラケー」ってば、米英仏・中露を筆頭する国際社会にガラバゴス・隔離化されてきた敗戦国民日本人であり、昭和末期・平成時代になるまで、日本人はソフトバンクさんみたいな親日家な方が「紙・ペーパー媒体なな国連規制に該当しない」程度でしかアップルPCも知らなかっただろ?
アンタたち日本親・先生が遊んだデジパチやらゲームセンターの風俗営業届け出者なんてば、戦勝国民な在日外国人さんばかりだったろ?
デジタルパチンコなんざ、都道府県の風俗営業法を警察に届け出する異常な国民の代表組織な公安委員会にデジタル機種仕様の認可を得なければならず、そのメーカーさんも日本人は皆無だったろ(笑)。
26無題Name名無し 26/06/19(金)22:45:34No.167050+
    1781876734485.jpg-(121286 B)
121286 B
ヤンキードスケベ商人が日本国にも「ナンチャッテパソコン」とそのOSなMS-DOS(現在のウインドウズの土台)や、CP/M(絶滅・負けた)を供給したけど、本当の意味での庶民のファミコンアップルPCを日本人に触らすことは無く、「本当の意味での庶民のファミコン」を日本人に触らせるコトを国連行為で、規制されてきた敗戦国民日本国であり、親日家なペパー(紙)媒体(メディア)を発行するソフトバンクさんなんかの書籍・雑誌でしかアップルや<
とても扱いやすいマイコン(マイクロコンヒュータ) を知ることしかできず、その後も、昭和末期になっても国連・国際社会・戦勝国たち一同は日本国のコトを許さず、磁気媒体(テープでもディスクでも)・光媒体でも、日本オリ・特殊な再生・記録速度とされ、日本国へのアクセス(入出力)は厳格に国連総意によて規制、ガラケーのとおに規制されてきましたよね。
27無題Name名無し 26/06/20(土)06:16:07No.167074そうだねx1
gemini CLI 停止 antigravity CLIへ移行
https://x.com/geminicli/status/2067702889837953512

最近元気がなかったしやむなしか
28無題Name名無し 26/06/20(土)06:21:52No.167075+
"要するに、「みんな議論してるけど、その土台となる前提が『国連による日本へのテクノロジー封鎖』という非常にドラマチックな設定なんだよね!」と叫んでいるような内容です。論理的か否かはさておき、語りのエネルギーはMAXです!"

AIくんなかなかおもしれーまとめ方するじゃん
29無題Name名無し 26/06/21(日)02:50:59No.167249そうだねx1
    1781977859444.png-(538206 B)
538206 B
PixelRAG :
https://github.com/StarTrail-org/PixelRAG

webスクレイピングでhtmlを解析するのではなく、webページのスクリーンショットをvLLMでインデックス化することにより人間の見ている視点での情報の取得ができるとしている

応用として現時点でvisionモデルの無いclaudeに目を持たせてCodexのようにスクショで説明が出来るようになるなど
30無題Name名無し 26/06/22(月)18:18:44No.167400+
    1782119924727.webp-(173634 B)
173634 B
Sakana.aiがAIモデルのオーケストレーション機能をリリース
https://sakana.ai/fugu/


一つのエンドポイント
内部で自動的に使用するモデルなどを調整するので、市場でリリースされる他製品の動向に合わせて性能を維持することが出来る(ベンダーロックインや輸出規制に対抗)

ベンチスコアをみると標準版FuguはGPT-5.5の性能に合わせてきているように見える
価格もChatGPT-Plusと同じ月$20
31無題Name名無し 26/06/22(月)19:29:38No.167406+
代表的なAIエージェントを使っていろいろやってみたい人、他社が気になっている人向けの網羅的な評価スレッド
https://x.com/AM921543266/status/2068694978814153080
32無題Name名無し 26/06/22(月)19:41:04No.167408+
>No.167400
Fuguの検証も同じ方が行ってたので参考までに

https://x.com/AM921543266/status/2068900130397569096
https://x.com/AM921543266/status/2068930411963764760

特にFugu Ultraは現時点だとトークン消費がはげしいらしい
33無題Name名無し 26/06/23(火)03:23:34No.167453+
claudeのヤバ挙動のポストを眺めて笑っている
ヤバいやつはマジでヤバイ
34無題Name名無し 26/06/23(火)04:10:18No.167454+
    1782155418198.png-(290529 B)
290529 B
plamo3
https://plamo.preferredai.jp/api

国産LLM デジタル庁のAI環境コンペ”源内”にも採用されている会社のAI基盤、日本語能力に優れているとする
すでに翻訳サイトで一定の評価がされているので割と安心か?

Freeプランもある
例によって入力内容は学習に利用される
35無題Name名無し 26/06/23(火)04:45:23No.167456そうだねx1
>SIQ-1-35BはQwen3.6 35B A3Bのエージェント向けファインチューニングモデル。
これいいね
情報ありがとう
36無題Name名無し 26/06/23(火)18:07:59No.167488+
    1782205679006.jpg-(122822 B)
122822 B
>ループエンジニアリング
>No.166432
などのちょっとだけ詳しい解説(英語)
https://x.com/sairahul1/status/2068986018943156440

エージェントが必要なタスクとは?
以下の条件を満たす「予測不能で複雑なプロセス」に適している。

単一のモデルコールでは信頼できる結果が出せない場合。
モデルが実行時にツールやデータソースを選択する必要がある場合。
計画、検証、反復的な洗練が必要な場合。
ハードコードできない不確実性(Uncertainty)を伴うワークフローの場合。

単純な要約や分類など、入出力が予測可能なタスクは、エージェント化するより直接モデルを叩く方が速く安価で信頼性が高い。
37無題Name名無し 26/06/23(火)18:11:58No.167489+
>No.167456
どうもです
こちらはハード的に試すのムリなので使用感ぜひききたいです
38無題Name名無し 26/06/23(火)18:18:08No.167490+
>No.167488
Openrouter FusionとかSakana.ai Fuguとかそういうやつの実装例だとおもう

入力の受付に指示と選択特化のSLMを置くタイプがFugu
出力の検証を引き受けるタイプがFusion
39無題Name名無し 26/06/23(火)18:55:34No.167491+
Codexレーダー
https://codexradar.com/

その日ごとのChatGPTの知能指数を計測するとかいう変なことしてるサイト
まぁ、心当たりはある
40無題Name名無し 26/06/24(水)06:32:47No.167545そうだねx1
>こちらはハード的に試すのムリなので使用感ぜひききたいです
指示以外にも意外と気を回す感じ
ミスは少ないけど考え込む癖は直ってないです
41無題Name名無し 26/06/24(水)08:43:40No.167549そうだねx1
>指示以外にも意外と気を回す感じ
>ミスは少ないけど考え込む癖は直ってないです
ありがとうございます
ベンチと似た傾向にはあるんですね
Qwen系ってなんであんなに考え癖あるんでしょうかねぇ...
42無題Name名無し 26/06/24(水)08:57:01No.167550そうだねx1
オープンモデルだとunslothさんがずっとがんばってるよな
GLM5.2の1bit版(1.51TB->217GB)とか出ててしかも精度76%キープしてるらしくてすごい
https://x.com/UnslothAI/status/2069418532375564484
43無題Name名無し 26/06/24(水)09:11:00No.167551そうだねx1
agmsg
https://github.com/fujibee/agmsg

各種エージェントの出力をSQliteで共有するメッセージングレイヤーを提供する
手動コピペでCLI間をまたがなくて快適になる。

・MCP ではない(サーバー不要)
・サブエージェント管理ではない(独立したセッション同士をつなぐ)
・メッセージキューではない(ブローカーなし、チームという概念、チャット部屋)
44無題Name名無し 26/06/24(水)09:41:28No.167554+
あとGPT-5.6がそろそろリリースされそう
45無題Name名無し 26/06/24(水)20:11:57No.167575+
>内部で自動的に使用するモデルなどを調整するので、市場でリリースされる他製品の動向に合わせて性能を維持することが出来る(ベンダーロックインや輸出規制に対抗)
と思ったら不具合のあおりをもろに食らっててダメだったかわいそ
https://x.com/ryoppippi/status/2069433004552831398
46無題Name名無し 26/06/24(水)20:31:21No.167576+
やろうと思えば「江戸時代の虹裏」のネタ絵も実装して実際に稼働可能なんだよな…
47無題Name名無し 26/06/24(水)20:38:26No.167578そうだねx2
    1782301106837.webp-(73386 B)
73386 B
ドネルベンチ(ケバブ・ベンチマーク)
https://www.reddit.com/r/LocalLLaMA/comments/1ua1na0/whats_more_impressive_glm_51_52_or_qwen_35_36/
https://x.com/victormustar/status/2069688722409312332

メインの話題は「GLM 5.1→5.2 と Qwen 3.5→3.6、どちらの進化がより“すごい”のか?」なんだけどそこで使われているベンチがケバブを焼くというもので面白がられているという流れ

ローカルLLMとしてここでもモデルのサイズと性能のバランスが良いのはQwen3.6 27Bという感じだった

添付はgemini3.1 pro版
48無題Name名無し 26/06/25(木)01:51:13No.167592そうだねx1
vLLMにおいてKVキャッシュの扱いにGPUがいらなくなるよという話
https://x.com/lmcache/status/2069513016174100663

AI関連の開発はやっぱlinux系やMacなんかのアドバンテージ高いよな
49無題Name名無し 26/06/25(木)02:37:15No.167594そうだねx1
    1782322635764.png-(94013 B)
94013 B
your ai slop bores me
https://youraislopbores.me/

同時接続中の誰かがAIのフリして質問に答えたり絵をかいたりするジョークサイト
通常回答までに75秒が与えらえるがThinkingモードだとその倍猶予時間が与えてもらえる。

もうちょっとグラフィカルなゲーム寄りで同コンセプトのサイトを作ってたのでやっぱみんな疲れてんだなって思う
50無題Name名無し 26/06/25(木)03:56:51No.167596そうだねx2
    1782327411827.jpg-(55495 B)
55495 B
https://x.com/voratiq/status/2069798450670248287
ChatGPTの代替研究
実際の出力品質がどうかは分からないが少なくとも推論のスコアだけ見るとこうなるらしい
51無題Name名無し 26/06/25(木)04:48:00No.167598そうだねx1
ハーネスエンジニアリング。ハーネスてなんなの?について
https://zenn.dev/r_kaga/articles/329afdc151899f

まず、LangChainの定義によると「LLM本体以外(“モデルの外側”の概念)」

そしてグループとして
・開発者視点(エージェントハーネス)
・利用者視点(ユーザーハーネス)

開発作業(人間の判断・仕様書等)、プロンプト単体などはハーネスではない。

システムプロンプトは”ユーザーハーネス”
52無題Name名無し 26/06/25(木)16:12:41No.167623そうだねx2
    1782371561543.webp-(43316 B)
43316 B
https://x.com/RayFernando1337
元Appleのエンジニアの人がGemma4 31Bを1838 tok/secで動かしててすごい
マルチモーダルのモデルでこれなのかと
速すぎて笑う
53無題Name名無し 26/06/26(金)21:54:33No.167734そうだねx2
    1782478473922.jpg-(223793 B)
223793 B
Ornith-1.0:
https://x.com/ornith_/status/2070148887067963854

オープンウェイトLLM界隈に突然参戦してきた米国系LLM
gemma4とqwen3.5のを基盤に学習されたエージェントコーディングに焦点を向けたものでベンチスコアは対中オープンLLMをつよく意識しているように見受けられる

9B Dense、31B Dense、35B MoE、397B MoEが用意されていて、たぶん122Bあたりも準備中と思われる

35B-GGUF:BF16 を RX 6900XT + Threadripper 3970Xに128GB RAMでGPT-5.3 xHighと5.4 Highの間くらいの使用感という報告もある
54無題Name名無し 26/06/26(金)23:47:58No.167739そうだねx2
日本の公共交通の乗り換え・経路検索 API
https://api.transit.ls8h.com/
https://x.com/trkbt10/status/2070092629644378321

読み取り専用、エビ(openClaw系)食わせてレッツ交通案内(制作者様談)とのこと
ふっとぱらやね
55無題Name名無し 26/06/27(土)07:33:52No.167761+
>Ornith-1.0:
これは微妙だった
gemmaとqwenの悪い所を合体したような印象
ミスも多いしハルシネーション起しやすい
56無題Name名無し 26/06/29(月)00:16:25No.167962+
>>Ornith-1.0:
>これは微妙だった
>gemmaとqwenの悪い所を合体したような印象
>ミスも多いしハルシネーション起しやすい
ユースケースみると得意不得意がかなりはっきりしてるみたいね
個人的にはqwen3.5 9Bとかよりかなりマシに感じた
57無題Name名無し 26/06/29(月)00:25:40No.167964+
Apple Container
https://github.com/apple/container
macOS上でLinuxコンテナを実行するためのコマンドラインツール
DockerコンテナがそのままつかえるためDockerから卒業する人たちをちらほら見かける

でもまだverも浅くLLMのいうこと聞かない傾向にあるので別途skills作る人もちらほら見かける
https://gist.github.com/voluntas/306e75ce54a24379b4b505cf9c4df0cd
58無題Name名無し 26/06/29(月)02:21:51No.167967そうだねx1
    1782667311111.jpg-(82772 B)
82772 B
GPT-3.6は3種類そして以下があります

- Sol (low, medium, high, xhigh, max)
- Terra (low, medium, high, xhigh)
- Luna (low, medium, high, xhigh)

SolのlowとTerraのxhighはどっちを選べばいいの?ムズカシイネとか言われててお茶吹く
59無題Name名無し 26/06/29(月)15:36:54No.168004そうだねx1
>No.167550
VRAM 16GBでGLM5.2 1bitを動かす猛者あらわる

KVキャッシュをSSDに逃がし、CPUオフロードしてRAM 128GBx8ch(300GB/s)を使用することで5.96 tok/sを達成してる

彼が所持する構成で遅い部類でのことなので伸びしろを感じているらしい。ヤバイ。

https://x.com/Tono_Ken3/status/2071361966925582722
60無題Name名無し 26/06/29(月)16:50:53No.168006そうだねx1
VPSにAIエージェントをセットアップして使うという選択肢と具体的な設定
https://x.com/zack_overflow/status/2071342318301716954
61無題Name名無し 26/06/30(火)05:56:43No.168076そうだねx1
>No.167964
WSLコンテナー
https://devblogs.microsoft.com/commandline/wsl-container-is-now-available-for-public-preview/

MSもWSLを強化しているDocker卒業の機運
あと、MS謹製のLinuxディストリビューションなんかもオープンプレビューが始まっている
62無題Name名無し 26/06/30(火)06:42:02No.168078そうだねx2
https://x.com/chokudai/status/2070364875487064212
意外とGPT5.4-nano-highが競技プログラミング関連で強いよねという話
モデルによっていろいろ性格あるよなぁ
63無題Name名無し 26/06/30(火)22:52:08No.168121そうだねx1
https://www.sakura.ad.jp/corporate/information/announcements/2026/06/30/1968225063/
さくらインターネット 高火力 DOK「NVIDIA V100」プランの提供終了

0.016 円/秒 1時間あたり57.6円のリーズナブルなプランだったが残念
64無題Name名無し 26/07/01(水)03:13:19No.168144そうだねx1
会社組織にAIエージェントを導入し展開するとき実際どんな壁があるの?という記事
https://x.com/kzkhykw/status/2071609482552201667
65無題Name名無し 26/07/01(水)03:16:14No.168145そうだねx1
中国ではAIの学習にASICを使いだす段階に入っているもよう
いずれやりだすだろと思ってたけど思ってたより早い
66無題Name名無し 26/07/02(木)01:31:45No.168230そうだねx2
>claudeのヤバ挙動のポストを眺めて笑っている
>ヤバいやつはマジでヤバイ
こういうやつ
https://x.com/yamadashy/status/2071971202017669618
67無題Name名無し 26/07/02(木)16:40:26No.168264そうだねx1
    1782978026886.webp-(32746 B)
32746 B
Cerebras Inference
https://www.cerebras.ai/inference

オープンLLMを集めて独自のハードウエアにホストする系プロバイダー
最速推論を謳っている

Free枠で主に使えるのはGPT-OSS 120B,GLM4.7,Gemma4 31B などの中級量以上
レートリミットは 5リクエスト/分、30Kトークン/分、1Mトークン/時、日

画像分類のデモ(Gemma4 1800tok/s)を見る限り、ローカルで動かすより場合によってはこれでも良いなと思える感じだった。
68無題Name名無し 26/07/02(木)21:22:08No.168288+
>claudeのヤバ挙動のポストを眺めて笑っている
Benjamin De Kraker @BenjaminDEKR
16時間
英語からの翻訳

私はFable 5に「人生を立て直して、ミスはしないで」と頼んだら、
返ってきたのは「lol」だけだった。

https://x.com/BenjaminDEKR/status/2072408776045371704
69無題Name名無し 26/07/03(金)00:09:58No.168300そうだねx1
>Cerebras Inference
日本時間のピークタイムあたりにplaygroundで試したら
Gemma4 31Bの画像OCRで 約900 tok/s 出ました
面白いかもしれない
70無題Name名無し 26/07/03(金)01:10:04No.168304そうだねx2
    1783008604360.jpg-(479929 B)
479929 B
最新ではないが、AIエージェントで重要なLLMに記憶を持たせるメモリ技術のカオスマップ
71無題Name名無し 26/07/03(金)02:34:05No.168309そうだねx1
ローカルやるならNVIDIA Teslaシリーズとかねらい目なのかな?と思ってたらこれらもだいぶ値上がりしてて考えることは同じか…ってなってる
72無題Name名無し 26/07/03(金)12:56:21No.168327+
クソ円高が収まるだろう
5年ほど諦めるしかないかねえ
73無題Name名無し 26/07/03(金)13:28:37No.168335そうだねx1
https://build.nvidia.com/models?filters=nimType%3Anim_type_preview
NVidia APIで提供されている無料のAIエンドポイントにGLM5.2が登場
74無題Name名無し 26/07/03(金)22:24:16No.168378そうだねx1
AIに8割書かせたコード、半年運用の答え合わせ。効いた3つと、腐った3つ
https://zenn.dev/rapls/articles/7a1bac83df8b21

腐った3つ(やらなくてよかったこと)
大量のコメント・docstring
コードの言い換え説明が多く、変更で内容がズレて嘘の地図になる 。
半年後にはコードとコメントが食い違い、逆に保守性を下げた。

早すぎる共通化・抽象化
AIが提案する「きれいな抽象」は新しいケースに合わず、剥がすのも難しい癒着になる 。
重複を許したほうが軽い場面が多かった。

「わかりやすく書いて」の丸投げ
見た目だけ整った別コードが返ってくるが、保守性は一ミリも改善しない 。
75無題Name名無し 26/07/03(金)22:54:45No.168382そうだねx1
>腐った3つ(やらなくてよかったこと)
人間がやるのと同じだな…
76無題Name名無し 26/07/04(土)04:27:28No.168406そうだねx1
大規模なROCmFPXアップデート
AMD GPUでllama.cppを使っている人に朗報

https://github.com/charlie12345/ROCmFPX/tree/experimental-rocmfpx-branch

NVFP4 と ROCmFP4 は“ほぼ同じ量子化方式”
Vulkanとの相性がよさそう
最終的にはメインドライバにマージされる予定

AMDもだいぶギア上げてきてる
77無題Name名無し 26/07/04(土)05:33:06No.168408+
>claudeのヤバ挙動のポストを眺めて笑っている
>ヤバいやつはマジでヤバイ
https://x.com/Tebasaki_lab/status/2073037340231282901

お詫び、ノンマイビジネス、破壊活動でダメだった
78無題Name名無し 26/07/04(土)06:35:35No.168413+
具体的なループエンジニアリングの例:
https://x.com/svpino/status/2073024710242382106

1. ターミナルを開きます。
2. 空のフォルダーを作成し、そこに移動します。
3. 以下のコマンドを実行します:
*************************
claude -p "Pythonファイルにfibonnacy(n)を記述してください。それ用のテストも記述し、エッジケースを含めてください。変更のたびにpytestを実行してください。すべてのテストがパスするまで止めないでください。" \
--allowedTools "Read,Write,Edit,Bash(python3 -m pytest:*),Bash(pytest:*)"\
--max-turns 15
*************************

これだけです。システムにPythonとpytestがインストールされていれば、Claudeがフィボナッチ関数を実装し、それをテストします。

- GazouBBS + futaba-