人工知能@ふたば
[ホーム]

[掲示板に戻る]
レス送信モード
おなまえ
E-mail
題  名
コメント
添付File []
削除キー(記事の削除用。英数字で8文字以内)
  • 添付可能:GIF,JPG,PNG,WEBM,MP4. 8000KBまで. 現在17人くらいが見てます.
  • スレッドを立てた人がレスを削除してスレッド内のみアク禁にできます.
  • メール欄に「id表示」と入れてスレッドを立てるとid表示にできます.
  • メール欄に「ip表示」と入れてスレッドを立てるとip表示にできます.
  • 削除依頼が閾値を超えるとidを表示します.
  • 生成系AI,ChatGPT,Stable Diffusion,自動運転など
  • 管理人への連絡は準備板 ご意見へ. 削除依頼は記事番号を押しdelを押して下さい.
  • スマホ・携帯ふたば入口 この板の保存数は20000件です. 規約
  • 新しい板: 人工知能 ZOIDS

画像ファイル名:1722371813751.jpg-(31692 B)
31692 B無題Name名無し24/07/31(水)05:36:53No.78306そうだねx2 19日11:03頃消えます
AI関連のニューススレ
名無しが集めてきてくれるトピックス好きなんだけど
長いこと立ってなかったので
このスレは古いので、もうすぐ消えます。
削除された記事が2件あります.見る
1無題Name名無し 24/07/31(水)09:04:46No.78325+
動画内アイテム識別AIモデル「SAM 2」
https://www.itmedia.co.jp/news/articles/2407/30/news093.html
2無題Name名無し 24/07/31(水)14:58:05No.78349+
    1722405485131.png-(987495 B)
987495 B
この手のニュースに獣人が増えまくってる
3無題Name名無し 24/07/31(水)14:58:54No.78350+
    1722405534465.png-(1228816 B)
1228816 B
本文無し
4無題Name名無し 24/07/31(水)15:31:47No.78352そうだねx2
    1722407507683.jpg-(62532 B)
62532 B
AI作画によるマンガがジャンプルーキーでランキング入り
良い試み
https://rookie.shonenjump.com/series/zGZPbQ8HeDw
5無題Name名無し 24/07/31(水)15:37:45No.78353+
    1722407865346.jpg-(123275 B)
123275 B
個人勢のファインチューニングによるLLMモデルが標準的なベンチマークElyzaTasks-100のスコアにて企業勢のモデル(o4-miniなど)を超えてしまうという快挙
https://huggingface.co/HODACHI/Llama-3.1-70B-EZO-1.1-it
6無題Name名無し 24/08/02(金)02:28:53No.78537+
どこよりも学習素材をかかえてると思わしきgoogleの進撃が始まったな…
7無題Name名無し 24/08/02(金)09:02:04No.78563+
gemini-1.5-pro-exp-0801がChatbot Arenaで一位
Google AI Studioですでに触れるらしい
https://x.com/shanegJP/status/1819145571040743639
8無題Name名無し 24/08/02(金)10:30:52No.78569そうだねx2
AMD製プロセッサに最適化した画像生成AI「Amuse 2.0 Beta」
https://gigazine.net/news/20240730-amd-amuse-2-beta/

構築できるならzluda環境のほうが現状はマシだな……今後に期待
9無題Name名無し 24/08/02(金)11:46:51No.78574+
GitHubから「GitHub Models」が発表
https://japan.zdnet.com/article/35222291/
プレイグラウンドでここで上がってるモデルが無料で使えるっぽい?
10無題Name名無し 24/08/02(金)13:19:46No.78583そうだねx3
    1722572386150.webp-(81724 B)
81724 B
FLUX.1
Black Forest Labs(BFL)による画像生成AI
かねてより噂されていた一部SDの開発者たちによる新規モデル
https://github.com/black-forest-labs/flux

デモ:
https://huggingface.co/spaces/black-forest-labs/FLUX.1-schnell
https://replicate.com/black-forest-labs/flux-schnell

ComifyUIの出力例
https://x.com/PhotogenicWeekE/status/1819214182375649369
11無題Name名無し 24/08/02(金)17:36:55No.78608そうだねx2
FLUX.1なかなか評判いいな
これはStable Diffusion世代交代しちゃうかも
12無題Name名無し 24/08/02(金)19:09:28No.78623そうだねx2
漫画制作を爆速化! 生成AIをフル活用して時短してみた
https://ascii.jp/elem/000/004/211/4211356/
13pを1日
13無題Name名無し 24/08/02(金)20:40:00No.78650+
スレ立てあんがと
それなりにニュースはあったが
面倒で立ててなかったw
14無題Name名無し 24/08/02(金)21:45:55No.78663そうだねx1
    1722602755621.png-(527370 B)
527370 B
AI獣人ニュース
15無題Name名無し 24/08/02(金)23:15:23No.78672そうだねx1
フィギュアに使えるくらいの3Dデータが出れば嬉しいけどそれはまだ遠いか…
16無題Name名無し 24/08/04(日)11:33:40No.78869そうだねx1
FLUXの素の画質はミッドジャーニー似っぽいね
17無題Name名無し 24/08/04(日)21:30:49No.78925+
    1722774649238.jpg-(176648 B)
176648 B
>フィギュアに使えるくらいの3Dデータが出れば嬉しいけどそれはまだ遠いか…

これなんてどうだろね?

>3Dモデリングに挫折した人は、全員Meshyを使ってみた方が良い。「無料」かつ「1分」で、高品質な3Dモデルが生成できて楽しい。3Dモデリングしてる人も、テクスチャのみ生成する機能などで武器が増える。リプ欄にわかりやすい使い方を貼りました↓
https://x.com/hirochuu8/status/1817046820175949917
18無題Name名無し 24/08/04(日)21:43:02No.78928+
早速鮫人やウサギ人が出てきたな…
19無題Name名無し 24/08/05(月)15:37:07No.78998そうだねx1
    1722839827732.png-(229506 B)
229506 B
>No.78663
雑に試してみた
対象は偶々目についた焼肉器
出来た3Dモデルは一見それっぽいようだけど
回転させると歪みまくっていて早速怪しい…
https://huggingface.co/spaces/stabilityai/stable-fast-3d
20無題Name名無し 24/08/05(月)15:41:46No.78999そうだねx1
    1722840106548.png-(155872 B)
155872 B
Stable Fast 3DのデモページからDL出来るのはGLB形式のみだったので
テキトーなWEBサービスでOBJ形式に変換してからMeshmixerで確認
サイズが1mm以下じゃん…
指定できないからしょうがないんだけど寸法がテキトー
21無題Name名無し 24/08/05(月)15:44:31No.79000そうだねx2
    1722840271643.png-(183029 B)
183029 B
3Dプリンタ用のスライサに取り込んで100倍に拡大
ボコボコ過ぎてとても出力に耐えられるものではないですね
という結果になりました
22無題Name名無し 24/08/05(月)16:09:50No.79001そうだねx1
    1722841790008.png-(597294 B)
597294 B
>No.78925
Meshyの方も試してみました
テキトーにプロンプト入れてバニーさん
この段階では良い感じですね
stlでもDLできるので一手間省ける

https://www.meshy.ai/discover
23無題Name名無し 24/08/05(月)16:12:16No.79002そうだねx1
    1722841936764.png-(202557 B)
202557 B
そしてSTLをMeshmixerで確認
こっちもサイズ1mm以下になるんか
24無題Name名無し 24/08/05(月)16:16:53No.79003そうだねx5
    1722842213232.png-(99011 B)
99011 B
スライサに取り込んで100倍
ちょっとラフ造形すぎますねー
スカルプトモデリングの土台にはなるかも?くらいですね

結論:AI生成ではフィギュアに使えるクオリティの3Dデータは(現時点では)無理っぽい
自分で3Dモデリングしよう!

連投失礼しました
25無題Name名無し 24/08/06(火)06:49:16No.79085そうだねx7
検証ありがたい
26無題Name名無し 24/08/06(火)12:42:10No.79114そうだねx1
>AI作画によるマンガがジャンプルーキーでランキング入り
顔のアップばっかりで笑った
27無題Name名無し 24/08/06(火)22:41:56No.79143+
書き込みをした人によって削除されました
28無題Name名無し 24/08/06(火)22:52:00No.79144+
>全ページ画像生成AI漫画 [ヘヴニーズ・コード]

https://rookie.shonenjump.com/series/EmTZ65sK0B8

やっぱり、話と演出がでたらめだと
読んですらもらえないな・・
29無題Name名無し 24/08/06(火)22:52:18No.79145+
>AI作画によるマンガがジャンプルーキーでランキング入り

マンガとしてはデタラメだが
可能性は大いに感じるな

つか、このあたりはプロのほうが使いこなしてそう
30無題Name名無し 24/08/06(火)22:59:09No.79148+
このあたりの人は
大っぴらには言えないだろうが
もうかなり使ってそう
https://cgworld.jp/magazine/cgw303.html
31無題Name名無し 24/08/06(火)23:01:16No.79150+
>https://rookie.shonenjump.com/series/EmTZ65sK0B8

1年前くらいの、すぐに漫画に応用しようとして
拙速な作品を作った人はだいたいもう飽きたみたいだね

そろそろ地に足がついた、
もともと漫画を描いていた人たちが少しずつ応用してきてるかんじ
32無題Name名無し 24/08/06(火)23:37:25No.79152+
https://forest.watch.impress.co.jp/docs/news/1613961.html
月額+無料タイムはあれど分単位課金か…
33無題Name名無し 24/08/07(水)00:04:18No.79156+
>利用には1分6.6円の料金がかかる。

・・か。
出力にかかった時間だけ、だよね?
とりあえず人柱志望者をXで探すか・・
34無題Name名無し 24/08/07(水)00:20:14No.79158+
AIで検索しても、ほとんどAI作画は出ないな・・
まあジャンプの作風に合わないのはわかるけど

https://rookie.shonenjump.com/search?query=AI
35無題Name名無し 24/08/07(水)01:03:55No.79174+
https://forest.watch.impress.co.jp/docs/news/1613961.html

の人柱を探してみた
https://x.com/search?q=ConoHa%20AI%20Canvas&src=typed_query&f=top

あんまり評判良くないな
36無題Name名無し 24/08/07(水)07:52:49No.79212+
Figure 02発表
https://x.com/Figure_robot/status/1820791819023909031
S2Sがあるならデモで紹介しろや
37無題Name名無し 24/08/07(水)08:01:31No.79214そうだねx1
GPT-4o(miniも)のAPIで構造化出力導入
https://x.com/OpenAIDevs/status/1820876430764634115
地味にGPT-4oの金額半額になってるな
38無題Name名無し 24/08/07(水)14:34:05No.79239そうだねx1
    1723008845290.jpg-(171696 B)
171696 B
自分の作品に似たAIイラストがあったときの対応方法 文化庁が解説
https://ascii.jp/elem/000/004/213/4213761/
39無題Name名無し 24/08/07(水)14:38:58No.79240そうだねx1
>3Dモデリングに挫折した人は、全員Meshyを使ってみた方が良い。
ゴブリンとかモンスター程度ならキャプったのをi2iして素材にすれば使えそうね
40無題Name名無し 24/08/07(水)14:49:47No.79241そうだねx1
AIの消費電力を最大2500分の1に削減する「CRAM」を研究者が実証
https://gigazine.net/news/20240807-ai-energy-consumpiton-by-up-to-2500-times/
一部の人がAI否定の理由にしてた事が解消されるんかな
41無題Name名無し 24/08/07(水)21:11:30No.79278そうだねx1
AI小説は増えてるのに漫画の内容をAIに作らせてる人はほとんどいないのか

https://rookie.shonenjump.com/series/zGZPbQ8H7P0
https://rookie.shonenjump.com/series/zGZPbQ8MBcw
42無題Name名無し 24/08/09(金)04:05:57No.79396そうだねx1
オープンでMath性能がダントツのQwen2-Mathがリリース
https://x.com/Alibaba_Qwen/status/1821553401744015816
43無題Name名無し 24/08/09(金)06:46:17No.79406そうだねx2
Qwenはいろいろと成績いいと聞くね
44無題Name名無し 24/08/13(火)14:03:19No.79897そうだねx1
Sakana AIから自動的に科学研究を行うシステム「AI Scientist」が発表
https://sakana.ai/ai-scientist/
45無題Name名無し 24/08/14(水)02:46:56No.79968そうだねx2
これは良スレ
46無題Name名無し 24/08/14(水)06:07:20No.79975+
SAKANA.aiはLLM応用の分野に舵切ってるな
47無題Name名無し 24/08/14(水)13:47:49No.80011+
Grok 2 Mini (Beta)がリリースされたらしい画像生成はFLUX.1を使用している模様だが詳細不明速さ的に無料版じゃないかと言われている
48無題Name名無し 24/08/14(水)15:15:54No.80018+
Grok 2 Betaについて公式から発表きてた
https://x.ai/blog/grok-2
49無題Name名無し 24/08/14(水)22:13:40No.80047+
forgeでFLUXを使えるようにするEasyForge

https://github.com/Zuntan03/EasyForge
https://x.com/Zuntan03/status/1822555275380871407


forge自体にもFLUXのLora対応(dev-fp8)入ったみたい
https://x.com/dev_inada/status/1823695701353881909
50無題Name名無し 24/08/15(木)14:39:55No.80095+
FLUX Loraに関するスレッド
https://x.com/HBCoop_/status/1823422286373745064

学習方法などの共有、使用サービスやツールなど
Google Colabでのトレーニング
FLUX.1用のDreambooth
などなど
51無題Name名無し 24/08/21(水)05:33:01No.80970+
GPT-4oのFine-tuningが可能に
https://openai.com/index/gpt-4o-fine-tuning/
52無題Name名無し 24/08/21(水)13:47:27No.81013そうだねx1
2023年のだけどNTTが配布してるLLMについての学習スライド
大規模言語モデル入門 / LLM introduction (SES2023)
https://speakerdeck.com/kyoun/llm-introduction-ses2023?
53無題Name名無し 24/08/22(木)01:09:18No.81094+
    1724256558845.jpg-(394543 B)
394543 B
>ついに、トップ研究者たちが率いるAI企業が最新の画像生成AI「Ideogram 2.0」 を発表
>
>5つのモデル(一般、リアル、デザイン、アニメ風、3D)があり、テキストの描性能画と画像の一貫性で改善してます。
https://x.com/jaguring1/status/1826278815368409122

・・とのこと
54無題Name名無し 24/08/22(木)01:20:46No.81098+
>Ideogram 2.0
実写風だと、今までより頭一つ抜けた感じ?
https://x.com/search?q=Ideogram%202.0&src=typed_query
55無題Name名無し 24/08/22(木)15:51:54No.81161そうだねx1
どうせエロ出せないんでしょ?
だったら要らないかな
56無題Name名無し 24/08/22(木)16:38:27No.81167そうだねx1
midjourneyのweb版を一般公開
Discordアカウントがあれば10枚/日程度を無料で使用可能
https://www.midjourney.com/
57無題Name名無し 24/08/22(木)23:42:38No.81227そうだねx6
>どうせエロ出せないんでしょ?
>だったら要らないかな
これ重要よね…
58無題Name名無し 24/08/23(金)08:21:21No.81253そうだねx2
>どうせエロ出せないんでしょ?
>だったら要らないかな
img2imgの素材にはなる
59無題Name名無し 24/08/23(金)09:10:59No.81254そうだねx3
エロが出せるに越したことはないんだけど健全オンリーでもハイクオリティな女の子出してくれるものが増えるなら色々活用方法はあるからね
エロ禁止すぎて健全画像を出すことすら難儀するパターンになってくるとアレだけど
60無題Name名無し 24/08/23(金)18:53:37No.81285そうだねx2
https://civitai.com/articles/6309

皆大好きPony Diffusionの次世代モデルのベースは
FLUX1でもSD3でもなくAuraFlowになるそうな
61無題Name名無し 24/08/26(月)02:07:27No.81654そうだねx2
ソフトバンクのプロンプト文例集
シンプルなやつ
https://www.softbank.jp/biz/solutions/smb/prompt/
62無題Name名無し 24/08/26(月)08:15:38No.81666+
https://ci-en.net/creator/24768/crowdfunding/761
生成AI被害に対する訴訟費用CFと言うのをやるみたいだが
被害にあったのでやると言うのは構わないがCi-enでリターン無しと言うのは規約違反ではないか?と言う声も上がったりしてる中で続けて
今200万近く上がっている
63無題Name名無し 24/08/26(月)21:21:17No.81746+
    1724674877466.png-(1445735 B)
1445735 B
AI獣人ニュース
yahooでがっつりfurryに触れてる
64無題Name名無し 24/08/27(火)17:43:53No.81857+
Claude Artifactsかなりパワーアップしてるらしいけど電話番号の登録がいるタイプで躊躇しちゃう…
65無題Name名無し 24/08/28(水)11:39:30No.81958+
Geminiがアップデートでモデル3つ公開
https://x.com/OfficialLoganK/status/1828480081574142227
新しくfalsh-8bがあるけどそもそもflashのサイズがいくつかわからんから何が違うのかわかりづらい
66無題Name名無し 24/08/28(水)14:03:33No.81971+
画像生成AIでイラストはどこまでやれるのかトライしてるの良い努力だと思う
https://x.com/GianMattya/status/1828471134553354563
67無題Name名無し 24/08/28(水)14:19:14No.81972+
GameNGen(google)
同じくgoogle開発のTPU上で20fpsの速度で画像出力し続けられる生成モデル
デモではDOOMのプレイを可能にしている。
生成AIを極めていくとゲームエンジンになるのおもしろすぎる…
https://x.com/_akhaliq/status/1828631472632172911
68無題Name名無し 24/08/28(水)15:42:55No.81976+
秒間20枚くらいその場その場でゲーム画面を出力してそれでゲームのプレイを可能にしてるってこと?
もうちょっと進んだら架空のゲームとかアニメ映画とか作れそうだな…
69無題Name名無し 24/08/29(木)01:10:10No.82050そうだねx3
    1724861410088.jpg-(262949 B)
262949 B
GenWrap:
一枚の画像から生成した深度情報を元にカメラを動かしてポーズをキメ、新たな見た目を生成する
https://huggingface.co/spaces/Sony/genwarp
70無題Name名無し 24/08/29(木)02:21:29No.82059+
>秒間20枚くらいその場その場でゲーム画面を出力してそれでゲームのプレイを可能にしてるってこと?
してるらしい
しかもモデル部分はStableDiffusion v1.4の拡張版とのこと

論文
https://arxiv.org/pdf/2408.14837
71無題Name名無し 24/08/29(木)02:53:21No.82060+
"原文の翻訳:
「具体的には、アクションに基づいて、各アクション(例:特定のキーボード入力)を1つのトークンにエンコードした埋め込み Aemb を学習し、テキストからこのアクションシーケンスにクロス注意力を置き換える。」

これが何を表しているか:
上の文は、自然言語処理(NLP)や対話系AIにおけるモデル設計の特徴について説明しています。ここでは、クロス注意力機構 (Cross Attention) がアクション(キーボード入力などの操作)の情報に置き換えられる仕組みが提示されています。
通常、クロス注意力はテキスト生成や質問応答のモデルで使われますが、この文では、アクション(ユーザーのインタラクション)をシーケンスとして学習し、それを元にしてモデルが情報を取得・操作するように設計しています。このアプローチにより、AIシステムは特定の入力アクションに基づいて、より正確で意味的な応答や動作を行うことができるようになります。"
72無題Name名無し 24/08/29(木)03:07:55No.82061+
"上の英文を翻訳し、何が起きているのかを日本語で説明して。"ってpromptわりと便利かもしれん
73無題Name名無し 24/08/29(木)04:45:47No.82062+
書き込みをした人によって削除されました
74無題Name名無し 24/08/29(木)04:51:47No.82063そうだねx1
    1724874707690.mp4-(700117 B)
700117 B
CogVideoX(清華大学とZhipu AI)が5Bクラスのt2v動画生成AIモデルをオープンソースで公開したらしいヤバイ
https://huggingface.co/THUDM/CogVideoX-5b
https://x.com/Gradio/status/1828411362214916562

20GBくらいメモリくうらしいのでつよつよPCの名無し頼んだ
75無題Name名無し 24/08/29(木)06:46:02No.82076そうだねx1
Gemini AdvancedでいわゆるGPTsの機能が提供開始
https://blog.google/products/gemini/google-gemini-update-august-2024/
76無題Name名無し 24/08/29(木)22:11:46No.82149+
    1724937106788.png-(1402398 B)
1402398 B
ImageFX(Imagen3)が正式リリース
https://deepmind.google/technologies/imagen-3/

prompt:
Savory sushi and ramen in the vibrant streets of Shibuya, neon lights, night photography, cinematic

p2pを利用した編集機能とかある
77無題Name名無し 24/08/29(木)23:09:39No.82156+
>ImageFX(Imagen3)が正式リリース
>https://deepmind.google/technologies/imagen-3/
>prompt:
>Savory sushi and ramen in the vibrant streets of Shibuya, neon lights, night photography, cinematic
>p2pを利用した編集機能とかある
今訳あって確認出来ない
これbingより綺麗?エロは出せる?
78無題Name名無し 24/08/30(金)06:48:27No.82187そうだねx1
    1724968107722.jpg-(119181 B)
119181 B
Qwen2-VL-72BはほとんどのベンチマークでGPT-4oやClaude3.5 Sonnetを上回る
https://qwenlm.github.io/blog/qwen2-vl/
79無題Name名無し 24/08/30(金)22:01:58No.82258そうだねx1
    1725022918824.webp-(170374 B)
170374 B
1億トークンコンテキストウィンドウのLTM-2-mini
https://magic.dev/blog/100m-token-context-windows
80無題Name名無し 24/08/30(金)23:03:18No.82273そうだねx1
Command RとCommand R+のアップデート
https://docs.cohere.com/changelog/command-gets-refreshed
81無題Name名無し 24/08/31(土)20:05:59No.82391+
>Command RとCommand R+のアップデート
GGUF化済みモデル
https://huggingface.co/models?other=base_model:quantized:CohereForAI/c4ai-command-r-plus-08-2024
https://huggingface.co/models?other=base_model:quantized:CohereForAI/c4ai-command-r-08-2024
82無題Name名無し 24/09/01(日)03:51:10No.82428そうだねx1
カルフォルニア州でAI生成画像に電子透かしをいれる法案が通る模様
SDを始めオープンモデルは滅びそう
adobeやMSなどすでに準備の済んでるプラットフォーマーは歓迎
83無題Name名無し 24/09/04(水)17:38:54No.82868+
    1725439134494.jpg-(127731 B)
127731 B
AI獣人ニュース
https://k-tai.watch.impress.co.jp/docs/column/stapaapple/1620968.html
Webアプリ版「Midjourney」がどんどん便利に! iPhoneやiPadでもほぼ同じUIで利用できる!!!
84無題Name名無し 24/09/05(木)02:24:32No.82947そうだねx1
    1725470672978.jpg-(77192 B)
77192 B
資料を簡単に図解できるAI、「Napkin AI」が
日本語に対応。

https://x.com/search?q=%22Napkin%20AI%22&src=trend_click&vertical=trends
85無題Name名無し 24/09/06(金)05:22:26No.83102+
Reflection 70B
Llama3.1の微調整だけどReflection-TuningによってテストしたすべてのベンチマークでGPT-4oを上回るとのこと
https://x.com/mattshumer_/status/1831767014341538166
来週405B版を出す模様
86無題Name名無し 24/09/06(金)08:36:01No.83127+
Phind 405Bのリリース
HumanEvalで92%でClaude 3.5 Sonnetに匹敵してPhindのプロユーザーなら使える
Phind Instant(8B)もありどちらもLlama3.1の微調整
https://www.phind.com/blog/introducing-phind-405b-and-better-faster-searches
87無題Name名無し 24/09/07(土)13:25:27No.83278+
DeepSeek-V2.5
https://huggingface.co/deepseek-ai/DeepSeek-V2.5
88無題Name名無し 24/09/07(土)16:58:34No.83298そうだねx1
東大、ネズミの脳で絵を描くことに成功 - 日本経済新聞
https://www.nikkei.com/article/DGXZRSP677868_U4A900C2000000/

いよいよSFの世界が近づいてきた感じが
89無題Name名無し 24/09/10(火)06:00:28No.83687そうだねx1
超人的な AI 予測ボット「FiveThirtyNine」
GPT-4oベースで確率を出すだけだけど経験豊富な予測者の集団よりパフォーマンスが同等または高いらしい
https://www.safe.ai/blog/forecasting
デモページもあるよ
https://forecast.safe.ai/
90無題Name名無し 24/09/12(木)09:34:40No.84018+
科学文献のレビューを行うAIエージェント「PaperQA2」
https://x.com/SGRodriques/status/1833908643856818443
91無題Name名無し 24/09/12(木)19:40:43No.84097そうだねx3
>東大、ネズミの脳で絵を描くことに成功 - 日本経済新聞
>https://www.nikkei.com/article/DGXZRSP677868_U4A900C2000000/
ネズミにAIやらせたり毛を生やしたりしてるのに
一向に人間の生活は楽にならず毛も生えない
92無題Name名無し 24/09/12(木)23:55:48No.84151そうだねx5
>東大、ネズミの脳で絵を描くことに成功 - 日本経済新聞
Seed値をネズミの脳に刺した電極から出たノイズで決めてるだけでしょうこれ
絵を描いてるのは100%AIでネズミはただの乱数ジェネレータ
93無題Name名無し 24/09/13(金)02:24:57No.84159そうだねx2
OpenAI o1-preview
https://openai.com/index/introducing-openai-o1-preview/
94無題Name名無し 24/09/14(土)15:53:28No.84405+
>一向に人間の生活は楽にならず毛も生えない
ハゲ発見
95無題Name名無し 24/09/17(火)12:31:55No.84847+
LLMの中核技術であるTransformerの性能に関する論文。
理論上すべての問題を解けるみたいなことを言っててよくわからない
https://x.com/denny_zhou/status/1835761801453306089
96無題Name名無し 24/09/18(水)08:39:50No.84993+
>LLMの中核技術であるTransformerの性能に関する論文。
>理論上すべての問題を解けるみたいなことを言っててよくわからない
>https://x.com/denny_zhou/status/1835761801453306089
LLMに解説してもらったところによるとP/polyは解けるけどNP完全問題は含まれてないようだからそっちは解けないらしい
97無題Name名無し 24/09/18(水)12:25:19No.85004そうだねx1
数学的に解けるものならLLMに出力させる中間トークンしだいでプログラムなしにでも答え出せるよって話しか…
98無題Name名無し 24/09/19(木)10:09:39No.85178+
高度すぎてワイにはよくわからんけど

(理屈の上では)複数のTransformerを何段階もつなげて使っても機能する、だからすごいこともやれる、みたいな話?
99無題Name名無し 24/09/19(木)13:26:55No.85192+
最近出たモデル
MistralからマルチモーダルなPixtral 12B
Mistral Smallアプデとそれに伴って料金下げ
https://mistral.ai/news/september-24-release/
Qwen2.5(サイズは色々)最大の72BはLlama-3.1-405Bクラス
https://qwenlm.github.io/blog/qwen2.5/
100無題Name名無し 24/09/20(金)18:47:46No.85375そうだねx1
kling AIの新機能のモーションブラシ、久々に生成AIで魔法みたいって感動した
101無題Name名無し 24/09/25(水)00:15:56No.86146+
    1727190956537.jpg-(261760 B)
261760 B
とうとうサムアルトマン及びOpenAIがAGI/ASIを宣言。

今後数十年で誰もがパーソナライズされたいくつものAIを率いて、貧富や機会の差を超越して
学び、働き、人類をより有意義になると述べ、
「数千日で超知能を持つ可能性があります」
と宣言。

https://x.com/sama/status/1838262165435802116
102無題Name名無し 24/09/25(水)02:13:36No.86154+
Gemini-1.5-Pro-002とGemini-1.5-Flash-002
https://developers.googleblog.com/en/updated-production-ready-gemini-models-reduced-15-pro-pricing-increased-rate-limits-and-more/
103無題Name名無し 24/09/25(水)04:49:23No.86195そうだねx1
Advanced Voiceを今週中に展開
https://x.com/OpenAI/status/1838642444365369814
すでに展開は始まってるらしい
後声が5つ追加された模様
104無題Name名無し 24/09/26(木)04:23:16No.86382+
Llama 3.2
https://ai.meta.com/blog/llama-3-2-connect-2024-vision-edge-mobile-devices/
なんか90BにしたわりにはQwen2-VL-72Bよりいいかは微妙な感じのベンチマークだな
105無題Name名無し 24/09/26(木)12:36:26No.86430+
    1727321786048.png-(7869 B)
7869 B
新たなオープンソースLLM 「OLMo」
デモサイトでは一通りのマルチモーダルな性能を見せている。4o級の性能はありそう
https://github.com/allenai/OLMo
https://molmo.allenai.org/
106無題Name名無し 24/09/26(木)13:50:57No.86445そうだねx3
HTML2Markdown文章整形専門のモデル
https://x.com/JinaAI_/status/1833861180445860168
https://huggingface.co/jinaai/reader-lm-1.5b

ニッチだけどこういうのもいいよね
107無題Name名無し 24/09/26(木)19:48:25No.86501+
>新たなオープンソースLLM 「OLMo」
>デモサイトでは一通りのマルチモーダルな性能を見せている。4o級の性能はありそう
>https://github.com/allenai/OLMo
>https://molmo.allenai.org/
OLMoEからの派生はMolmoの1Bだけでデモサイトがどれかわからんが4o級の最高のモデルの72BはQwen2 72Bをベースモデルにしてるからあんまり新しい感ないな?
108無題Name名無し 24/09/26(木)21:23:07No.86516+
>あんまり新しい感ないな?
今後リリースされる上位版のやつもデータのカットオフが今年の7月ですでにリリースされてるし見立ては合ってそう
https://huggingface.co/allenai/OLMo-7B-0724-hf/tree/main
109無題Name名無し 24/09/26(木)22:39:24No.86534そうだねx2
    1727357964429.jpg-(266965 B)
266965 B
FluxPro越えのモデルが突然現れた
110無題Name名無し 24/09/28(土)14:19:17No.86795そうだねx1
>FluxPro越えのモデルが突然現れた
どっちのAIの生成した画像がいいかでバトルアリーナ開催してて
突如現れランキングトップになったblueberry、
その正体やオープンかクローズなどはまだ謎に包まれている…ってコト!?
111無題Name名無し 24/09/29(日)10:43:52No.86909+
なぜかプレスリリース出してる企業すらないからな……
どっかの超天才が個人的に作った可能性すらある
112無題Name名無し 24/09/29(日)18:11:21No.86967+
昔ダリ先生のプロジェクトコードがstrawberryだったから
ダリ先生の新バージョンじゃない? って言われてるけどまだわからんね
ちょっとアリーナで60試合くらいしてきたけど自分のトップはblueberry_0だった
ただとしあき好みの虹絵はあまりないからそっち系で強いかはわからんね
113無題Name名無し 24/09/30(月)15:01:14No.87076+
世界一の日本語性能を持つ富士通がCohereと一緒に開発した「Takane」
https://pr.fujitsu.com/jp/news/2024/09/30.html#footnote2
114無題Name名無し 24/10/02(水)13:58:56No.87361+
イラスト系でDanbooruタグの使える新たなSDXLモデル Illustrious XLが登場

https://huggingface.co/OnomaAIResearch/Illustrious-xl-early-release-v0
115無題Name名無し 24/10/02(水)14:09:31No.87363+
>イラスト系でDanbooruタグの使える新たなSDXLモデル Illustrious XLが登場
0.1が示す通りまだ本当に体験版の域だから今後に期待
116無題Name名無し 24/10/03(木)16:12:25No.87489そうだねx1
Gemma 2 JPN
Gemma 2 2Bを日本語でfine-tuneしたもの
https://huggingface.co/collections/google/gemma-2-jpn-release-66f5d3337fdf061dff76a4f1
117無題Name名無し 24/10/03(木)23:48:39No.87533そうだねx3
>FluxPro越えのモデルが突然現れた
これの正体はFLUX 1.1 PROのようだな
https://blackforestlabs.ai/announcing-flux-1-1-pro-and-the-bfl-api/
118無題Name名無し 24/10/04(金)22:15:59No.87673+
MetaからMovie Gen
動画もできるが音も作成できるようだ
https://ai.meta.com/research/movie-gen/?utm_source=twitter&utm_medium=organic_social&utm_content=video&utm_campaign=moviegen
119無題Name名無し 24/10/08(火)03:25:05No.88220+
Flux1.1 pro さんちょっと質問があるんだけどというXスレッド
さすがに目を疑った
https://x.com/minchoi/status/1843003892910760259
120無題Name名無し 24/10/10(木)22:16:14No.88636+
経産省、国内の生成AI各社に支援 「アニメ特化型基盤モデル」「薬学特化LLM」など、計算資源を助成
https://www.itmedia.co.jp/aiplus/articles/2410/10/news155.html
121無題Name名無し 24/10/11(金)04:27:22No.88668+
AI2AIみたいなキーワードまで出だしてるな…
122無題Name名無し 24/10/11(金)12:22:47No.88695+
img2imgが画像から画像を生成するのなら、
AI2AIはcheckpointからcheckpointを生成するのかな
マージモデルかな?(すっとぼけ)
123無題Name名無し 24/10/12(土)15:44:43No.88819+
米OpenAIが対話型生成AI「ChatGPT」を公開した2022年11月30日から24年7月29日までに、中国ではAI関連企業87万8000社が登記されたが、すでに全体の8.9%にあたる7万8612社が登記抹消または営業停止となっていることが分かった。中国メディア「媒体」が報じた。
媒体によると、中国では過去3年間でAI関連企業20万社以上が登記抹消となり、10年間で計35万3000社が姿を消したという。
124無題Name名無し 24/10/12(土)16:24:12No.88821+
>米OpenAIが対話型生成AI「ChatGPT」を公開した2022年11月30日から24年7月29日までに、中国ではAI関連企業87万8000社が登記されたが、すでに全体の8.9%にあたる7万8612社が登記抹消または営業停止となっていることが分かった。中国メディア「��媒体」が報じた。
>��媒体によると、中国では過去3年間でAI関連企業20万社以上が登記抹消となり、10年間で計35万3000社が姿を消したという。
まあ向こうは何か流行るとすぐベンチャー企業できるからな…
むしろまだ半分以上も残ってるのか
125無題Name名無し 24/10/15(火)19:31:06No.89282+
    1728988266970.jpg-(539854 B)
539854 B
2024/09実施の主要LLMの真実性スコア
126無題Name名無し 24/10/16(水)09:26:59No.89356+
どのAIも陰謀論が得意で草
でぐぐってみたらこういうことか

陰謀論者の説得には大規模言語モデルが有効、MITなど新研究
https://www.technologyreview.jp/s/345971/chatbots-can-persuade-people-to-stop-believing-in-conspiracy-theories/
127無題Name名無し 24/10/17(木)16:18:54No.89488+
Llama-3.1-Nemotron-70B-Instruct
https://huggingface.co/nvidia/Llama-3.1-Nemotron-70B-Instruct
Llama-3.1をNvidiaが微調整したやつ
ベンチマークはGPT-4oやSonnet3.5越えと言っているが使ってみるとLlama系ぽさは変わらないから日本語には強くないのだろうしベンチマーク特化なだけに見える
128無題Name名無し 24/10/19(土)15:34:52No.89784そうだねx3
ChatGPTスレ落ちた?
129無題Name名無し 24/10/20(日)00:55:32No.89922+
エロ部門のベンチマークが欲しい
130無題Name名無し 24/10/20(日)08:07:52No.89949+
まず体位網羅率と破綻の少なさのベンチマークスコアをだな
131無題Name名無し 24/10/23(水)04:12:08No.90383+
Sonnet3.5(NEW)とHaiku3.5のリリース
https://www.anthropic.com/news/3-5-models-and-computer-use
性能的にはコーディング能力のアップで通常とは別に新たなAPIとしてコンピュータを操作できるAPIが提供されるとのこと
132無題Name名無し 24/10/23(水)05:40:18No.90395+
Cohereからマルチモーダルな埋め込みモデルのembed-3がリリース
https://cohere.com/blog/multimodal-embed-3
133無題Name名無し 24/10/23(水)09:02:27No.90421そうだねx1
たった一日で怒涛のAI業界のリリース
1)IBM--Granite 3.0
2)Anthropic--新Claude 3.5 Sonnetと3.5 Haiku
3)Stability--Stable Diffusion 3.5
4)Genmo--動画生成AI Mochi 1
5)北京大学--Open-Sora-Plan-v1.3.0
6)CMU--Pangea
7)Perplexity--Reasoning Mode
8)Salesforce--BLIP-3-Video
9)Runway--Act-One
10)Ideogram Canvas
134無題Name名無し 24/10/23(水)09:32:47No.90425そうだねx1
https://www.anthropic.com/research/developing-computer-use
業界的にはこれが大きいのかな
AIがコンピュータを自分の意思で操作してマウスを動かしたりクリックしたりできるようになったよって話
デカい革新になるのかデカいやらかしして立ち消えるのかは注目だね
135無題Name名無し 24/10/24(木)16:32:36No.90585+
AIにPCの操作なんて恐ろしすぎるけどなぁ
136無題Name名無し 24/10/24(木)18:47:13No.90660+
量子化によって標準で6GB以上あるSDXLのファイルサイズを4GBに削減したチェックポイント
https://civitai.com/models/868033/4gb-sdxl-full-checkpoint
137無題Name名無し 24/10/24(木)22:39:26No.90704+
CohereからオープンソースのAya Expanseをリリース
https://cohere.com/blog/aya-expanse-connecting-our-world
8Bと32Bモデルがあるよ
Commandとはちょっと違ってAyaは多言語に注力したモデルだよ
138無題Name名無し 24/10/25(金)14:29:17No.90794+
LLMが24GBあたりで高性能なの出ないかなあ
139無題Name名無し 24/10/27(日)01:02:41No.91139+
    1729958561700.png-(147655 B)
147655 B
日本語LLM(ベンチマークの)まとめ
https://github.com/llm-jp/awesome-japanese-llm

モデルとベンチマーク自体の概要も網羅的にまとめられてる
140無題Name名無し 24/10/30(水)08:17:34No.91614+
GitHubCopilotでClaudeとGeminiが選択できるように
https://github.blog/news-insights/product-news/bringing-developer-choice-to-copilot/
あと小規模アプリを生成できるGitHubSparkも公開
141無題Name名無し 24/10/31(木)21:45:11No.91841+
FLUX.1を超えるベンチマークだったred-pandaの正体はRecraft V3だったらしい
142無題Name名無し 24/11/01(金)02:22:33No.91888+
>FLUX.1を超えるベンチマークだったred-pandaの正体はRecraft V3だったらしい
センシティブ出せるのかな?
143無題Name名無し 24/11/01(金)04:39:05No.91900そうだねx1
前にやってたSearchGPTがリリースされた
https://openai.com/index/introducing-chatgpt-search/
144無題Name名無し 24/11/01(金)12:10:39No.91939そうだねx1
DMMボイス
https://ai-voice.dmm.com/

70文字までだけど無料で音声出せる
たぶんNGワードも無さそう?
145無題Name名無し 24/11/02(土)05:15:38No.92051+
ゲーム画面再現系の生成AI
お次はマインクラフト
https://x.com/Etched/status/1852089772329869436
146無題Name名無し 24/11/04(月)02:03:27No.92358+
    1730653407934.mp4-(7089863 B)
7089863 B
戦国武将を再現
虹裏から
147無題Name名無し 24/11/04(月)13:48:51No.92395+
だいぶ前にyoutubeショートで流れてたやつ
148無題Name名無し 24/11/05(火)05:14:54No.92505そうだねx1
Claude 3.5 Haikuが少し遅れたけどリリース
https://x.com/AnthropicAI/status/1853498267612438873
知能向上を反映して価格アップ…?ちょっとよくわかんないですね
149無題Name名無し 24/11/05(火)19:06:33No.92571そうだねx1
Hunyuan-Large:
テンセントからオープンモデルとしては最大規模のLLMがリリース
多くのベンチマークでLLama3.1-405Bを超えてきている。

https://huggingface.co/tencent/Tencent-Hunyuan-Large
150無題Name名無し 24/11/07(木)01:24:14No.92722+
【ADetailer】顔や手の崩れが修正できる!Stable Diffusionへの導入方法や使い方を徹底解説!
https://weel.co.jp/media/innovator/adetailer/

便利そう。
151無題Name名無し 24/11/08(金)18:33:13No.92893+
https://jp.reuters.com/business/technology/ML4LKG5JTBK2TF35MSEB55VRFE-2024-11-08/
おぺない勝訴
152無題Name名無し 24/11/08(金)18:35:34No.92894+
日本語特化の400Bクラスのsarashina2-8×70B
https://www.sbintuitions.co.jp/news/press/20241108_01/
153無題Name名無し 24/11/10(日)02:26:41No.93048+
音楽生成AIのSuno
V4へアップデートを予定
https://x.com/sunomusic/status/1854961069300613176
154無題Name名無し 24/11/12(火)04:24:59No.93270+
Qwen2.5-Coderシリーズがオープンソースでリリース
https://qwenlm.github.io/blog/qwen2.5-coder-family/
最大の32B-InstructはGPT-4oなどのクローズドなモデルと並ぶレベル
155無題Name名無し 24/11/13(水)06:08:27No.93374+
Forge Reasoning API ベータ版
https://nousresearch.com/introducing-the-forge-reasoning-api-beta-and-nous-chat-an-evolution-in-llm-inference/
推論時間スケーリングを適用したAPIで推論ベンチマークがクローズドモデルを超えるレベルでアップ
AIMEスコアでは未リリースのo1(full)を超えるスコア
あらゆるモデル・モデルセットに適用できるらしい?
156無題Name名無し 24/11/13(水)20:10:23No.93439+
NVIDIAとソフトバンクで日本にAIデータセンターを構築予定
https://www.itmedia.co.jp/aiplus/articles/2411/13/news180.html
157無題Name名無し 24/11/19(火)05:59:48No.94157+
Pixtral Large
https://mistral.ai/news/pixtral-large/
Mistral Largeのアップデートも
まがMistralのチャットのle ChatはWeb検索やCanvas機能追加といった大型アップデート
https://mistral.ai/news/mistral-chat/
le Chatは無料
158無題Name名無し 24/11/19(火)06:01:13No.94158+
Qwen2.5-Turbo
https://x.com/Alibaba_Qwen/status/1858469845958074541
コンテキストを1Mに拡張と高速化
159無題Name名無し 24/11/19(火)06:02:47No.94159+
Fireworks f1
https://x.com/lqiao/status/1858532081518682142
ハードコーディング、チャット、数学のベンチマークで GPT-4o と Claude 3.5 Sonnet に勝るオープン モデル上の最初の推論システム
160無題Name名無し 24/11/20(水)03:45:17No.94288そうだねx1
Suno v4リリース
https://x.com/sunomusic/status/1858918710008049866
161無題Name名無し 24/11/20(水)05:34:20No.94291+
    1732048460346.png-(93445 B)
93445 B
LiveBenchでo1-miniに次ぐ5位になった一兆パラメータのstep-2
StepFunていう中国系らしいけどよくわからん
162無題Name名無し 24/11/20(水)05:40:42No.94292+
AI StudioでLearnLM 1.5 pro experimentalというモデルが利用可能に
32kコンテキストウィンドウでGemini 1.5 proの微調整らしい?
163無題Name名無し 24/11/21(木)05:43:34No.94435そうだねx1
DeepSeek-R1-Lite-Previewがリリース
https://x.com/deepseek_ai/status/1859200141355536422
AIMEとMATHでo1-previewを超えるベンチマークを記録
o1の推論機能はもうパクられるレベルになってるな
164無題Name名無し 24/11/26(火)15:18:35No.95106+
nVidia開発の音声の編集が可能なtext2sound「fugatto」
https://fugatto.github.io/
165無題Name名無し 24/11/26(火)15:24:35No.95107+
GTP-4oを利用した2時間の音声インタビューから性格などを分析し作成した1000人のAiエージェントの論文「Generative Agent Simulations of 1,000 People」の紹介記事
https://www.techno-edge.net/article/2024/11/25/3862.html
166無題Name名無し 24/11/26(火)15:56:35No.95108+
win&mac対応音声合成ソフトウェア「AivisSpeech」
https://aivis-project.com/
167無題Name名無し 24/11/28(木)13:31:58No.95321そうだねx1
QwQ-32B-Preview
https://qwenlm.github.io/blog/qwq-32b-preview/
Qwenのところが作った推論機能を搭載した実験的モデル
168無題Name名無し 24/12/02(月)11:45:05No.95883+
PLaMo Primeリリース
https://www.preferred.jp/ja/news/pr20241202/
β版より改善しコンテキストが長くなったりしてリリース
169無題Name名無し 24/12/04(水)05:40:19No.96099+
CohereからRerank 3.5が公開
https://cohere.com/blog/rerank-3pt5
Rerankの新しいやつ
関係ないけどCohere以外でRerank系ってあるのかな?
170無題Name名無し 24/12/04(水)05:58:19No.96101+
Amazon Novaモデルファミリー
https://aws.amazon.com/jp/blogs/aws/introducing-amazon-nova-frontier-intelligence-and-industry-leading-price-performance/
テキストのみで一番高速なMicroとマルチモーダルなLiteとProモデルがあるとのこと
他Canvasという画像生成モデルとReelという動画生成モデルも発表
171無題Name名無し 24/12/05(木)08:09:57No.96241+
Genie 2
https://deepmind.google/discover/blog/genie-2-a-large-scale-foundation-world-model/
1枚の画像からプレイ可能な3Dワールドを生成するAIモデル
172無題Name名無し 24/12/06(金)04:14:40No.96371+
ChatGPT Pro
https://openai.com/index/introducing-chatgpt-pro/
月額200ドルでo1やAVMに無制限アクセスまたo1 proにもアクセスできる
173無題Name名無し 24/12/06(金)22:49:50No.96460+
PaliGemma 2
https://developers.googleblog.com/en/introducing-paligemma-2-powerful-vision-language-models-simple-fine-tuning/
Gemma 2をベースにしたビジョンモデル
174無題Name名無し 24/12/07(土)04:22:10No.96506+
Llama 3.3
https://x.com/AIatMeta/status/1865079067390956006
挙げてるベンチマークではGPT-4oに対してはすべて上回ってる感じだなClaude3.5 Sonnetには結構負けてるが
175無題Name名無し 24/12/07(土)07:38:29No.96514+
Reinforcement Fine-Tuning
https://openai.com/form/rft-research-program/
一般公開されるのは2025年の第一四半期とのこと

- GazouBBS + futaba-