-
ニュー速(嫌儲)
-
DeepSeekの凄さ「GeForce GTX 5090が何枚も必要だった処理をGeForce GT 1030で実現できてしまう」 [422186189]
- コメントを投稿する
-
さすがは中国お父様
-
最適化できないゴミってこと?
-
すでにHuaweiのGPU使ってるらしいから
-
控えめに言っても神やね
-
これもうproject digits出る前から死んでるやん
-
良かったなあ株価戻って
-
メモリだけはいるからメモリ特需か
-
無料で使えるなんて、さすが父さん
-
全然見てないけどアルゴリズムに革命的なの見つけたの?
-
でもローカルは5090じゃないとまともな奴が動かないだろ
3060でも動く7Bはゴミらしいし -
もうAMD内蔵GPUでできるレベル
-
反日自民党降ろして
日本も独自で開発していかないとやばい -
NVIDIAは用済みかグラボ安くなるといいな
-
cuda使ってないのか
-
いつまでそんなボロいハード使ってんだよ
-
AMDの内蔵のやつでもいけるってことだろこれ
-
ワロタ
-
画像生成AIと違ってLLMは元からAMDでもMacでも推論は遜色なく動いてただろ
というかメモリ容量が正義だから家庭用ではMacが最適解だったはず -
CUDAプラットフォーム死亡www
-
はやくエロAIで使えるようにしろ
-
Huaweiさん安くて高性能なグラボとドライバお願いします
-
3060でまともなのが動くようになったら教えて
-
グラボ関連はいつまでも中国でてこないなあって思ってたら
突然電撃戦が始まった気分 -
やっぱソフト開発だわ
-
画像生成版のもあるんだろ
それは流石にお高いグラボが必要なのか? -
iGPUでよくなりそうだな
Nvidia終わったやん -
DeepSeekは学習の計算コストを100分の1に下げたけれど
その学習済みモデルを小型化(蒸留)したモデルを使うと規模の小さい蒸留モデルは極端に性能下がるから使えるメモリー容量は必要という感じみたいよ。
GPUの処理性能は低くても良いけれどAI用に使えるメモリー容量は必要だから古いグラボではメモリー容量が足りない -
仮に日本産でこんなゲームチェンジャー作ったら秒で関係者全員消されるレベル
-
だっっっっっさwwwww
-
キタ━━━━(゚∀゚)━━━━!!
-
そこまでではない
-
大人の事情で互換性切り捨て
まじかよNV製やめよってなるだけなのにw -
>>29
低燃費で済むならその分エヌビのグラボ使って沢山回すに決まってんじゃん -
来年中には中華製GPUで動きそう
-
AIの素晴らしいところは
アーキテクチャに依存せずモデルが使い回せる点
策士策に溺れるww -
>>31
組み込みだけでなく今度はPC向けのOSを出すって発表したTRONの開発チームが全員飛行機事故で亡くなったんだよな -
>>1
え、俺の1050Tiはアウトって事? -
stable diffusionで使えるようになったら起こして
-
うちの1650でも爆速になるのかな
-
これはベンチャー系のAIソフトメーカーには福音だろう
-
>>30
メインメモリを流用できる Ryzen APU 圧勝だな -
>>41
10年前はそんなネタを本気にしてた人もいたけど令和でんやことマジだとおもってるやつはいない -
ラデオンで動くようにするだけでNVIDIA終わりそうだな
-
>>39
今の所368*368までしか生成出来ないらしいからまだ先の話だな -
そりゃ暴落しますわ
-
Microsoft Probing If DeepSeek-Linked Group Improperly Obtained OpenAI Data
マイクロソフト、DeepSeekとつながりのあるグループがOpenAIのデータを不正に入手したかどうかを調査
さて? -
簡単にエロ画像作れるかを知りたい
-
>>44
deepseek版画像生成AIをたしか発表してたぞ -
>>48
むしろ10年前よりはるかに増えてるだろ -
優秀杉ワロタ
-
実際の所死ぬのはAMDのMIでしょ
コスパだけしか推すところなかったんだから溢れて安くなるって言うなら選ぶ理由が無くなる
まあ倍精度に振ってるからスパコン分野の需要はありそうだがAI分の価値は0だな -
>>41
少しでも調べりゃデマって分かるのにな -
すべては
エロ
があるか
エロのあるほうが覇権をとるはず -
>>53
長いが非常にわかりやすい解説
市場終値: $NVDA: -16.91% | $AAPL: +3.21%
DeepSeek が Apple にとって素晴らしいのはなぜでしょうか?
現在市場で DeepSeek V3 および R1 を実行できるチップの内訳は次のとおりです
: NVIDIA H100: 80GB @ 3TB/s、25,000 ドル、1GB あたり 312.50 ドル
AMD MI300X: 192GB @ 5.3TB/s、20,000 ドル、1GB あたり 104.17 ドル
Apple M2 Ultra: 192GB @ 800GB/s、5,000 ドル、1GB あたり 26.04 ドル(!!)
Apple の M2 Ultra (2023 年 6 月リリース) は、メモリ単位あたりのコスト効率が AMD MI300X の 4 倍、NVIDIA H100 の 12 倍です。これが DeepSeek に関係するのはなぜでしょうか?
DeepSeek V3/R1 は合計 671B のパラメータを持つ MoE モデルですが、トークンが生成されるたびにアクティブになるのは 37B だけです。
トークンを生成するときにどの 37B がアクティブになるかは正確にはわからないため、高速 GPU メモリですべてを準備しておく必要があります。通常のシステム RAM は 37B のアクティブ パラメータをロードするには遅すぎるため使用できません (1 キロバイト/秒未満になります)。
一方、GPU は高速メモリを備えていますが、GPU メモリは高価です。ただし、Apple Silicon は、Unified Memory と UltraFusion を使用してダイを融合します。
これは、より安価なコストで大量の中速メモリを優先するトレードオフです。Unified Memory は、CPU と GPU でそれぞれに個別のメモリを持つのではなく、単一のメモリ プールを共有します。CPU と GPU 間で個別のメモリを用意してデータをコピーする必要はありません。
UltraFusion は、2 つのダイを超高速、低レイテンシ接続 (2.5TB/秒) で接続するための Apple 独自の相互接続テクノロジです。 Apple の M2 Ultra は、文字通り 2 つの Apple M2 Max ダイを UltraFusion で融合したものです。これにより、Apple は大容量のメモリ (192 GB) とメモリ帯域幅 (800 GB/秒) を実現しています。
Apple M4 Ultra は、同じ UltraFusion テクノロジを使用して 2 つの M4 Max ダイを融合すると噂されています。これにより、M4 Ultra は 256 GB (!!) の統合メモリを 1146 GB/秒で実行できます。
このうち 2 つで、DeepSeek V3/R1 (4 ビット) を 57 キロバイト/秒で実行できます。これらすべてを、Apple は優れた電力効率と優れたオープンソース (Apple らしくない!) ソフトウェアを備えた小型フォーム ファクタにパッケージ化して、消費者に提供しています。
MLX (h/t @awnihannun
) は、Apple Silicon を ML ワークロードに活用できるようにし、
@exolabsは、複数の Apple Silicon デバイスをクラスター化して大規模なモデルを実行できるようにし、7 台の M4 Mac Mini で DeepSeek R1 (671B) が実行される様子を実証しました。
誰が最高の AI モデルを構築するかは不明ですが、AI はアメリカのハードウェア、つまり Apple Silicon で実行される可能性が高いようです。
x.com/alexocheema/status/1884017521985995178?t=5sOsvMTfaeDvFvBiXv3Ugg&s=19 -
Core Ultraでいいんじゃね?
-
AMDがそわそわしてそう
-
中国のエンジニアって何気に優秀なのはソシャゲやってたら分かる
-
TRONとwinnyは何故か知らんが令和最新ホルホル宗教と化してるな
そのうちラピダスも圧力で潰された的な事になりそう -
GPU実は高く売りつけるための嘘でした
-
中国がdeepseekに特化したGPU開発したらNVIDIAも終わるな
-
1030が10万になるだけでは
-
>>70
せめて読んでからレスつけてもらえますか? -
5090使った方が良いってことでは?
-
>>61
そんな発想では日本人レベルのものしか出来ない。 -
よかった
革ジャン不要な世界になったんだ -
さすが父さんやわ
-
凄いなこれ
-
2chMate 0.8.10.192 dev/HUAWEI/ANE-LX2J/9/LT
ハーウェイ利用者だけ使えるようにしてくれ -
低電力こファンレスで5090越えとかシンギュラリティやんけw
-
>>68
特化ってかようはCUDA以外人権ない感じだったのがdeepseekの登場で変わりそうって話だからGPUを開発とかはまた話が違う -
DSっていわゆるTensorコアなくても充分動くのか?
-
これでグラボの需要が下がると思ってる奴は何も理解できてない
-
NVIDIAのGPUが値下がればみんなハッピー
-
>>84
ところが2台までしか接続できないのとメモリ帯域幅がM4 Ultraの半分以下という -
ケンモメンには作れないね
-
ほう、GT1030買い占めるか
-
>>82
理解できてないのはお前! -
>>87
買い占めなくてもいつでも買えるぐらい在庫あるぞ -
でっけー弁当箱みたいな電力爆食いグラボいらねえからはやく製品たのむは
-
>>13
ローカルで動かしてるケンモメンいたけど5090まだ未発売だしH100でも搭載してるんか? -
ラピダス…
-
結局ソフト同じならハードの勝負になるのでは?
-
3060の12GBで14B動かしたけどけっこうちゃんとした答えが返ってくる
つーか返答よりエロ小説を要求されて断るまでのAIの思考過程を見れるのが面白い -
うけるw
すげぇな -
本来はそれで出来るのが
グラボ売るためにわざと処理重くしてたんだろうなぁ
マイニングで味しめたから -
32BでVRAM使用量32GBだったから
まじ5090でも不安定 -
1050tiで画像作りたい放題になる?
-
でもまぁいつかは省電力化は必要だよね。
↑今すぐ読める無料コミック大量配信中!↑