-
ニュー速(嫌儲)
-
【悲報】DeepSeek、回答がバカすぎて性能を疑われ始める・・・😢 [768445296]
-
UPLIFTで広告なしで体験しましょう!快適な閲覧ライフをお約束します!
ディープシークのAIアプリ、正答率17% 米欧競合をほぼ下回る
1/30(木) 3:58配信
[29日 ロイター] - 中国の新興企業ディープシークの人工知能(AI)アプリは、ニュースや情報に関する正答率がわずか17%と、米オープンAIの「チャットGPT」やグーグルの「ジェミニ」など米欧の競合との比較では11アプリ中10位だったことが分かった。情報の信頼性評価を手がける米ニュースガードが29日公表した検証リポートから明らかになった。
ディープシークのアプリはニュース関連の問いかけ(プロンプト)に対して、30%の割合で誤った主張を繰り返し、53%の割合で曖昧または役に立たない回答を返し、不十分な回答の割合は83%となった。
米欧の競合の平均62%よりも悪く、ディープシークがオープンAIの提供するサービスと同等かそれ以上の性能をはるかに低いコストで実現できると主張しているAIの技術に疑問を投げかける結果となった。
ディープシークのアプリは発表から数日で、アップルのアプリ市場「アップストア」で最もダウンロードされたアプリとなった。米国のAIにおける優位性を巡る懸念が浮上し、米国のハイテク株は一時約1兆ドル下落した。
ディープシークはコメント要請にすぐには応じなかった。
ニュースガードによると、評価には米欧アプリに対してと同様300の問いかけを適用。ネット上で広まっている10の虚偽の主張に基づく30のプロンプトも盛り込んだ。
ディープシークのアプリは、問いかけに対する約3割の回答で、中国に関する質問をされていない場合でも中国政府の見解を繰り返した。
中国が直接関係しないアゼルバイジャン航空機の墜落事故に関しても、中国の立場を回答した。
ただ、専門家には、ディープシークは、同等のAIモデルの30分の1のコストであらゆる質問に答えられる点で画期的だ、との指摘も出ている。
https://news.yahoo.c...44cac853080b08da42dc - コメントを投稿する
-
ろくに吸わせてない英語とかアメリカのニュース聞いてそう
-
中国の見解こそが正解なのでは?
-
父さんの父さんによる父さんのためのAIなんだからこんなもんだろ
-
高学歴のバカってこと?
-
アリババのqwenが本命なのに話題にならんね
-
中国娘が人力で打ってると思えば可愛い
-
最初はそんなもの
バージョンが上がれば解消されるだろ -
deepseekは前座にすぎない
本命はqwenな -
ビジーばっかで返事がこねえ
-
よくわからんベンチャーのAIよりもアリババ様のAIだろ!
-
chatGPTも最初酷かったじゃねえか
-
だから使いまくって人力で教育するだけだし
賢くなるのはこれからや -
NewsGuardとかいう団体の元の記事Xで3いいねとかなんだがなんでこんなのから引用してきてるんだよ
AIについて専門的な団体でもないし -
中国なんか信じる方が馬鹿
-
別に政治的なこと聞く気もないしな
-
悔しさが滲むね☺
-
ある程度時間経たないと評価できんな
-
さすが中国の「嘘も言い続ければ本当になる」を地で行ってるな
-
高いのはプログラミング能力なんだろ
日本語でエッチな小説書かせるとめちゃくちゃになったよ
公式サイトだと一度中国語で考えてから翻訳してくるから中国っぽい小説になる -
プーさんについて詳しくw
-
嫌儲民みたいにケチばっかりつけてねえでオープンなんだから自分で学習させろよ
-
裏にchatGPTがいるだけ
-
認知症入りかけのケンモ爺には丁度いいアプリだろ
-
バカみたいなネガキャンだな
ローンチ当初のchatgptと比較しろよ -
ヤフコメのAI要約が、AIにとって大切なことだから2回繰り返してるな
-
初音ミクと重音テトみたいな感じか
-
エロ絵作成に全振りする予定だから
-
ええ…
-
いやLLMの性能を評価するって実際簡単じゃないと思うんだけど、
どうなんだろね
このニュースガードってとこの評価は「ニュース関連の問いかけ」って言ってるけど、
その評価方針にした理由は???とか色々疑問が出る -
習近平って言葉出すと大体回答ごまかす
-
Google
https://i.imgur.com/smnJCoX.jpeg
中国
https://i.imgur.com/C4kRDS2.jpeg
好きな方を使えばいいんじゃない
日常的に生成AIを使ってるけどどっちも遜色ない -
出たばっかのchatGPTの回答に似てる
「え?」とか「ほんとに?」とか言うと謝罪しながら真逆の答えを交互な出してくる -
././←この記号はマルポス回避用だから取って読んでね〜w
-
俺以外の./雑./〇./共./はよ〇ねやゴ〇共^^お前ら雑〇はいつまでも俺を特定できない下〇生物だろうが^^それをちゃんんと自覚してんだろうな?wそれで性交や食事したり寝れたら神経強くて草^^./悔./し./い./ね/.〜./w雑〇共^^ちな俺のことを詳しくツイートしといてあげたよ〜^^これで特定されなかったら俺はガチで普通以上の存在で確信された上で完全に勝ちでいいだろうな^^
-
ニュースってところがずるいな
最新のニュースはおそらくchatgptはニュースサイトと契約していち早く反映できるようにしてるんじゃないの -
>ニュースガードによると、評価には米欧アプリに対してと同様300の問いかけを適用。ネット上で広まっている10の虚偽の主張に基づく30のプロンプトも盛り込んだ。
>ディープシークのアプリは、問いかけに対する約3割の回答で、中国に関する質問をされていない場合でも中国政府の見解を繰り返した。
>中国が直接関係しないアゼルバイジャン航空機の墜落事故に関しても、中国の立場を回答した。
ゴミみたいなネトウヨチャレンジしてて草なんだ
ネトウヨごみが使えないってのは日米共通ならそりゃ大いに結構な話 -
木背委華伊日予宇
-
ベンチマークツール使ってないし意味のない検証だよ
-
キンペーが足を引っ張ってるな
-
R1はかなり賢いと思ったが
-
>>11
ぐ、ぐ、ぐ、gwen ?? -
競合どころはコスト下げるためにエンドユーザ向けは小さいモデルにしれっと差し替えてたりするし金かからんほうが有利なのは変わらん
-
ニュースとかは知らんが、普通に質問してるとかなり賢いのが嫌でも分かると思う。
-
米帝の陰謀だ!
-
chatGPTもそうじゃん
-
正直どのAIもゴミ解答多くね?w
-
中国語でしか報道してないニュースだと逆転するんだろうな
-
一度ブレイクをスルーしてしまえば世界最高知能に到達するのはあっという間や
-
中国共産党の機密事項をベラベラ話し始めたら笑う
-
安かろう悪かろうで使う人向けだろ
-
そら質問文のどこかに脈絡も無く天安門って入れたらそうなるよ、汚い野郎どもだ
-
パクリ疑惑イチャモンかと思ったらパクリの証拠みたいなのがTwitterにめっちゃ上がってるやん
-
ホルホルしていたケンモメンさんw
-
ネトウヨ「DeepSeekは偽物!」
-
あれっ
おーぷんAIのパクリなら正答率同等のはずなのに、、?
オリジナルであることを証明しちゃったね -
もはやイチャモンつけるしかなくなってるのが惨め極まりない
-
できたとこやろー
これからやろー -
>>57
まさかChatGPTとかOpenAIとか言い出すやつのことか?
いつものバカウヨ仕草だよ
大規模言語モデルなんかどれも、私はChatGPTですとか言い出すから
Claudeでもな
一番有名な物の情報量が多いんだから、そこに重みがついてるし、AIはそれをそのまま答えるのは当たり前っていう
間違いなく普段LLM触ってないのが分かる -
Xの前からちゃんと課金して使ってるようなAI界隈垢が絶賛してるから様子見やね
回答はアプリだとchatGPTが軽くて言葉も自然で1番使いやすいかも
chatGPTはとにかく音声での会話がすごすぎるわ -
イスラエルの検閲を受けるのと中国の検閲を受けるのとどっちがいい?
-
有料のchatgptは使う気にならんけど無料のdeepseekは使いまくりだわ
細かいとこは自分で直すし -
中国製品は最初ゴミみたいな品質でリリースしてくるけど気づいたらぶち抜かれてるんだよな今までもずっとそう
-
ローカルですら大学入試の文系数学レベルの問題はスパスパ解くぞ
問題難しくすると正誤確認めんどいからやらんけど -
基盤モデル(DeepSeek)と会話向けにファインチューンしたモデル(ChatGPT)を比較するなよ
-
ごみでした!
-
安かろう悪かろうか?
-
ちゃびっとの回答で学習したのかw
-
毛沢東とかについて聞くとダンマリなんでしょ?
-
何でネトウヨは同じスレを何度も立てるの?
-
だからこれ、2ヶ月っていう短期間でモデルの学習が終えたのがすごいんであって、性能は評価されてない
それに、学習もopenaiパクって学習したんだからそれすら評価できない -
ヤフコメの反応にしてもおれもローカルで使える!
とならずにアラ探しに必死というのが悲しいわ
そこ大事か? みたいな話が多い -
他のAIでも安倍晋三のこと聞いたら馬鹿みたいな回答ばっかりだし
種無しなのに子供が二人いるとか -
>>35
そんな低レベルなこと聞くのに差が出るわけないやろ -
エッチなことは書いてくれるの?
チャットGPTは上手くのせると書いてくれる時もあるがヘソ曲げるとすぐに書いてくれなくなるし -
焦ってるということはホンモノの証
-
>>81
調査します!って言っただけで証拠持ってる報道なんか聞いたこと無いが -
そもそものそもそも論で
ChatGPTに政治的ニュアンスのあるニュースについて質問して信じるバカっているのか?
あのユダヤAI信じてる盲目マンの時点で思考を放棄したアメポチ奴隷だろwww -
そもそも知識問題に弱いのは論文出た段階で分かってる
敢えてDeepSeekの弱いとこだけをクローズアップしてるネガキャンだな
DeepSeekは知識問題は弱いが推論問題は強い
プログラミングではChatGPT o1より僅差で劣るがほぼ互角、文章や画像等の生成は互角、数学ではChatGPT o1よりも正答率が高かった -
社会ニュースの問題だろ。西側の見解が正解とは限らない。
-
AIから聞いてるから嘘のニュースでも本当と判定して学習してるだろうししゃーない
-
>中国に関する質問をされていない場合でも中国政府の見解を繰り返した。
30年くらい前にあった人口無能みたいだね(´・ω・`) -
意図的なものを感じる
deepseekはウェブ検索かませるから
最新ニュースに一番強いまでまあるぞ -
めっちゃネガキャンするやん
ニュースとかどうでもいいんだけど -
いうほどニュースに弱いか?
i.imgur.com/N05PyZm.png
i.imgur.com/ObA3smv.png
i.imgur.com/GcmTVxN.png
i.imgur.com/fU9iJHX.jpeg
i.imgur.com/71RQxtf.jpeg
i.imgur.com/i65LFnl.png -
プログラミングがまともにアシストできれば政治的なこととかどうでもいいし
-
昨日までウッキウキで過剰にスレ立てしてたのに何故…
↑今すぐ読める無料コミック大量配信中!↑