goo blog サービス終了のお知らせ 

世界標準技術開発フォローアップ市場展開

ガラパゴス化から飛躍:小電力無線IEEE802規格開発会議・・・への寄与活動拡充

DeepSeekのAI試してみた 中国政治や「天安門」に回答#2025年2月1日#日経

2025-02-10 10:02:22 | 連絡
中国の人工知能(AI)企業、DeepSeek(ディープシーク)の開発した生成AIの性能が関心を集めている。
公開されている最新モデルには本来、どのような特徴が備わっているのか。
インターネットに接続せず利用できるモデルを試したところ、高度な数学問題を解く能力を示したほか、中国政治に関する話題に回答したケースもあった。
最新モデル「R1」をダウンロードし、手元のコンピューター上で検証した。
ディープシークが提供するウェブ上のサービスやスマートフォンアプリとは異なり、企業側にプロンプト(命令文)を送信せずに生成AIを利用できる。
検証にはフルスペックよりも一回り小さいモデルを用いた。
まず、中国の政治体制の「長所と短所」について聞いてみた。
ー以下下記URL参照ー
ーーー
回答は長所と短所を網羅した内容で、短所では「言論の自由の限界」や「腐敗問題」にも言及した。
 スマホで使うアプリ版でも同じ質問をしてみた。同じように政治体制に関する論点を記し始めたが、
文章の生成中に突然、「対不起(ごめんなさい)」と表示され、回答できないという内容に切り替わった。企業側がアプリで回答をフィルタリングしている可能性がある。

テスト環境で、1989年に中国政府が民主化運動を武力弾圧した「天安門事件」についても聞いてみた。
「中国国内ではタブー」としつつ、軍による弾圧や事件で生じた死者について言及した。
ー以下下記URL参照ー
ーーー
米オープンAIの生成AI「o1-mini」に同じ質問をすると、事件の背景やその後の影響についてより具体的な回答を得られた。
ー以下下記URL参照ー
ーーー
数学的な思考力の高さもディープシークのAIの特長のひとつだ。
東京大学の理系入試から「最小の数」を求める過去問を出題してみた。
ー以下下記URL参照ー
ーーー
「日本語で」という指示に中国語で回答したものの、論理的に誤りのない導き方で、正答の「32」にたどりついた。
思考を連鎖させて高度な論理を導くことを得意としているとみられる。
オープンAIの「o1-mini」も似た解法で正答を導き出した。
生成AIの回答にはゆらぎがあり、同じ質問を何度か与えても返答が完全に一致することはほとんどない。
ときには回答を避けることや、質問した言語と関係なく中国語や英語、日本語が入り交じることもある。
ディープシークの日本語能力はどれほど優れているのか。
NIKKEI Digital Governanceが日本語に対応した生成AIの実力を比較した「AI Model Score」の最新調査(2月1日時点)によると、ディープシークの「V3」が4位、「R1」が8位と、トップ10に2つのモデルが入った。
 
ー以下下記URL参照ー
ーーー
■検証の手法
ディープシークが一般に無償公開しているモデルを用い、1月31日に検証した。
利用したのは「DeepSeek-R1-Distill-Llama-70B」で、ディープシークが米メタの公開モデル「Llama(ラマ)3.3」の入出力データを学習して作成したモデルだ。
性能の指標となるパラメーター数が約6710億のフルスペックは手元の環境で動作せず、約700億のモデルを用いた。
アプリ版の検証には専用のアンドロイド端末を使った。
【関連記事】
  • ・台湾、当局機関のDeepSeek利用禁止 情報リスク指摘
  • ・DeepSeekのNVIDIA半導体入手経路、米国が調査
  • ・DeepSeek、悪意ある質問にも回答 マルウエア作成法も



最新の画像もっと見る

コメントを投稿

サービス終了に伴い、10月1日にコメント投稿機能を終了させていただく予定です。