「人間超え」AI登場の伏線?DeepSeekで起きた「アハ体験」が色々ヤバいワケ
https://www.sbbit.jp/article/cont1/157346
「DeepSeekショック」は2025年1月20日の発表から始まった。中国のDeepSeek社が、僅か約557万ドルの予算と2048基のH800チップで開発したとする、LLM「DeepSeek-R1」を公開したのだ。
H800は、中国向けに性能が一部制限されたエヌビディア製GPUであり、H200などの高性能GPUと比べてスペックが抑えられている。
にも拘わらず、DeepSeek-R1がOpenAIのo1モデルに匹敵する、比肩し得る推論能力を発揮する点は大きな驚きだった。
従来のLLM開発では、数万個の高性能チップや数億ドル単位の投資が必要とされ、OpenAIやグーグルなどの大手企業だけが成立させられる、ビジネスだと考えられていたからだ。
先月末、複数の関係筋によると、ディープシークが世界的な注目を集めて以降、中国企業のテンセントとアリババと字節跳動が、米エヌビディア(NVDA)の人工知能(AI)半導体「H20」の発注を、大幅に増やしているという。
関係筋は中国の新興企業ディープシークが開発した、低コストAIモデルの採用が増えていることが背景だと指摘している。
エヌビディアの市場支配力が浮き彫りになった。H20はエヌビディアが中国市場向けに設計した。
米国のトランプ政権はH20の対中販売について規制強化を検討している懸念も、発注急増の一因となった可能性がある。
因みにChatGPTには「A100」が使用されている。
従来のAI開発は、OpenAIやAnthropicのようなクローズドモデルと、MetaやStability AIを代表とするオープンモデルが競っており、売上の大きさという点ではクローズドモデルが有利とされていた。
DeepSeek R-1も売上ではまだ成果を出していないが、性能とコストのアドバンテージによって新しい局面が開く可能性が出てきた。
一方、AIコミュニティでは、DeepSeekの開発過程で起きた「ある出来事」が衝撃を与えた。それは、「アハ体験」と呼ばれる、まるで人間のような事象が発生したことだ。
その一方、DeepSeekのエンジニアがOpenAIから大量のデータを盗んだ疑いがあり、マイクロソフトが調査すると報じられたり、米国にとっての安全保障上のリスクをNSCが調査するという報道もあったが、その後の進展はまだ見られない。
DeepSeek-R1の画期的な点は、高度な推論性能を低コストで実現したことだ。
それを可能にしたのは、従来のLLMとは異なるトレーニング手法のアプローチである。
従来のトレーニングはまず膨大な教師あり学習(SFT:Supervised Fine-Tuning)を行い、その後にAI自身が自分で学習を行う強化学習(RL:Reinforcement Learning)を行う。それに対して、DeepSeekは高コストな教師あり学習を省略するという大胆な挑戦をした。
DeepSeek-R1の論文によると、「教師ありデータなしで推論能力を開発するために、純粋なRLプロセスによる自己進化に注目し、LLMの潜在能力を探求すること」が目標だったいう。
そのために(前モデルの)DeepSeek-V3-Baseをベースモデルに使用して、数千ステップのRL学習の後、DeepSeek-R1-Zeroと名付けられたモデルは、推論ベンチマークで優れたパフォーマンスを発揮するようになった。
DeepSeek-R1-Zeroは、出力の可読性の低さや英語と中国語とフランス語が混ざる多言語問題などがあった。
そこで、「ライティング、ファクトQA、自己認知などの分野におけるDeepSeek-V3の教師ありデータ」などを使って再調整することで、OpenAIのo1と同等の推論性能を持つDeepSeek-R1が生まれた。
https://www.sbbit.jp/article/cont1/157346
「DeepSeekショック」は2025年1月20日の発表から始まった。中国のDeepSeek社が、僅か約557万ドルの予算と2048基のH800チップで開発したとする、LLM「DeepSeek-R1」を公開したのだ。
H800は、中国向けに性能が一部制限されたエヌビディア製GPUであり、H200などの高性能GPUと比べてスペックが抑えられている。
にも拘わらず、DeepSeek-R1がOpenAIのo1モデルに匹敵する、比肩し得る推論能力を発揮する点は大きな驚きだった。
従来のLLM開発では、数万個の高性能チップや数億ドル単位の投資が必要とされ、OpenAIやグーグルなどの大手企業だけが成立させられる、ビジネスだと考えられていたからだ。
先月末、複数の関係筋によると、ディープシークが世界的な注目を集めて以降、中国企業のテンセントとアリババと字節跳動が、米エヌビディア(NVDA)の人工知能(AI)半導体「H20」の発注を、大幅に増やしているという。
関係筋は中国の新興企業ディープシークが開発した、低コストAIモデルの採用が増えていることが背景だと指摘している。
エヌビディアの市場支配力が浮き彫りになった。H20はエヌビディアが中国市場向けに設計した。
米国のトランプ政権はH20の対中販売について規制強化を検討している懸念も、発注急増の一因となった可能性がある。
因みにChatGPTには「A100」が使用されている。
従来のAI開発は、OpenAIやAnthropicのようなクローズドモデルと、MetaやStability AIを代表とするオープンモデルが競っており、売上の大きさという点ではクローズドモデルが有利とされていた。
DeepSeek R-1も売上ではまだ成果を出していないが、性能とコストのアドバンテージによって新しい局面が開く可能性が出てきた。
一方、AIコミュニティでは、DeepSeekの開発過程で起きた「ある出来事」が衝撃を与えた。それは、「アハ体験」と呼ばれる、まるで人間のような事象が発生したことだ。
その一方、DeepSeekのエンジニアがOpenAIから大量のデータを盗んだ疑いがあり、マイクロソフトが調査すると報じられたり、米国にとっての安全保障上のリスクをNSCが調査するという報道もあったが、その後の進展はまだ見られない。
DeepSeek-R1の画期的な点は、高度な推論性能を低コストで実現したことだ。
それを可能にしたのは、従来のLLMとは異なるトレーニング手法のアプローチである。
従来のトレーニングはまず膨大な教師あり学習(SFT:Supervised Fine-Tuning)を行い、その後にAI自身が自分で学習を行う強化学習(RL:Reinforcement Learning)を行う。それに対して、DeepSeekは高コストな教師あり学習を省略するという大胆な挑戦をした。
DeepSeek-R1の論文によると、「教師ありデータなしで推論能力を開発するために、純粋なRLプロセスによる自己進化に注目し、LLMの潜在能力を探求すること」が目標だったいう。
そのために(前モデルの)DeepSeek-V3-Baseをベースモデルに使用して、数千ステップのRL学習の後、DeepSeek-R1-Zeroと名付けられたモデルは、推論ベンチマークで優れたパフォーマンスを発揮するようになった。
DeepSeek-R1-Zeroは、出力の可読性の低さや英語と中国語とフランス語が混ざる多言語問題などがあった。
そこで、「ライティング、ファクトQA、自己認知などの分野におけるDeepSeek-V3の教師ありデータ」などを使って再調整することで、OpenAIのo1と同等の推論性能を持つDeepSeek-R1が生まれた。

それは、モデルの強化学習過程で、DeepSeek-R1に「アハ体験(aha moment)」が生じたというものである。
“アハ体験”とは、人間であれば問題を解く過程で突然答えがひらめく瞬間を指す。今回、それが生成AIに起きたとして話題になっているのだ。
具体的に言うと、DeepSeek-R1-ZeroがRLの課程で「待って、待って、待って。今、重要なことに気付いた!」(“Wait, wait. Wait. That’s an aha moment I can flag here.”)と自発的に叫んだという。
“DeepSeek-R1-Zeroは、初期のアプローチを再評価することで、問題により多くの思考時間を割り当てることを学習する。
この挙動は、モデルの推論能力が向上していることの証であるだけでなく、強化学習が予想外の洗練された結果に繋がる可能性を示す興味深い例でもある。
DeepSeekがRLを重視したのは、コストダウンの目的があったと言われるが、それによって予想外のAIの進化の可能性が発見されたのだ。
DeepSeek登場で加速する「米中AI開発競争」
中国では、アリババや百度(バイドゥ)など、DeepSeekと直接競合関係にあるような企業を除き、中小規模のソフトウエア開発、クラウド関連企業から、大規模のICT、金融、医療、さらにはメーカー、流通など広範な産業の主力企業において、一瞬の内にDeepSeekが浸透して、AI革命が大きく加速し始めている。
OpenAIの研究チームは2020年に論文を発表。「モデルのパラメータ数、学習データの量、トレーニングに使用する計算資源を指数関数的に増やすと、モデルの性能(タスクの精度、生成品質など)がべき乗測に従って向上する」といった、スケーリングの法則を初めて体系化した(DeepSeekへの質問による回答)。
OpenAI、マイクロソフトをはじめ、グーグル、メタ、アマゾン、新たに参入してきたイーロン・マスク氏が率いるxAIといった米国勢は、米国政府によって高性能のGPU供給を絞られている中国勢の弱点を突き、ひたすら大規模な設備投資を続け計算資源を強化することで、AIの質を高めようとしている。
設備調達面での制約や資金力といった部分で劣る中国勢は、単純にGPUを増やすこと以外の方法で戦うことになる。
DeepSeekや百度などの中国勢はオープンソースによる開発を基礎に、低価格化、汎用化を進めることで、まずAIを市場に浸透させることを優先させている。
中国は、AI技術の発展を国家戦略の重要な柱と位置付け、2017年に「新世代人工知能発展計画」を発表した。
この計画に基づき、ファーウェイの「昇騰」(Ascend)、アリババの「含光」(Hanguang)、バイドゥの「崑崙」(Kunlun)、テンセントの「紫霄」(Zixiao)など、テクノロジー大手が積極的に開発を推進している。
中国ではDeepSeekの採用が各社で急速に進んでいる。
字節跳動(バイトダンス)、百度(バイドゥ)、華為技術(ファーウェイ)、阿里巴巴(アリババ)、騰訊(テンセント)といった中国を代表する企業もAIモデルを開発しているが、各社は自社サービスにDeepSeekを採用する動きを見せている。
現在、DeepSeekを採用していないのは、コンシューマー向け生成AI「豆包」(ドウバオ)などで国内トップのバイトダンスのみとなっている。
DeepSeek登場以来、米国でもオープンソース化が進展し、AI技術の社会実装がそれなりに加速する可能性はあるが、その効果がより大きいとみられる製造業の規模は中国の方が大きい。
政府部門でも効率化の効果が高いと予想されるが、社会主義国家である中国はその部分でも米国よりも規模が大きいとみられ、社会実装による付加価値向上のインパクトは中国の方が米国よりも大きいだろう。
各社がAIサービスの無料提供に踏み切る背景には、まずChatGPTの先行者利益に対抗するための顧客獲得戦略があります。無料提供によって、より大きなユーザー基盤を構築しようとしている。
また、AIの性能向上に不可欠な学習データの獲得競争も無料化を後押ししています。
無料提供によってユーザーの利用データを収集し、AIモデルの改善に活用できるメリットがある。
さらに、AIサービスの収益化モデルがまだ確立していないことも無料化が進む要因。Googleの広告モデルのように無料提供を前提とした上で、別の収益源を探る企業も増えていくだろう。
各社のAIサービス無料化により、ユーザーの選択肢は増え、AI技術の恩恵を受け易くなった。
しかしこの競争は「体力勝負」の様相を呈しており、長期的に持続可能なビジネスモデル構築が今後の重要課題となるだろう。
テック大手による無料AIサービスの競争は、業界の進化を加速させると同時に、新たなビジネスの可能性も広げていくことになる。
一方、2022年末に始まった世界的な生成AIブームを支えてきた技術トレンドは、ピークに達して限界に来たのではないかと噂されいる。
ChatGPTなど生成AIのベースとなる(前述の)大規模言語モデル(LLM)は、所謂「スケール則」と呼ばれる経験則がここに来て限界に達しつつあると見られている。
スケール則とは、「LLMの規模とそれが機械学習するデータの量を増やせば増やす程、その性能は指数関数的(天井知らず)に上昇する」という法則である。
GPU(AI半導体/画像処理・グラフィック用)を複数連結して高度な処理を行うためのサーバー、その冷却装置、ネットワーク接続を管理する機器、データを保存するストレージなど、様々な先端機器をAI専用に設計して互いに連結することで、漸くAIとして機能する。
しかし、巨額設備投資にはボトルネックの課題を解決する必要があり、巨大な電力需要(大都市レベルの電力を消費)とか、遅いネットワーク機器が足枷の制約になって、高性能な先端GPUの性能がアイドリング状態となり1/3しか発揮できなく、Nvidiaが窮地に陥っていると言う。
シンギュラリティ(AIがすべての人間の知能を超越する時点)の到来について、未来学者のレイ・カーツワイル氏は2045年頃に訪れると予想しているが、中には2030年頃にはその兆候がみられると予想する専門家もいる。
しかし、足元の最先端AIの学力は既に人類の上位数%ぐらいの能力に達している現状を考えれば、5年も掛からないのではなかろうか。少なくとも米系は強い信念を以て全力で設備投資を続けようとしている。
続く中国AIの衝撃、自ら判断し独立した思考と行動が可能な革新的AIエージェントManus(マヌス)だ。
https://forbesjapan.com/articles/detail/77669
Manusは、単なるチャットボットでも、近未来的なブランドを纏った改良型検索エンジンでもない。これは世界初の完全自律型AIエージェントであり、人間を補助するだけでなく、置き換えることを目的とするシステムだ。
Manusは監視なしにデジタル世界のネットワークを縦横無尽に動き回って検索し、最も熟練した専門家でさえ追いつくのが難しい速度と正確さで意思決定を行う。
単なるモデルではなく、自ら思考し判断して計画し、タスクを自律的に実行できるエージェントであり、まるで無制限の集中力を持つ人間と同じように、シームレスに現実世界をナビゲートする能力を持っている。
“アハ体験”とは、人間であれば問題を解く過程で突然答えがひらめく瞬間を指す。今回、それが生成AIに起きたとして話題になっているのだ。
具体的に言うと、DeepSeek-R1-ZeroがRLの課程で「待って、待って、待って。今、重要なことに気付いた!」(“Wait, wait. Wait. That’s an aha moment I can flag here.”)と自発的に叫んだという。
“DeepSeek-R1-Zeroは、初期のアプローチを再評価することで、問題により多くの思考時間を割り当てることを学習する。
この挙動は、モデルの推論能力が向上していることの証であるだけでなく、強化学習が予想外の洗練された結果に繋がる可能性を示す興味深い例でもある。
DeepSeekがRLを重視したのは、コストダウンの目的があったと言われるが、それによって予想外のAIの進化の可能性が発見されたのだ。
DeepSeek登場で加速する「米中AI開発競争」
中国では、アリババや百度(バイドゥ)など、DeepSeekと直接競合関係にあるような企業を除き、中小規模のソフトウエア開発、クラウド関連企業から、大規模のICT、金融、医療、さらにはメーカー、流通など広範な産業の主力企業において、一瞬の内にDeepSeekが浸透して、AI革命が大きく加速し始めている。
OpenAIの研究チームは2020年に論文を発表。「モデルのパラメータ数、学習データの量、トレーニングに使用する計算資源を指数関数的に増やすと、モデルの性能(タスクの精度、生成品質など)がべき乗測に従って向上する」といった、スケーリングの法則を初めて体系化した(DeepSeekへの質問による回答)。
OpenAI、マイクロソフトをはじめ、グーグル、メタ、アマゾン、新たに参入してきたイーロン・マスク氏が率いるxAIといった米国勢は、米国政府によって高性能のGPU供給を絞られている中国勢の弱点を突き、ひたすら大規模な設備投資を続け計算資源を強化することで、AIの質を高めようとしている。
設備調達面での制約や資金力といった部分で劣る中国勢は、単純にGPUを増やすこと以外の方法で戦うことになる。
DeepSeekや百度などの中国勢はオープンソースによる開発を基礎に、低価格化、汎用化を進めることで、まずAIを市場に浸透させることを優先させている。
中国は、AI技術の発展を国家戦略の重要な柱と位置付け、2017年に「新世代人工知能発展計画」を発表した。
この計画に基づき、ファーウェイの「昇騰」(Ascend)、アリババの「含光」(Hanguang)、バイドゥの「崑崙」(Kunlun)、テンセントの「紫霄」(Zixiao)など、テクノロジー大手が積極的に開発を推進している。
中国ではDeepSeekの採用が各社で急速に進んでいる。
字節跳動(バイトダンス)、百度(バイドゥ)、華為技術(ファーウェイ)、阿里巴巴(アリババ)、騰訊(テンセント)といった中国を代表する企業もAIモデルを開発しているが、各社は自社サービスにDeepSeekを採用する動きを見せている。
現在、DeepSeekを採用していないのは、コンシューマー向け生成AI「豆包」(ドウバオ)などで国内トップのバイトダンスのみとなっている。
DeepSeek登場以来、米国でもオープンソース化が進展し、AI技術の社会実装がそれなりに加速する可能性はあるが、その効果がより大きいとみられる製造業の規模は中国の方が大きい。
政府部門でも効率化の効果が高いと予想されるが、社会主義国家である中国はその部分でも米国よりも規模が大きいとみられ、社会実装による付加価値向上のインパクトは中国の方が米国よりも大きいだろう。
各社がAIサービスの無料提供に踏み切る背景には、まずChatGPTの先行者利益に対抗するための顧客獲得戦略があります。無料提供によって、より大きなユーザー基盤を構築しようとしている。
また、AIの性能向上に不可欠な学習データの獲得競争も無料化を後押ししています。
無料提供によってユーザーの利用データを収集し、AIモデルの改善に活用できるメリットがある。
さらに、AIサービスの収益化モデルがまだ確立していないことも無料化が進む要因。Googleの広告モデルのように無料提供を前提とした上で、別の収益源を探る企業も増えていくだろう。
各社のAIサービス無料化により、ユーザーの選択肢は増え、AI技術の恩恵を受け易くなった。
しかしこの競争は「体力勝負」の様相を呈しており、長期的に持続可能なビジネスモデル構築が今後の重要課題となるだろう。
テック大手による無料AIサービスの競争は、業界の進化を加速させると同時に、新たなビジネスの可能性も広げていくことになる。
一方、2022年末に始まった世界的な生成AIブームを支えてきた技術トレンドは、ピークに達して限界に来たのではないかと噂されいる。
ChatGPTなど生成AIのベースとなる(前述の)大規模言語モデル(LLM)は、所謂「スケール則」と呼ばれる経験則がここに来て限界に達しつつあると見られている。
スケール則とは、「LLMの規模とそれが機械学習するデータの量を増やせば増やす程、その性能は指数関数的(天井知らず)に上昇する」という法則である。
GPU(AI半導体/画像処理・グラフィック用)を複数連結して高度な処理を行うためのサーバー、その冷却装置、ネットワーク接続を管理する機器、データを保存するストレージなど、様々な先端機器をAI専用に設計して互いに連結することで、漸くAIとして機能する。
しかし、巨額設備投資にはボトルネックの課題を解決する必要があり、巨大な電力需要(大都市レベルの電力を消費)とか、遅いネットワーク機器が足枷の制約になって、高性能な先端GPUの性能がアイドリング状態となり1/3しか発揮できなく、Nvidiaが窮地に陥っていると言う。
シンギュラリティ(AIがすべての人間の知能を超越する時点)の到来について、未来学者のレイ・カーツワイル氏は2045年頃に訪れると予想しているが、中には2030年頃にはその兆候がみられると予想する専門家もいる。
しかし、足元の最先端AIの学力は既に人類の上位数%ぐらいの能力に達している現状を考えれば、5年も掛からないのではなかろうか。少なくとも米系は強い信念を以て全力で設備投資を続けようとしている。
続く中国AIの衝撃、自ら判断し独立した思考と行動が可能な革新的AIエージェントManus(マヌス)だ。
https://forbesjapan.com/articles/detail/77669
Manusは、単なるチャットボットでも、近未来的なブランドを纏った改良型検索エンジンでもない。これは世界初の完全自律型AIエージェントであり、人間を補助するだけでなく、置き換えることを目的とするシステムだ。
Manusは監視なしにデジタル世界のネットワークを縦横無尽に動き回って検索し、最も熟練した専門家でさえ追いつくのが難しい速度と正確さで意思決定を行う。
単なるモデルではなく、自ら思考し判断して計画し、タスクを自律的に実行できるエージェントであり、まるで無制限の集中力を持つ人間と同じように、シームレスに現実世界をナビゲートする能力を持っている。

Manusが齎す、AIが「アシスタント」の域を超え「独立した行為主体」へ移り変わるという抜本的な転換で、強みの要はマルチエージェント構造にある。
情報をただ生成するだけでなく、それを適用して誤りを修正し、出力を洗練化できるシステムだからだ。
既存AIの受動的な支援から自律型で能動的な行動へと焦点を移した、新たなカテゴリーの知能システムである。
自律型AIエージェントの時代は既に幕を開け、中国が先頭を走っている。
他には、OpenAI競合アンソロピック創業者は「AIという名の“グレムリン”を放ってはいけない」、コンピュータの内部に“グレムリン”を放って、好き勝手にさせたいとは思いませんと言います。
映画「グレムリン」の話しは、飼育が難しい動物で幾つかの条件を守らなければ大変な事態になる物語で、安易な行動から街が破壊され死傷者も出て火災も発生し、君には未だこれを飼う資格は無いと引導を渡され引き取られます。
我々がAIエージェントを実装したプロダクトをリリースすることは、充分に考えられます。その際、最も難しいのは安全性、信頼性、予測可能性をいかに担保するかでしょう。
ここで、当旧HP2000/6/2---2020/9/16「科学や研究の目的を誤るな 便利さは何のための便利さなのか」で紹介しました様に、科学技術の進歩や発達などによって、私たちの人間生活に便利さと幸福と快適さなど密度の濃い時間や空間と、豊富な物質などを提供する便利で素晴らしく魅力的な時代であります。
それを有効に併用して大いに活用するのが人類の発明した様々な道具であります。従ってそれらには善悪の差別とか方向性は本来無いものです。
しかし、忘れてはならないのは、便利さというものは一概に善となることでも、T.P.Oにより場合によっては悪となることもあり、常に「諸刃の剣」という性質を合わせ持っているものです。
ですから、何かの発明や発見をされる科学の研究や技術に携わる人々は、正しく有益な人生観を学ぶ心掛けと、自ら生み出した技術に対して、それなりの責任感を持つことと使われ方にも注意を向ける必要があるでしょう。
情報をただ生成するだけでなく、それを適用して誤りを修正し、出力を洗練化できるシステムだからだ。
既存AIの受動的な支援から自律型で能動的な行動へと焦点を移した、新たなカテゴリーの知能システムである。
自律型AIエージェントの時代は既に幕を開け、中国が先頭を走っている。
他には、OpenAI競合アンソロピック創業者は「AIという名の“グレムリン”を放ってはいけない」、コンピュータの内部に“グレムリン”を放って、好き勝手にさせたいとは思いませんと言います。
映画「グレムリン」の話しは、飼育が難しい動物で幾つかの条件を守らなければ大変な事態になる物語で、安易な行動から街が破壊され死傷者も出て火災も発生し、君には未だこれを飼う資格は無いと引導を渡され引き取られます。
我々がAIエージェントを実装したプロダクトをリリースすることは、充分に考えられます。その際、最も難しいのは安全性、信頼性、予測可能性をいかに担保するかでしょう。
ここで、当旧HP2000/6/2---2020/9/16「科学や研究の目的を誤るな 便利さは何のための便利さなのか」で紹介しました様に、科学技術の進歩や発達などによって、私たちの人間生活に便利さと幸福と快適さなど密度の濃い時間や空間と、豊富な物質などを提供する便利で素晴らしく魅力的な時代であります。
それを有効に併用して大いに活用するのが人類の発明した様々な道具であります。従ってそれらには善悪の差別とか方向性は本来無いものです。
しかし、忘れてはならないのは、便利さというものは一概に善となることでも、T.P.Oにより場合によっては悪となることもあり、常に「諸刃の剣」という性質を合わせ持っているものです。
ですから、何かの発明や発見をされる科学の研究や技術に携わる人々は、正しく有益な人生観を学ぶ心掛けと、自ら生み出した技術に対して、それなりの責任感を持つことと使われ方にも注意を向ける必要があるでしょう。