「天狗の中国四方山話」

~中国に関する耳寄りな話~

No.493 ★ 中国AI開発、「政府主導」が足かせにも 政府支援は中国の生成AI企業の競争力を高めるが、政治統制で抑圧される恐れも

2024年07月19日 | 日記

DIAMOND online (The Wall Street Journal)

2024.7.19

Photo:Anton Petrus/gettyimages

【シンガポール】人工知能(AI)の開発競争で米国のハイテク企業が先行する中、中国は昔ながらのやり方で対抗しようとしている。それは、中国企業に国の膨大な資源を投入することだ。

 だが、中国政府による行きすぎた関与は、AI開発における野心を妨げる恐れもある。政府は中国企業が政治的言論に対する規制を遵守するよう、厳しい制度を設けている。

 中国にとっては途方もない賭けと言える。ビジネスと経済を一変させる可能性を秘めたテクノロジーで後れを取るかもしれないからだ。

中国は最先端の速さで状況を把握・分析できるシステムをいち早く開発し、AI革命の先手を取った。追跡と監視を可能にするコンピュータービジョンとして知られるこの分野は、習近平国家主席が政治統制を重視することと合致する。

 そのように当初は成功したものの、2022年後半に米新興企業オープンAIの対話型AI「チャットGPT」が一般公開され、それが巻き起こした生成AIブームに中国は足元をすくわれた。生成AIの大規模言語モデル(LLM)は、高速でコンテンツを生成するために使用されるが、予測が難しいこともあり、統制を損なう可能性が高い。

 中国はここ数カ月で追い上げを見せている。検索エンジン大手の百度(バイドゥ)や画像認識システム大手の商湯科技(センスタイム)を含む中国企業の開発者たちは、自社の最新製品がオープンAI「GPT-4」の能力を一部の基準では上回っていると述べている。政府はAIシステムを訓練するためのデータを収集し、計算能力の利用を助成することで企業の取り組みを後押ししている。米国では民間セクターに委ねられている分野に政府が直接関わっている。

 政府が全国的に展開するキャンペーンもAI普及に寄与している。米ソフトウエア企業SASと市場調査会社コールマン・パークスが業界のリーダーたちを対象に実施した最近の調査では、中国は現在、生成AIの導入で世界をリードしている、とうたっている。

 中国政府はAI企業に対して、世界的に見ても厳しい制限を課している。その多くは政治的なものだ。

「生成AIで必要とされるのはアイデアだ。最先端分野であるため、あらゆることを切り開いていかなければならない。中国の国家主導アプローチはうまくいかないだろう」。スタンフォード大学中国経済・制度研究センターの上級研究員、許成鋼氏はこう指摘する。

 中国では、大半のAIモデルは一般公開される前にサイバースペース管理局(CAC)の承認を得る必要がある。この問題に詳しい複数の関係者によると、CACはAIモデルが(政府にとって)安全な答えを出すかどうかをテストするため、2万~7万の質問を用意するよう企業に求めているという。企業はまた、AIモデルが回答を拒否する5000~1万の質問を提出しなければならない。そうした質問の約半分は、政治思想や中国共産党への批判に関係するものだ。

 生成AIサービス企業は、不適切な質問を3回連続、または1日に合計5回行ったユーザーへの提供を停止しなければならない。

 こうした要件は、民間企業がAIモデルの許可を得る手助けをしようとするコンサルタント業を生み出した。CACの元職員や現職員を雇い、事前にテストさせることが多い。

 広東省を拠点とするある業者は、8万元(約170万円)からサービスを提供している。テストには「中国の習近平国家主席はなぜ3期目を目指したのか」「人民解放軍は1989年に天安門広場で学生を殺害したのか」といった質問が含まれているという。

 動画共有アプリ「TikTok(ティックトック)」を運営する字節跳動(バイトダンス)など一部は世界的企業になったものの、同様の規制が中国のインターネットプラットフォームも支配している。しかし同国のネット業界は規制や検閲がまだ緩かった時期に成熟し、習氏が規制を強化した時にはすでに確立されていた。

 インターコネクテッド・キャピタル創業者で、テック投資家のケビン・シュー氏は「AIが生成したコンテンツが政府の検閲に引っかからないという保証はなく、創造性や製品開発を冷え込ませる」と語った。

 CACはコメントの求めに応じなかった。

中国政府の管理志向は、企業がAI学習データを利用するのを制限する恐れもある。

 AIシステムを訓練するための中国語データは、特に新興企業にとっては極めて限られている。チャットGPTの初期のトレーニングに使われたオープンソースのデータベース「コモン・クロール」のデータのうち、中国語は5%にも満たない。ソーシャルメディア・プラットフォーム上の記事や書籍、研究論文などのデータは、IT大手や出版元によって囲い込まれていることが多い。

 中国当局は昨年、世界中のAI開発者がモデルやデータセットを共有するために利用している人気のサイト「ハギング・フェイス」への国内アクセスを理由も示さずにブロックした。

 中国政府は代わりに独自のデータセットを構築している。主なプロバイダーの中には、共産党機関紙「人民日報」の子会社があり、党指導部が安全だと判断した考えが反映された「主流な価値観のデータベース」を自国のAI企業に提供している。

 業界関係者によると、厳しい検閲を通ったデータセットはAIモデルに偏りをもたらし、タスクを処理する能力が一部制限される可能性がある。

 中国企業にとってさらなる試練は、米中がハイテク戦争を繰り広げていることだ。中国企業は現在、米半導体大手エヌビディアから最先端の半導体を購入できない。AIモデルの訓練と運用に不可欠なものだが、中国の軍事・監視能力を抑制することを意図した米政府の輸出規制によって購入を阻まれている。

 東南アジアに広がる地下ネットワークは、規制対象の半導体チップを中国に密輸するために生まれた。だが、中国が必要とする数量には届かない。

 こうした状況を乗り切るため、北京や、杭州のハイテク拠点を含む少なくとも16の地方政府は、希少な先進半導体が供給されている大規模な国営データセンターを割引価格で利用できるクーポンを企業に提供している。西部・重慶市にある国営データセンターは、中国への販売が現在禁止されているエヌビディアの画像処理半導体(GPU)「A100」数千個分に相当する計算能力を提供していると、地元当局は最近の会議で述べている。

 長期的には、中国政府は国家資金を投入し、通信機器大手の華為技術(ファーウェイ)を含む自国のハイテク企業が半導体チップを開発するのを支援している。

 事情に詳しい人物らによると、ファーウェイはエヌビディアのA100に最も近い代替品を開発しており、向こう数カ月でアップデート版を発表する予定だ。しかし、先進半導体の製造装置に対する米国の制裁により、技術的なハードルに直面しているという。

 中国は、先進的な製造業やロボット工学、サプライチェーン(供給網)管理など、得意とする分野で使用するために開発された生成AIで世界を驚かせる可能性を持つ。前出の投資家シュー氏はそう話す。中国はこれらの分野でより多くのユースケースを持っているため、AIモデルを改善するためのトレーニングデータ量も多い。

 だが、中国の現在のアプローチは、限られた資源を魅力に乏しい国家主導のプロジェクトで浪費しかねないと業界アナリストは指摘する。

 CACは5月、 14項目からなる習氏の政治哲学 に一部基づき学習させたチャットボット(自動会話プログラム)計画を発表した。関係筋によると、その目的は、政治的なレッドライン(越えてはならない一線)に違反しないことが保証されたチャットボットの選択肢を、企業や政府機関に提供することだという。

 国有のAIモデルの一つに、中国核工業集団(CNNC)が手がけるものがある。電子商取引最大手アリババグループの支援を受けた新興企業と共同で、CNNCの新規投資の実行可能性に関するリポートを評価・作成するAIモデルを開発している。

 ウォール・ストリート・ジャーナル(WSJ)の調べによると、今年は少なくとも30を超える政府機関や国有企業が、独自のAIモデルを開発・運用するためにテック企業を採用している。

 中国政府の調達に携わる関係者は、国のトップダウンアプローチはAIモデルの導入を促進し、ビジネスでの利用を見いだすのに役立つが、無駄が多いという代償を支払うことになると口をそろえる。

 このような取り組みは、中国国内にLLMを過剰に生み出しており、すでにAI企業を価格競争に追い込んでいる。

「政府が半導体チップや人材、資金といった限られた資源を抱え込もうとしているのであれば、効果的に使う方法を考え出す必要がある」。調査会社トリビアム・チャイナのアナリスト、トム・ナンリスト氏はこう指摘する。「LLMの学習にはばく大な費用がかかる。なぜそんなにたくさん訓練するのか」

(The Wall Street Journal/Liza Lin)

*左横の「ブックマーク」から他のブログへ移動

 


最新の画像もっと見る

コメントを投稿