◯ 使い勝手を比較してみた。
2024年3月、米OpenAI(オープンAI)の「ChatGPT」に強力なライバルが出現した。それが米Anthropic(アンソロピック)の「Claude 3」だ。Anthropicは、複数のベンチマークテストで「ChatGPT」や米Google(グーグル)の「Gemini Ultra」よりも高いスコアを出すとうたっている。
筆者は「ChatGPT Team」を1人で使っているが、あまりにも「Claude 3」の評判がいいので契約してみた。ここでは「ChatGPT(モデルは主にGPT-4を利用)」と「Claude 3」の使い勝手を比較してみたい。
小説を要約してみる。
Claude 3には3つのモデルがある。無料で利用できるモデルが「Sonnet」だ。他には月額20ドルの有料版で利用できる「Opus」と「Haiku」がある。Opusは高い推論力を駆使して回答し、Haikuは高速に回答が可能だという。ここでは、ChatGPTと比較するため、Opusのモデルを利用した。
Claude 3の3つのモデルは、コンテキストウインドーや最大出力トークンが同じだ。コンテキストウインドーは最大20万トークンに対応し、最大出力トークンは4096トークンである。この巨大なコンテキストウインドーがClaude 3の大きな特徴といえる。一方、ChatGPTはモデルごとにコンテキストウインドーや最大出力トークンが異なる。
ChatGPTとClaude 3を比較するため、まず大量のテキストを読み込ませて要約してみた。テキストとして用いたのは、太宰治の小説「斜陽」だ。約9万5000文字で約10万3000トークンである。この小説の文章をコピーしてAI(人工知能)に覚えさせて要約してもらう。
ただしChatGPTのコンテキストウインドーが対応するトークン数は3万2000である。斜陽の文章をそのまま入力すると、文字数がオーバーとなり処理を継続できない。そこでAPI経由で利用した。API経由で利用すれば、12万8000トークンまで扱えるからだ。ChatGPTをAPI経由で利用する方法の1つとしてOpenAIのPlaygroundで試してみると、最後まで読み込めた。要約した文章を確認すると181文字だった。
続いて、Claude 3に同じ文章を入力した。Claude 3に長文をペーストすると、プロンプトではなくアイコンで貼り付けられる。チャット欄に命令だけを入力できるので、分かりやすいユーザーインターフェース(UI)といえる。
Claude 3が要約した文章は441文字で、しっかりとした内容に感じた。ChatGPTが要約した文章と比較すると、2倍以上の長さだ。また「Claude 3」の要約は「だ・である」調で書いてある。気が利いているように感じた。
ただし18万文字以上あり、約20万トークンの夏目漱石の小説「こころ」を読み込ませてみると、どちらも処理を継続できなかった。OpenAIのPlaygroundを使ってもエラーになり、Claude 3でも9%の容量オーバーと表示された。長文を入力する際はぎりぎりを狙わずに少し余裕を持たせたほうがよさそうだ。
「だ・である」調でブログの原稿を執筆してもらう。
次にChatGPTやClaude 3でブログの原稿を生成した。何も指定しないと「です・ます」調で出力するので「だ・である」調を指定してみる。お題は「フリーランスライターがAI時代に年収1000万円を稼ぐ方法」である。「年収1000万円」「生成AI」「ストックビジネス」を原稿に含めるため、必須のキーワードとして指定し、文字数は1000文字以上とした。
まずChatGPTで原稿を生成したところ、途中で処理が止まってしまった。作業の続行を指示してようやく原稿を生成できた。ChatGPTが生成した原稿は7段落で1170文字だ。内容は、AIをツールとして活用して、そこに独自の意見や感情を載せる。読者と深くつながるようにする。そして複数の収益源を確保して専門性を高め、自身のブランディングも行うべきだという。AIが生成した原稿は納得できる内容であり、筆者は読み込んでしまった。必須キーワードを重視しすぎている印象で文章も固く感じたが、十分なクオリティーといえるだろう。
一方のClaude 3は、処理を止めずに6段落で918文字の原稿を生成できた。数回生成してみたが1000文字を超えることはなかった。目的の文章量よりも多めの文字数を指定するといいだろう。Claude 3は、ライターの個性やセンスを打ち出して、読者のロイヤルティーを高めるべきだという。さらにコンテンツを資産化して、ビジネスモデルを多角化せよという内容だった。内容はChatGPTと似ているが、Claude 3が生成した原稿は少々具体性に欠けるという印象を受けた。その代わり、読みやすい文章になっており、ブログにはちょうどいい感じだ。
外国語の看板画像の内容を教えてもらう。
マルチモーダル対応が進むLLMは画像やPDFファイルをアップロードして、それらの内容を解説したり、要約したりできる。このような機能は外国語の看板を日本語で要約したり、複雑な図を解説したりする用途が考えられる。またアプリケーションやWebページの画像を基にコードを記述してもらうことも可能だろう。数学の図形問題を解いたり、自分が描いた絵に対してアドバイスをもらったりすることもできる。
ChatGPTは最大で20の画像ファイル(1つのファイルサイズの上限は20MB)をアップロードできる。画像ファイル以外は最大512MBまでアップロードできるが、利用できるのは200万トークンまでとなる。一方、Claude 3は最大で5つファイル(1つのファイルサイズの上限は10MB)を同時にアップロードできる。
試しに海外の公園で撮影した写真をアップロードして、看板の内容を日本語で要約してもらった。その結果、ChatGPTとClaude 3のどちらも問題なく要約できた。ただし使い勝手はChatGPTのほうがいいように感じた。ChatGPTはスマートフォン(以下、スマホ)のアプリを公開しているので、スマホで撮影した写真を手軽にアップロードして質問できるからだ。
Webブラウザーで動作するミニゲームを1分で作成する。
ChatGPTとClaude 3はコードを生成できる。そこでミニゲームを作ってみた。マウスを連打した回数を計測する簡単なゲームだ。作り方は簡単である。ゲーム要素を数行の文章で指示するだけだ。さくっとコードを生成してくれる。コードはテキストファイルとして保存し、HTML形式に変換すれば準備完了だ。
ChatGPTとClaude 3のどちらでも動作するミニゲームを作成できた。UIはかなり似ているが、Claude 3のほうが気配りできているような印象を受けた。ChatGPTは素直に指示通りに作ったイメージだ。一方、Claude 3で生成した具体的な指示をしていないのに領域内に「クリックしてください」と表示したり、残り時間をカウントダウンしたりする。
大きなデータをやり取りする際は制限に注意。
ChatGPTの特徴の1つに画像生成機能がある。「DALL-E 3」を利用して日本語の文章から画像を生成できる。画像生成AIである「Midjourney」や「Stable Diffusion」のようにリアルな写真を生成できないが、ブログの挿絵などには十分利用できる。もちろん商用利用も可能だ。またChatGPTのスマホアプリは、音声入出力が可能である。外出先で気軽に利用できるのはありがたい。
ChatGPTは3時間に40メッセージという利用制限があるが、Claude 3もやり取りするトークン数に制限がある。Claude 3の場合は大きなファイルをアップロードすると、より早く制限がかかってしまうように感じた。大きなデータを扱う場合は、質問を小出しにせずに複数の質問を列挙するほうが効率的に利用できる。ChatGPTを利用する際は、小出しに質問して内容を明確にすることが多い。生成AIによって活用法が異なるのは面白いと感じる。
以上がChatGPTとClaude 3の使い勝手を比較した結果だ。Claude 3はChatGPTのライバルであり、ChatGPTと互角の使い勝手を備えていると感じた。ただしUIに差は生じるが、筆者にはどちらが優れているとは断言できなかった。しばらくは両方とも契約し続け、さらに使い勝手を検証することにした。