goo blog サービス終了のお知らせ 

上総の写真 (クリックすると壁紙サイズの写真(画像)になります)

風景や季節の花、神社、仏閣、建物、名所、旧跡、蝶、鉄道、花火など写真を壁紙サイズで公開します
Wall paper

足利 中橋 架け替え中

2025年04月25日 | 地域・名所・旧跡

アーチ状の橋

歩道等を取り除いてます。

手前の橋脚に載せます。

にほんブログ村 写真ブログ スナップ写真へ
あなたの一票が私を支えています

高校生(私)は、情報の授業があったりします。
GPTさんのお告げをメモしておきます。

✅ ゴール:gooブログの記事・画像をすべてFC2に完全移行

  • 記事本文:5000件(XMLから)

  • 画像:2万枚(ブログBも含む)

  • FC2形式で投稿再現

  • 再利用できるログ・データ管理を整備


🛠 ステップごとの概要

ステップ 内容
① XMLエクスポート gooブログの記事をバックアップファイルとして保存(.xml)→.TXTでした。
② 画像URL抽出 Pythonで .xml から全画像URL(ブログA・B両方)を抽出
③ 画像ダウンロード 安全にゆっくりダウンロード(1秒間隔、失敗ログ付き)
④ FC2へ画像アップ 手動またはFTP(※プレミアム限定)でFC2へ画像をアップロード
⑤ FC2形式に変換 Pythonで記事本文の画像URLを置換+FC2形式に変換し投稿

📁 ディレクトリ構成(推奨)

pgsql
<button class="flex gap-1 items-center select-none px-4 py-1" aria-label="コピーする">コピーする</button><button class="flex items-center gap-1 px-4 py-1 select-none">編集する</button>
C:\goo_migration\ ├── backup.xml ← gooからDLしたバックアップ ├── extracted_images\ ← ダウンロード画像保存フォルダ ├── image_logs\ │ ├── success.log ← ダウンロード成功ログ │ └── fail.log ← ダウンロード失敗ログ ├── image_urls.txt ← 抽出されたURL一覧 ├── converted_articles\ ← FC2形式記事保存フォルダ └── scripts\ ├── extract_urls.py ├── download_images.py └── convert_to_fc2.py

🧩 ステップ①:gooブログのバックアップ取得

  1. gooブログ管理画面にログイン

  2. 設定 → バックアップ → 「ブログ記事のエクスポート」

  3. .xml ファイル(例:backup.xml)を保存

    • ※複数ブログがある場合(ブログAとB)それぞれDL

📝 ヒント: 中身が のようになっていればOKです。


🧩 ステップ②:画像URLを抽出する(Pythonスクリプト)

extract_urls.py(準備中)

  • descriptionタグ内のHTMLを正規表現で抽出

  • img src="https://blogB.goo.ne.jp/..." 形式を対象

  • image_urls.txt に一覧出力


🧩 ステップ③:画像をゆっくりダウンロードする

download_images.py

  • 画像URLを1つずつアクセス

  • 成功 → extracted_images/ に保存 & success.log 記録

  • 失敗 → fail.log に記録(後で再実行可能)

  • 1000枚ごとに images_part_01/ などに保存先を切り替え

  • インターバル:time.sleep(1)


🧩 ステップ④:画像をFC2へアップロード

✅ 無料プランなら

  • FC2ブログ → 記事作成 → 「画像アップロード」

  • **1記事単位 or 一括(複数選択)**でアップ可能(1MB/枚以下)

  • 画像URLが https://blogimg.goo.ne.jp/…https://blog-imgs-123.fc2.com/yourname/… に変わる

✅ プレミアム会員なら

  • FTPアップロードも可能

  • 独自ディレクトリに画像配置して再リンクできる


🧩 ステップ⑤:記事本文をFC2形式に変換してインポート

convert_to_fc2.py

  • .xml → txt の記事本文からHTMLを抽出

  • 画像URLを新しいFC2のURLに置換

  • FC2が受け入れる形式(MT形式またはFC2形式)に整形

  • 完成した .txt ファイルをFC2ブログで一括インポート


✅ 安定運用のポイント

対策 内容
🔁 失敗時再試行 fail.logのURLだけ再実行可能な仕組み(あり)
💾 データ保存 ログ・画像・記事をすべて保存しておけば、何度でもやり直し可
⏱ スローダウン設計 1枚1秒、夜間実行などでgoo側の制限を回避

 

コメント    この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« 続き | トップ | 宇野亜喜良展 / 館林美術館 »
最新の画像もっと見る

コメントを投稿

地域・名所・旧跡」カテゴリの最新記事