●問題点
終了するgooブログをgooブログweb機能からhtmlエクスポートすると
内部リンクがそのままに出力される。これは普通の仕様である。
ブログ全体の巨大なテキストファイル「export_blog_1.txt」を
移転先のブログツールに読み込ませると内部リンクは
「https://blog.goo.ne.jp/(私のID:soukagakkai_usotuki)/e/」
のままで登録されてしまう問題がある。
後日、リンク修正を移転先ブログGUI上から手作業ですることになる。
この修正は私の場合だとhttps:とhttp:とあわせリンク数が1550以上もある。
●補足 URL文字列の内部リンクとは?
私のブログであれば「a href」タグ内部にある
https://blog.goo.ne.jp/(私のID:soukagakkai_usotuki)/e/(ランダム文字列)
このURL文字列が内部リンクと言われる。
外部リンクとは
1)
https://blog.goo.ne.jp/(他人のID)/e/(ランダム文字列)
2)
https://blog.goo.ne.jp以外の別ドメイン/
この2つのURL文字列が
「blog.goo.ne.jp/(私のID:soukagakkai_usotuki)」
から外にアクセスする外部リンクと呼ばれる。
もう少し詳しく内部リンクを解説すると、
一つ前の記事である
「gooブログの縮小画像を元画像のリンク記述に変換する」
のURLは次のとおりである。
https://blog.goo.ne.jp/soukagakkai_usotuki/e/e186ed018183a9dddaa4d7f3585420d7
ドメインで始まり
https://blog.goo.ne.jp/
(ユーザーID)が次にあり
blog.goo.ne.jp/(私のID)/
エントリー?のeが次にあり
blog.goo.ne.jp/(私のID)/e/
最後にランダムな文字列である
e186ed018183a9dddaa4d7f3585420d7
でURLの文字列は構成されている。
これがリンク記述内に書かれたURLの文字列である。
(私のID:soukagakkai_usotuki)のgooブログ内から
「blog.goo.ne.jp/(私のID:soukagakkai_usotuki)/e/ランダム文字列」
にリンクジャンプするので内部リンクと呼ぶ。
●必要な条件と道具
gooブログの縮小画像を元画像のリンク記述に変換する - 創価学会の信仰に功徳はあるか?
と同じ。
●難易度が高く対象者は限定。
一つ前の記事の必要スキルに加えて別のスキルが必要である。
Perlの正規表現の記述ができる人向け
難易度は前の記事よりも高い。
プログラムは一文字でも間違えたら動かないし、
正規表現の表記規則は慣れてないと記述できない。
Perl正規表現の記述経験のある人向け。
入力ミスしたらデバッグする能力も必要。
周囲にMacやLinuxのUNIXやLinuxでperl スクリプトを実行スキルと
「Perl正規表現の記述経験」がある人がいればできると思われる。
Windowsテキストエディタである秀丸、EmEditor、サクラエディタなど
正規表現による検索置換があるらしいのですが、Perlと同じ
正規表現文法かどうか知りません。正規表現の経験者は多分
できると思います。
●事前準備
移転先ブログのユーザーIDを作る
移転先のブログURLを決める
はてなの場合(移転先ドメイン)は5つの候補から選択だそうです。
ブログURLを決めたら、移転先ブログURLの文字列を把握する。
●スクリプト実行の方針
ブログ全体の巨大なテキストファイル「export_blog_1.txt」
↓
link_converter.pl を実行
↓
link_converter.pl が「link_transfer_out.txt」を出力する
↓
「blog.goo.ne.jp/soukagakkai_usotuki/e/ランダム文字列」
が
「https://(移転先URL)(移転先ドメイン)/entry/ランダム文字列」
に変わっているのを数行だけでも目視で確認する。
↓
移転先ブログに「link_transfer_out.txt」をアップロードする
アップロードすると読み込みに数時間から半日くらい時間かかる。
↓
アップロード終了したら、移転先で
「https://(移転先URL)(移転先ドメイン)/entry/ランダム文字列」
変換後URLなリンクをクリックする。
すると移転先ブログから転送した各々の記事へと内部リンクし
問題ないことを2、3個だけでも確認する。
●perlコード(link_converter.pl)
動作保証や損害保証はしません。
読者責任で
(移転元blog.goo.ne.jp)/(読者自身のgooID)
と
(移転先URL)と(移転先ドメイン)などの正規表現記述を
変更する必要があります。
はてなの場合(移転先ドメイン)は5つの候補から選択だそうです。
正規表現の検索置換を含め、これらを熟知したPerl経験者限定で
ご自由にお使いください。はてなブログのみ対応です。

●ソースコードの結果
内部リンクだったhttpのsありsなし両方の
「blog.goo.ne.jp/soukagakkai_usotuki/e/」が
「https://(移転先URL)(移転先ドメイン)/entry/」
httpのsありだけとなり移転先ブログ内をリンクするに記述に変換された。
●動作実績と時短効果
移転先ブログでインポートやり直した。
いくつか内部リンクをクリックしたら移転先のブログ記事を表示した。
なお50もリンククリック確認はしてない。
手作業で置き換えると1500以上あるblog.gooリンク探しだけでも時間がかかる。
方針のとおりにスクリプト実行したところ、一瞬で終了し移転先URLに変換できる。
他のメリット
新規ブログ先でblog.gooリンクを探す必要はない。
HTML編集ミスや間違える余地がない。
●移転先ブログのプログラムがすべきこと?
「blog.goo.ne.jp/soukagakkai_usotuki/e/」
を変換し
「https://(移転先URL)(新規ドメイン)/entry/」にすべき?
●課題
ないと思われ。amebaブログはテスト未実施のため不明。
プログラマーには、Perl正規表現記述の難易度は高くない。
またAIが使える人もPerl以外でも使い方をわかっていればWindowsや他言語でも出来ると思われる。
●未定なままやらないこと。
「blog.goo.ne.jp/soukagakkai_usotuki/e/」を変換するだけで
「blog.goo.ne.jp/(他人のID)/e/」の記事リンクや
「blog.goo.ne.jp/(他人のID)」トップのリンクはそのままとした。
以上
終了するgooブログをgooブログweb機能からhtmlエクスポートすると
内部リンクがそのままに出力される。これは普通の仕様である。
ブログ全体の巨大なテキストファイル「export_blog_1.txt」を
移転先のブログツールに読み込ませると内部リンクは
「https://blog.goo.ne.jp/(私のID:soukagakkai_usotuki)/e/」
のままで登録されてしまう問題がある。
後日、リンク修正を移転先ブログGUI上から手作業ですることになる。
この修正は私の場合だとhttps:とhttp:とあわせリンク数が1550以上もある。
●補足 URL文字列の内部リンクとは?
私のブログであれば「a href」タグ内部にある
https://blog.goo.ne.jp/(私のID:soukagakkai_usotuki)/e/(ランダム文字列)
このURL文字列が内部リンクと言われる。
外部リンクとは
1)
https://blog.goo.ne.jp/(他人のID)/e/(ランダム文字列)
2)
https://blog.goo.ne.jp以外の別ドメイン/
この2つのURL文字列が
「blog.goo.ne.jp/(私のID:soukagakkai_usotuki)」
から外にアクセスする外部リンクと呼ばれる。
もう少し詳しく内部リンクを解説すると、
一つ前の記事である
「gooブログの縮小画像を元画像のリンク記述に変換する」
のURLは次のとおりである。
https://blog.goo.ne.jp/soukagakkai_usotuki/e/e186ed018183a9dddaa4d7f3585420d7
ドメインで始まり
https://blog.goo.ne.jp/
(ユーザーID)が次にあり
blog.goo.ne.jp/(私のID)/
エントリー?のeが次にあり
blog.goo.ne.jp/(私のID)/e/
最後にランダムな文字列である
e186ed018183a9dddaa4d7f3585420d7
でURLの文字列は構成されている。
これがリンク記述内に書かれたURLの文字列である。
(私のID:soukagakkai_usotuki)のgooブログ内から
「blog.goo.ne.jp/(私のID:soukagakkai_usotuki)/e/ランダム文字列」
にリンクジャンプするので内部リンクと呼ぶ。
●必要な条件と道具
gooブログの縮小画像を元画像のリンク記述に変換する - 創価学会の信仰に功徳はあるか?
と同じ。
●難易度が高く対象者は限定。
一つ前の記事の必要スキルに加えて別のスキルが必要である。
Perlの正規表現の記述ができる人向け
難易度は前の記事よりも高い。
プログラムは一文字でも間違えたら動かないし、
正規表現の表記規則は慣れてないと記述できない。
Perl正規表現の記述経験のある人向け。
入力ミスしたらデバッグする能力も必要。
周囲にMacやLinuxのUNIXやLinuxでperl スクリプトを実行スキルと
「Perl正規表現の記述経験」がある人がいればできると思われる。
Windowsテキストエディタである秀丸、EmEditor、サクラエディタなど
正規表現による検索置換があるらしいのですが、Perlと同じ
正規表現文法かどうか知りません。正規表現の経験者は多分
できると思います。
●事前準備
移転先ブログのユーザーIDを作る
移転先のブログURLを決める
はてなの場合(移転先ドメイン)は5つの候補から選択だそうです。
ブログURLを決めたら、移転先ブログURLの文字列を把握する。
●スクリプト実行の方針
ブログ全体の巨大なテキストファイル「export_blog_1.txt」
↓
link_converter.pl を実行
↓
link_converter.pl が「link_transfer_out.txt」を出力する
↓
「blog.goo.ne.jp/soukagakkai_usotuki/e/ランダム文字列」
が
「https://(移転先URL)(移転先ドメイン)/entry/ランダム文字列」
に変わっているのを数行だけでも目視で確認する。
↓
移転先ブログに「link_transfer_out.txt」をアップロードする
アップロードすると読み込みに数時間から半日くらい時間かかる。
↓
アップロード終了したら、移転先で
「https://(移転先URL)(移転先ドメイン)/entry/ランダム文字列」
変換後URLなリンクをクリックする。
すると移転先ブログから転送した各々の記事へと内部リンクし
問題ないことを2、3個だけでも確認する。
●perlコード(link_converter.pl)
動作保証や損害保証はしません。
読者責任で
(移転元blog.goo.ne.jp)/(読者自身のgooID)
と
(移転先URL)と(移転先ドメイン)などの正規表現記述を
変更する必要があります。
はてなの場合(移転先ドメイン)は5つの候補から選択だそうです。
正規表現の検索置換を含め、これらを熟知したPerl経験者限定で
ご自由にお使いください。はてなブログのみ対応です。

●ソースコードの結果
内部リンクだったhttpのsありsなし両方の
「blog.goo.ne.jp/soukagakkai_usotuki/e/」が
「https://(移転先URL)(移転先ドメイン)/entry/」
httpのsありだけとなり移転先ブログ内をリンクするに記述に変換された。
●動作実績と時短効果
移転先ブログでインポートやり直した。
いくつか内部リンクをクリックしたら移転先のブログ記事を表示した。
なお50もリンククリック確認はしてない。
手作業で置き換えると1500以上あるblog.gooリンク探しだけでも時間がかかる。
方針のとおりにスクリプト実行したところ、一瞬で終了し移転先URLに変換できる。
他のメリット
新規ブログ先でblog.gooリンクを探す必要はない。
HTML編集ミスや間違える余地がない。
●移転先ブログのプログラムがすべきこと?
「blog.goo.ne.jp/soukagakkai_usotuki/e/」
を変換し
「https://(移転先URL)(新規ドメイン)/entry/」にすべき?
●課題
ないと思われ。amebaブログはテスト未実施のため不明。
プログラマーには、Perl正規表現記述の難易度は高くない。
またAIが使える人もPerl以外でも使い方をわかっていればWindowsや他言語でも出来ると思われる。
●未定なままやらないこと。
「blog.goo.ne.jp/soukagakkai_usotuki/e/」を変換するだけで
「blog.goo.ne.jp/(他人のID)/e/」の記事リンクや
「blog.goo.ne.jp/(他人のID)」トップのリンクはそのままとした。
以上