
この記事は、『ブログへの引っ越し・力業編』のシリーズ、
今回は、手順2.『2.取得したデータの加工(引っ越し先で取り込める形式に加工)』です。
手順1.『引っ越し元からのデータの取得はHP保存ソフトを使用する(ブログへの引っ越し・力業編)』では、
データエクスポート機能が無いブログ・HPのデータを、HP保存ソフトを使って取得しました。
もちろんこのままでは、ブログへのインポートができないので、インポートできる形式に加工します。
それも、一つ一つの加工ではなく、一気に加工します。
その時に使用するのが、下記の3つです。
・『Repl-Ace on .NET』:テキストファイルの変換ソフト
・若干の『正規表現』の知識
・『KanjiTranslator』:文字コード(改行コード)変換ソフト
・『Repl-Ace on .NET』:テキストファイルの変換ソフト
このブログでも何度か紹介したことがあります、
複数のテキストファイルのなかの複数の文字列を、一気に変換してくれる、神業的ソフト。
詳しくはこのブログの記事『(その3)gooブログからの移行・「Repl-Ace on .NET」は必須ツール』をご覧下さい。
・若干の『正規表現』の知識
単なる文字列の置き換えでは出来ないこことが、若干の正規表現の知識が有れば、可能になります。
例えば、
これ:■ 2008,09,13, Saturday を、
これ:DATE: 09/13/2008 00:00:00 に、変換できたりします。
(日付の並べ替えをしているんですが、お分かりいただけますか?)
・『KanjiTranslator』:文字コード(改行コード)変換ソフト
実は今回、『Repl-Ace on .NET』で文字列の置き換えをした際、文字化けに悩まされました。
アルファベットの置き換えでは問題ないのですが、日本語(全角文字)の置き換えをすると、とたんに文字化けします。
HP保存ソフトで保存したデータファイルが、『UTF-8』という文字コードで保存されていたので、
『Shift-JIS』という文字コードに一括変換したところ、文字化けが無くなりました。
これらのツールを使って、
HD保存ツールで取得したHPのデータを、
ブログにインポートできる形式(Movable Type形式)へと加工して行くわけです。
移行元の記事数が20本くらいなら手作業でも良いでしょうが、1000を超える記事数の際には、これらの方法でないと、とってもやってられません。
『3.引っ越し先へのインポート(ブログへの引っ越し・力業編)』へ続く。
起業・開業を応援する鯖江の税理士法人川中経営
税理士・ITコーディネータ 川中重司