2009年08月06日

2.取得したデータの加工(引っ越し先で取り込める形式に加工)(ブログへの引っ越し・力業編)

2.取得したデータの加工(引っ越し先で取り込める形式に加工)(ブログへの引っ越し・力業編)

この記事は、『ブログへの引っ越し・力業編』のシリーズ、
今回は、手順2.『2.取得したデータの加工(引っ越し先で取り込める形式に加工)』です。


手順1.『引っ越し元からのデータの取得はHP保存ソフトを使用する(ブログへの引っ越し・力業編)』では、
データエクスポート機能が無いブログ・HPのデータを、HP保存ソフトを使って取得しました。

もちろんこのままでは、ブログへのインポートができないので、インポートできる形式に加工します。
それも、一つ一つの加工ではなく、一気に加工します。

その時に使用するのが、下記の3つです。
・『Repl-Ace on .NET』:テキストファイルの変換ソフト
・若干の『正規表現』の知識
・『KanjiTranslator』:文字コード(改行コード)変換ソフト

・『Repl-Ace on .NET』:テキストファイルの変換ソフト
このブログでも何度か紹介したことがあります、
複数のテキストファイルのなかの複数の文字列を、一気に変換してくれる、神業的ソフト。
詳しくはこのブログの記事『(その3)gooブログからの移行・「Repl-Ace on .NET」は必須ツール』をご覧下さい。


・若干の『正規表現』の知識
単なる文字列の置き換えでは出来ないこことが、若干の正規表現の知識が有れば、可能になります。
例えば、
これ:■ 2008,09,13, Saturday を、
これ:DATE: 09/13/2008 00:00:00 に、変換できたりします。
(日付の並べ替えをしているんですが、お分かりいただけますか?)


・『KanjiTranslator』:文字コード(改行コード)変換ソフト
実は今回、『Repl-Ace on .NET』で文字列の置き換えをした際、文字化けに悩まされました。
アルファベットの置き換えでは問題ないのですが、日本語(全角文字)の置き換えをすると、とたんに文字化けします。

HP保存ソフトで保存したデータファイルが、『UTF-8』という文字コードで保存されていたので、
『Shift-JIS』という文字コードに一括変換したところ、文字化けが無くなりました。


これらのツールを使って、
HD保存ツールで取得したHPのデータを、
ブログにインポートできる形式(Movable Type形式)へと加工して行くわけです。


移行元の記事数が20本くらいなら手作業でも良いでしょうが、1000を超える記事数の際には、これらの方法でないと、とってもやってられません。


『3.引っ越し先へのインポート(ブログへの引っ越し・力業編)』へ続く。


 起業・開業を応援する鯖江の税理士法人川中経営
  税理士・ITコーディネータ 川中重司
posted by 福井県は鯖江市の税理士 at 00:00 | Comment(0) | TrackBack(0) | ・ブログの引っ越し
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。
この記事へのトラックバックURL
http://blog.sakura.ne.jp/tb/40034076
※ブログオーナーが承認したトラックバックのみ表示されます。
※言及リンクのないトラックバックは受信されません。

この記事へのトラックバック