Spostare (o migrare) l’intero blog di Splinder
Nel post precedente ho spiegato come ottenere la lista dei post di un blog su Splinder, magari in Excel. Da questa lista ho ottenuto l’elenco dei codici dei post. Ognuno ha un codice univoco che viene utilizzato nell’URL per visualizzare il singolo post, del tipo http://<nomeblog>.splinder.com/post/123456789.
Utilizzando tale URL ho scritto un programmino in C# che, dato un elenco di codici dei post, chiamasse la pagina relativa e ne catturasse la parte “interessante”, cioè post e commenti, scartando testata, spalle e piede della pagina. Ho anche inserito un temporizzatore tra una chiamata e l’altra, per non causare una raffica di chiamate a Splinder che potessero essere interpretate come DOS.
Ottenuta la porzione di HTML contenente il post l’ho elaborata con una raffica di sostituzioni utilizzando le espressioni regolari per ottenere un file XML pulito contenente l’intero blog. Questa è la parte più impegnativa, perché togliere o sostituire i tag HTML senza corrompere i dati è un’operazione da condurre con molta cautela.
Sono a caccia di idee per migliorare questa fase di pulizia.
Il prossimo passaggio sarà l’importazione verso Blogger. Ma questa si preannuncia una strada in discesa, con le API di Google e la loro documentazione.

Blogger non consente l’importazione di commenti con utenti diversi da quello loggato.
Giusto, ma è possibile inserire comunque nel piede del commento una scritta del tipo “originariamente postato da … il …”.