Archives par mot-clé : Google

Publier un billet sur Dotclear via Google Documents avec XML/RPC

Publié dans Dotclear | 2 commentaires

Sur Dotclear (et d’autres blogs), il est possible de publier un billet sans passer par l’interface d’administration. J’ai découvert cette fonctionnalité assez magique il y a quelques temps, et j’avoue ne pas m’en servir souvent, mais par exemple, aujourd’hui j’écris ce billet à partir de Google Documents ! Si, si, c’est vrai ! J’ai coché une petite case sur Dotclear, j’ai configuré Google Documents comme il faut, et ça marche.
Ce petit miracle, est possible grâce à XML/RPC. C’est un protocole RPC (Remote Procedure Call) qui permet en gros d’utiliser du XML pour faire dialoguer mon blog Dotclear et Google Documents.

Mode d’emploi

Il faut tout d’abord aller dans l’interface d’administration de Dotclear (Tableau de bord > Paramètre du blog) et dans Configuration du blog, cocher : Activer l’interface XML/RPC.

Le petit lien plus d’informations nous mène en bas de la page et fournit toutes les infos pour configurer Google Documents (ou autre).

Maintenant, il faut se rendre sur Google Documents. On créé un document texte classique, et on écrit ce que l’on souhaite dedans.
Reste ensuite à publier le document sur un blog. Pour cela, il faut cliquer sur Partager > Publier en tant que page Web …. Cela nous mène à la page suivante :

Avant de publier le billet, il va falloir paramétrer l’envoi.

Rien de bien compliqué, il suffit de suivre les informations fournies par Dotclear.
En cliquant sur Envoyer dans mon blog, le billet est automatiquement publié ! Magie !

Dans le cas de Google Documents, le corps du billet est le corps du document, et le titre correspond aux premiers mots de la première ligne. L’inclusion du titre du document lors de l’envoi ne fonctionne pas. Et je n’arrive pas à préciser la catégorie. Bref, ce n’est pas ce qui se fait de plus pratique, mais si on a quelque chose d’écrit sur Google Documents et que sur un coup de tête on décide de le publier sur son blog, ça peut servir.
Petit avantage/désavantage tout de même, les images sont stockés chez Google. ça peut être pratique si vous avez peu d’espace disque, mais c’est quand même mieux d’avoir tout chez soit !

Pour aller plus loin

Je fournis à Google Documents le script XML/RPC sur mon blog qui se charge de publier un billet. Ce script demande un mot de passe à Google, je le luis fournis, et je lui dis aussi quel billet envoyer. Google Documents transforme tout ça au format XML qui va bien, Dotclear re-transforme ça au format qui lui va bien, et c’est gagné !
Si je saisis bien, XML/RPC est l’ancêtre du SOAP (Simple Object Access Protocol) qui est plus couramment employé aujourd’hui.

Google indexerait-il si rapidement ?

Publié dans Geekeries | 4 commentaires

Il y a quelques minutes j’ai écris un billet sur [CONCAT en MYSQL|/post/2009/Mysql-et-la-recherche-sur-plusieurs-champs-avec-concat-ou-concat_ws], et comme à mon habitude, j’ai tapé  »mysql concat concat_ws rétrolien » pour trouver d’éventuels billets de blogs auxquels je pourrai envoyer un rétrolien. Mais qu’elle ne fut pas ma surprise en voyant un lien vers le billet que je venais juste d’écrire dans les résultats de Google : [((/public/Divers/.google-dingue_m.jpg|Google crawl en moins de 12 minutes|C|Google crawl en moins de 12 minutes, oct. 2009))|/public/Divers/google-dingue.jpg] Google a indexé une page que je venais de créer il y a seulement 12 minutes… J’avoue ne pas comprendre comment cela est possible ! C’est dingue. J’imagine que c’est grâce au Ping-o-Matic! et Google Blog Search de Dotclear. Je n’ai jamais vraiment compris à quoi servent ces trucs, ni comment ils fonctionnent, mais je crois qu’il va falloir que je m’y penche sérieusement. Ou alors c’est dû au nouveau système [Google Social Search|http://www.zorgloob.com/2009/10/google-social-search-votre-reseau-la.asp] qui cherche dans les contenus très récent. Dans tous les cas, c’est très surprenant ! (et je suis un peu deçu d’avoir changé l’url de ma page depuis ces 12 minutes, parce que pour le coup, le lien de Google mène vers une jolie page 404) %%% Allez savoir… Au fait, Google a un système pour voir les résultats d’une recherche sur ce qui a été indexé il y a moins de 3 jours, 2 jours, … moins d’1h ! Et mon précédent billet apparait bien (avec le bon url en prime). Bref, dingue ! [Exemple avec le mot clef « Google »|http://www.google.fr/search?hl=fr&q=google&as_qdr=h&btnG=Rechercher&meta=&aq=f&oq=]

Problème SEO Dotclear : pages archives – pages billets

Publié dans Dotclear | Laisser un commentaire

Calendrier 30minparjour
L’autre jour je surfais un peu sur mon site (on s’ennuie toujours quand on s’ennuie. Je me console en me disant que ça me permet de trouver des bugs ou des fautes de frappes) et en utilisant les liens du calendrier, je me suis fait la réflexion suivante : Sur mon blog, en général, j’écris au maximum 1 billet par jour. (et parfois aucun ;-)) Par conséquent, le contenu d’une page billet (exemple) est presque le même que le contenu d’une page archive du même jour. (exemple) La question est donc : n’y a-t-il pas un risque que Google et ses comparses prennent cela comme du duplicate content (+ de 70-75% de similitude entre 2 pages) et ralentissent le scrawling de mon site ?
Continuer la lecture

Parlons de sitemaps

Publié dans XML | Laisser un commentaire

A vrai dire il y a 2 types de sitemaps, puisque 2 utilisations possible des dites sitemaps :

  • La sitemap pour les visiteurs, plus communément appelée « Plan du Site ». Son but est d’aider le visiteur à se repèrer, elle doit donc être jolie, bien mise en forme, et ne pas contenir trop de liens. Google n’aime pas quand le nombre d’urls sur une page approche les 100, donc une sitemap ne doit afficher que les liens importants, et à la rigueur les articles en vues.
  • La sitemap pour les robots, comme les robots de moteur de recherche. Son but est d’aider les moteurs de recherche à indexer plus rapidement toutes les pages d’un site Internet. Qu’importe la beauté, c’est donc la structure du fichier qui compte puisqu’un protocole a été mise en place pour standardiser tout ça. Une sitemap peut contenir autant d’url que l’on veut, tant que l’on s’y prend bien. (puisqu’en fait on peut créer plusieurs sitemaps que l’on liste avec une sitemapindex)

Je vais m’attarder un tout petit peu sur le deuxième type de sitemaps puisque j’ai dû générer la sitemaps d’un site de plus de 3 millions de pages, ce qui m’a un peu forcé à me pencher sur la question. (j’étais bien guidé cela dit !)

Le protocole Sitemap

Sitemap classique

Deux choix pour les sitemaps classiques * Un fichier texte avec tous les urls à la ligne. Pas top. * Un fichier XML bien mis en page avec possibilité de spécifier certaines options. Bien mieux ! C’est là dessus que je vais m’attarder.
Voici la tête d’une petite sitemap XML avec 3 urls :

 <?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   <url>  
      <loc>http://la-bnbox.fr/cahier.html</loc>
      <lastmod>2009-07-10</lastmod>
      <changefreq>weekly</changefreq>
      <priority>0.8</priority>
   </url>
   <url>
      <loc>http://la-bnbox.fr/t18-francais.cahier</loc>
      <lastmod>2009-07-25</lastmod>
      <changefreq>weekly</changefreq>
      <priority>0.7</priority>
   </url>
   <url>
      <loc>http://la-bnbox.fr/554-Prepa-PSI--Penser-l-Histoire---Introduction.cahier</loc>
      <lastmod>2009-07-25</lastmod>
      <changefreq>yearly</changefreq>
      <priority>0.5</priority>
   </url>
</urlset>

L’entête est assez classique, mais on peut noter que l’encodage est en UTF-8 et qu’il faut qu’il soit en UTF-8.
Et on peut résumer un bloc pour un url de cette manière :
Continuer la lecture

Google Alertes

Publié dans Référencement | Un commentaire

Je viens de découvrir un outils qui peut être bien utile lorsque l’on s’intéresse à un sujet en particulier, ou plus pratiquement, si l’on souhaite surveiller les sites parlant d’un thème similaire au(x) sien(s) sur la Toile. Il s’agit de Google alertes.

L’idée est toute simple : j’ai un site sur les brioches et je veux savoir l’actualité de la brioche sur le Web. J’inscris le mot clef « brioche » dans ma liste de termes recherchés de Google Alertes, et ce dernier m’indiquera au fil du temps par e-mail ou via un flux RSS (visible directement via Google reader) les derniers sites qui en parle. Cela permet, par exemple, de faire des rétro-liens sur des billets intéressants parlant du même sujet que les siens, ou de donner des compléments d’informations, ou des remarques sur le forum ou les commentaires du site en question, avec un lien vers son propre site dans la signature.

Bref, on n’arrête pas le progrès ! (et moi j’apprends de plus en plus de choses dans le domaine du référencement)

Etude SEO : Bible Ipsum

Publié dans Référencement | Laisser un commentaire

Petite étude SEO (Search engine optimization) pour le site Bible Ipsum.
Le but ? Le faire remonter un peu sur Google pour y amener des visiteurs. Bon certes, je ferai peut-être mieux de commencer par coder le système pour aider à traduire le site facilement, et corriger 2-3 bugs aussi, voir ajouter quelques fonctionnalités. Mais bon… C’est ma première étude SEO.
A ma connaissance ce n’est pas franchement une science, ça s’apprend sur le tas, en testant, en lisant des articles ou des livres, et en observant ceux dont c’est le métier.

Mots clefs à travailler (et leurs déclinaisons) : (26)

  • Bible Ipsum
  • Lorem Ipsum, lipsum, dolor sit amet
  • Texte d’attente, de remplissage, de production, de pré-production
  • Paragraphe d’attente, de remplissage, de production, de pré-production
  • Générateur de texte d’attente, de remplissage, de production, de pré-production
  • Générateur de paragraphes d’attente, de remplissage, de production, de pré-production
  • Générateur de lignes
  • Générateur de mots
  • générateur de texte aléatoire
  • Générateur
  • Bible
  • Psaumes + Psaumes n
  • Texte de remplissage dans votre langue, en latin
  • (optimiser) lecture sur écran !!Table motclef motclef(id, kw, titre, texte, type(1 normal, 2 psaumes n))

Continuer la lecture