Archives par mot-clé : Traduction

UTF-8 pour le chinois : il parait que ça marche

Publié dans Java | 2 commentaires

UTF-8
Alors alors, peut-on écrire du chinois avec de l’UTF-8 ? La réponse est : OUI !

Par contre, c’est un chinois simplifié qui ne contient donc pas tous les caractères chinois. Si on ne souhaite pas fricoter avec l’unicode, on peut aussi utiliser son homologue chinois (c’est-à-dire l’équivalent de l’UTF-8 (standard international) version chinoise. Bizarre non ?) : GB18030. Mais la encore, c’est du chinois simplifié. Pour avoir du chinois traditionnel, il faut faire face à Big5 (je trouve que le nom en jette !).

Tout ceci explique pourquoi la classe Locale de Java (qui permet de gérer la langue à utiliser) définit le raccourci : Locale.TRADITIONAL_CHINESE et Locale.SIMPLIFIED_CHINESE.

Pour info, Google.ch utilise l’UTF-8 et après quelques minutes de surf sur des sites chinois (avec une collègue chinoise qui m’a montré tout ça), il y a des sites en UTF-8 et des sites en GB18030.

J’aurai peut-être l’occasion de tester ça d’ici 3 semaines, si c’est le cas je confirmerai ou infirmerai ce billet.

Pour aller plus loin

Multilangue pour WordPress

Publié dans Wordpress | 3 commentaires

Comment rendre WordPress multilangue (ou multilingue, comme vous voulez) ? C’est-à-dire comment faire en sorte que les billets, les tags, les catégories, les pages et les liens, (voir le titre, les titres des menus, etc…) soient accessibles en différentes langues ? Il y a plusieurs solutions :

  • Modifier soit même WordPress
  • Modifier WordPress à l’aide d’un plugin Et plusieurs modes de traduction :
  • Traduction automatisée avec Google Translate ou autre (peu recommandé)
  • Traduction à la main de chaque billets, tags, catégories, pages, liens… (recommandé) C’est en général la traduction du design, du titre, des menus, etc, qui pose le plus de problèmes.

Continuer la lecture

Traduction instantannée avec BabelFish

Publié dans PHP objet | Un commentaire

Parce qu’il faut bien mettre un petit peu en pratique de temps en temps, je me suis amusé à créer une class qui implémente un module de traduction à l’aide de BabelFish (le système de traduction de Yahoo). En résumé, j’ai plusieurs attributs qui déterminent les différents paramètres de la classe (url de la page de retour, url de BabelFish, langue du message à traduire, langue de la traduction), le constructeur permet de définir ces deux derniers, puisque ce sont les seules succeptible de changer assez souvent ! (pour pouvoir faire du Espagnol -> Anglais ou Grec -> Chinois) L’url pour traduire une phrase avec BabelFish se décompose de la manière suivante :

  • http://fr.babelfish.yahoo.com/translate_txt : base de l’url
  • lp : langues à utiliser (ex : fr_en)
  • trtext : chaine de caractères à traduire. Les caractères accentués sont bien traités, mais les guillements et les espaces posent un problème. Il faut remplacer les espaces par des + ou des %20, quant aux guillemets, bah je n’arrive pas à savoir par quoi il fut les transformer, donc pour l’instant je bloque.

Et voilà, il n’y a plus qu’à faire un petit file_get_contents pour récupérer la page chargée par cet url, et une petite regex pour ne récupérer que la traduction : et le tour est joué !
Continuer la lecture