Lire un document Office, OpenDocument ou PDF, ou autre format riche programmatiquement en Qt / C++ / autre… comme il fallait s’y attendre, ce n’est pas de la tarte ! Apparemment, il est relativement faisable d’afficher un document PDF, Office ou LibreOffice directement via un objet Qt, ou une bibliothèque. Mais ici, je cherche à lire le contenu, afin de pouvoir en extraire des morceaux suivant un patron (vous l’aurez deviné, c’est un document de norme, dont j’aimerai extraire la liste des exigences ><).
Voici une liste des ressources que j’ai pu trouver sur le sujet. Je n’ai rien testé pour l’instant.
- Documentation Qt : Handling document formats explique le principe général. Des sous-articles sont censés explicités pour Word, Excell, Writer, …
- Handling Word, et un exemple de code avec Excel
- Handling PDF, notamment la bibliothèque poppler
- De la doc Microsoft
- Un outils Qt : OpenDocument reader / writer (LGPL)
- Un outils de KDE appelé Okular et compilé en Qt permet de lire des documents OpenDocument et autre ! En général avec KDE il y a toujours des dépendances de partout avec le reste de KDE, à voir…
- Une initiative de quelqu’un pour écrire de l’OpenDocument en Qt
- Lire le format RTf : librtf pour C/C++