Caradoc : une boîte à outils pour décortiquer et analyser sereinement les fichiers PDF

Entrée en langue française / French entry Catégorie: Conférence avec actes
Auteurs: Guillaume Endignoux et Olivier Levillain
Date: juin 2017
Série: PDF

PDF est un format de document largement utilisé, complexe, et exploité pour la diffusion de logiciel malveillant. Il semble donc pertinent de l'étudier. Pour compléter la panoplie d'outils existants, nous présentons caradoc, une boîte à outils pour disséquer des fichiers PDF de manière robuste et fiable. L'apport de caradoc est d'insister sur les aspects bas-niveau de la dissection parsing, là où de nombreux outils partent généralement d'une structure déjà interprétée pour leurs analyse. Or l'étape d'interprétation des structures bas-niveau est connue pour être complexe et pour introduire de la confusion dans des lecteurs PDF courants.

Un article scientifique présentant notre démarche a été publié au workshop LangSec qui s'est tenu en marge de la conférence IEEE S\&P en 2016. L'outil est disponible soit sous la forme d'un paquetage Debian, soit sur GitHub (voir liens ci-dessous).

Publié dans les actes Symposium sur la Sécurité des Technologies de l'Information et de la Communication (pages 173 à 180)

Présenté lors de la conférence SSTIC à Rennes, France en juin 2017

BibTeX Document Article dans les actes Présentation caradoc_0.3-1_amd64.deb caradoc_0.3.1-1--jessie_amd64.deb caradoc_0.3.1-1--stretch_amd64.deb Projet sur GitHub