Outre leur contenu, les fichiers que nous créons ou consultons sur notre ordinateur contiennent des informations. Ces données sont appelées métadonnées. Dans cet article, nous verrons comment consulter et modifier les métadonnées sous Ubuntu.
La fonction des métadonnées est Décrire, organiser et contextualiser un fichier afin de faciliter sa compréhension, sa recherche, sa classification et son analyse.
A quoi servent les métadonnées ?
Fonctions des métadonnées
- Recherche: L'explorateur de fichiers utilise les métadonnées pour afficher les fichiers par ordre alphabétique, type de fichier, date de création ou de modification.
- Organisation: Les métadonnées facilitent l'organisation de grandes quantités d'informations.
- Compréhension: Ils aident les systèmes automatisés, tels que les modèles d'intelligence artificielle, les moteurs de recherche ou les bibliothèques, à mieux comprendre le contenu.
Types de métadonnées
On peut les diviser en trois classes :
- Descriptif: Données permettant d'identifier le document, telles que le titre, l'auteur, la description et les mots-clés.
- De construction: Structure du document : titres, sous-titres, chapitres, format.
- Administrative: Autorisations, date de création, taille, format.
Comment afficher et modifier les métadonnées sous Ubuntu
Il existe plusieurs outils graphiques pour éditer les métadonnées, mais dans cet article, nous nous concentrerons uniquement sur ceux qui utilisent le terminal.
Les documents PDF ont les formats suivants :
- Qualification.
- Auteur
- Sujet
- Mots-clés.
- Date de creation
- Date de modification.
- Moteur de générateur.
- Logiciel utilisé pour la création.
- Protections et permis.
Il existe un autre format appelé XMP qui inclut également ces informations :
- Informations sur le droit d'auteur.
- Miniatures.
- Langues des documents.
- Étiquettes personnalisées.
Il existe deux commandes utiles pour afficher les métadonnées sous Ubuntu :
Informations PDF
S'installe avec :
sudo apt install poppler-utils
Utilisation:
pdfinfo nombre_archivo.pdf
Exiftool
Cet outil nous permet de visualiser les métadonnées au format XMP.
S'installe avec :
sudo apt install libimage-exiftool-perl
Utiliser
exiftool nombre_archivo.pdf
Pour modifier les métadonnées, nous utilisons la commande
exiftool -parámetro "nuevo contenido del parámetro"nombre _archivo.pdf
Dans notre exemple, si nous voulons traduire le titre :
exiftool -Title="Introducción a la programación en Python" Introduction_to_Python_Programming_-_WEB.pdf
Nous pouvons supprimer toutes les métadonnées avec :
exiftool -all= nombre_archivo.pdf
Au cas où nous regretterions de l'avoir supprimé, la commande crée une copie du fichier PDF et ajoute la précision « original » au nom.
Docx
Le format natif de Word inclut les métadonnées du document et les métadonnées de l'application.
Les métadonnées du document comprennent :
- Qualification.
- Auteur
- Dernière personne à l'avoir modifié.
- Nombre de révisions.
- Date de creation.
- Date de dernière modification.T
- Sujet
- Mot-clé.
- Catégorie.
- Catégorie
- Statut (Brouillon, final).
Métadonnées de l'application
- Modèle
- Logiciel utilisé.
- Nombre total de pages.
- Nombre de mots.
- Nombre de caractères.
- Nombre de lignes.
- Nombre de paragraphes.
- Paramètres de mise à l'échelle.
- Organisation.
- Nom du chef d'équipe.
Exiftool
La commande Exiftool Il peut également être utilisé pour consulter les métadonnées d'un document Word.
Utiliser
exiftool nombre_archivo.docx
Une autre façon de consulter les métadonnées consiste à modifier l'extension du fichier au format zip. Pour des raisons de sécurité, nous effectuerons cette opération sur une copie.
cp nombre_archivo.docx copia_archivo.zip
Nous décompressons le fichier et ouvrons le dossier dont nous avons besoin.
unzip copia_archivo.zip -d docxinfo
Nous avons lu les données des fichiers
cat docxinfo/docProps/core.xml
Pour les métadonnées des documents
cat docxinfo/docProps/apdp.xml
Pour les métadonnées de l'application
cat docxinfo/docProps/app.xml
Les deux utilisant outil exif Nous pouvons modifier manuellement les métadonnées. La procédure avec exiftool est identique à celle utilisée pour les fichiers PDF.
exiftool -parámetro "nombre_del_parámetro" nombre_del_archivo.docx
Nous pouvons faire la même chose manuellement comme suit :
Nous faisons une sauvegarde
cp nombre_archivo.docx copia_archivo.zip
Nous l'avons décompressé dans un dossier appelé métadonnées.
unzip copia_archivo.zip -d metadatos
Allons au dossier
cd metadatos
Nous ouvrons l'éditeur
pour les métadonnées des documents
nano docProps/core.xml
nano docProps/apdp.xml pour les métadonnées de l'application
Nous reconditionnons le fichier au format docx.
zip -r ../nombre_archivo2.docx *
La commande crée le nouveau document en dehors du répertoire. métadonnées.