Comment afficher et modifier les métadonnées sous Ubuntu

Afficher et modifier les métadonnées sous Linux

Outre leur contenu, les fichiers que nous créons ou consultons sur notre ordinateur contiennent des informations. Ces données sont appelées métadonnées. Dans cet article, nous verrons comment consulter et modifier les métadonnées sous Ubuntu.

La fonction des métadonnées est Décrire, organiser et contextualiser un fichier afin de faciliter sa compréhension, sa recherche, sa classification et son analyse.

A quoi servent les métadonnées ?

Fonctions des métadonnées

  • Recherche: L'explorateur de fichiers utilise les métadonnées pour afficher les fichiers par ordre alphabétique, type de fichier, date de création ou de modification.
  • Organisation: Les métadonnées facilitent l'organisation de grandes quantités d'informations.
  • Compréhension:  Ils aident les systèmes automatisés, tels que les modèles d'intelligence artificielle, les moteurs de recherche ou les bibliothèques, à mieux comprendre le contenu.

Types de métadonnées

On peut les diviser en trois classes :

  • Descriptif: Données permettant d'identifier le document, telles que le titre, l'auteur, la description et les mots-clés.
  • De construction: Structure du document : titres, sous-titres, chapitres, format.
  • Administrative: Autorisations, date de création, taille, format.

Comment afficher et modifier les métadonnées sous Ubuntu

Il existe plusieurs outils graphiques pour éditer les métadonnées, mais dans cet article, nous nous concentrerons uniquement sur ceux qui utilisent le terminal.

PDF

Les documents PDF ont les formats suivants :

  • Qualification.
  • Auteur
  • Sujet
  • Mots-clés.
  • Date de creation
  • Date de modification.
  • Moteur de générateur.
  • Logiciel utilisé pour la création.
  • Protections et permis.

Il existe un autre format appelé XMP qui inclut également ces informations :

  • Informations sur le droit d'auteur.
  • Miniatures.
  • Langues des documents.
  • Étiquettes personnalisées.

Il existe deux commandes utiles pour afficher les métadonnées sous Ubuntu :

Informations PDF

S'installe avec :

sudo apt install poppler-utils

Utilisation:

pdfinfo nombre_archivo.pdf

Métadonnées PDF

Exemple de la commande PDFINFO

Exiftool

Cet outil nous permet de visualiser les métadonnées au format XMP.

S'installe avec :

sudo apt install libimage-exiftool-perl

Utiliser

exiftool nombre_archivo.pdf

Exemple de métadonnées au format XMP

Exemple d'utilisation du programme Exiftool

Pour modifier les métadonnées, nous utilisons la commande
exiftool -parámetro "nuevo contenido del parámetro"nombre _archivo.pdf
Dans notre exemple, si nous voulons traduire le titre :

exiftool -Title="Introducción a la programación en Python" Introduction_to_Python_Programming_-_WEB.pdf

Les métadonnées du titre ont été modifiées avec Exiftool.

La commande Exiftool permet de modifier les métadonnées

Nous pouvons supprimer toutes les métadonnées avec :

exiftool -all= nombre_archivo.pdf

Au cas où nous regretterions de l'avoir supprimé, la commande crée une copie du fichier PDF et ajoute la précision « original » au nom.

Docx

Le format natif de Word inclut les métadonnées du document et les métadonnées de l'application.

Les métadonnées du document comprennent :

  • Qualification.
  • Auteur
  • Dernière personne à l'avoir modifié.
  • Nombre de révisions.
  • Date de creation.
  • Date de dernière modification.T
  • Sujet
  • Mot-clé.
  • Catégorie.
  • Catégorie
  • Statut (Brouillon, final).

Métadonnées de l'application

  • Modèle
  • Logiciel utilisé.
  • Nombre total de pages.
  • Nombre de mots.
  • Nombre de caractères.
  • Nombre de lignes.
  • Nombre de paragraphes.
  • Paramètres de mise à l'échelle.
  • Organisation.
  • Nom du chef d'équipe.

Exiftool

La commande Exiftool Il peut également être utilisé pour consulter les métadonnées d'un document Word.

Utiliser

exiftool nombre_archivo.docx

Afficher les métadonnées d'un document Word

La commande exiftool peut également être utilisée pour afficher les métadonnées d'un document Word.

Une autre façon de consulter les métadonnées consiste à modifier l'extension du fichier au format zip. Pour des raisons de sécurité, nous effectuerons cette opération sur une copie.

cp nombre_archivo.docx copia_archivo.zip

Nous décompressons le fichier et ouvrons le dossier dont nous avons besoin.

unzip copia_archivo.zip -d docxinfo

Nous avons lu les données des fichiers

cat docxinfo/docProps/core.xml

Pour les métadonnées des documents

cat docxinfo/docProps/apdp.xml

Pour les métadonnées de l'application

cat docxinfo/docProps/app.xml

Les deux utilisant outil exif Nous pouvons modifier manuellement les métadonnées. La procédure avec exiftool est identique à celle utilisée pour les fichiers PDF.
exiftool -parámetro "nombre_del_parámetro" nombre_del_archivo.docx
Nous pouvons faire la même chose manuellement comme suit :

Nous faisons une sauvegarde

cp nombre_archivo.docx copia_archivo.zip

Nous l'avons décompressé dans un dossier appelé métadonnées.

unzip copia_archivo.zip -d metadatos

Allons au dossier

cd metadatos

Nous ouvrons l'éditeur

nano docProps/core.xml
pour les métadonnées des documents

nano docProps/apdp.xml pour les métadonnées de l'application
Nous reconditionnons le fichier au format docx.

zip -r ../nombre_archivo2.docx *
La commande crée le nouveau document en dehors du répertoire. métadonnées.