Il s'agit d'une première liste de définitions utiles pour les termes utilisés dans l'ensemble du site Web.

Anonymisation des données

L'anonymisation des données fait référence au processus par lequel les informations qui pourraient conduire à l'identification d'un individu sont supprimées des données. L'anonymisation des données est un processus de désidentification des données, ce qui signifie que les données résultantes ne peuvent pas être liées aux données d'origine ; en d'autres termes, il ne peut pas être « ré-identifié ». Souvent, l'anonymisation des données inclut la transformation des données, ce qui implique des processus de changement de structure/format de données.

K-anonymisation

L'anonymisation K est une technique d'anonymisation des données qui rédige les cas tombant dans des ensembles de moins de k-1 membres, où chaque ensemble est défini par une combinaison unique de valeurs des différentes variables d'un ensemble de données. Cela signifie qu'il n'est pas possible d'interroger un ensemble de données et de renvoyer moins d'un nombre prédéterminé (k-1) de résultats, quelle que soit la requête. Le seuil approprié pour le nombre de résultats dépend de la nature de l'ensemble de données et de sa taille. Sur la base de recherches et de tests, k=11 pour les données CTDC, ce qui signifie que les cas ont été rédigés à partir de l'ensemble de données global de sorte que les requêtes adressées à l'ensemble de données global ne peuvent pas renvoyer moins de 10 résultats.

Livre de codes

Un livre de codes est un enregistrement complet mis à la disposition de toute personne souhaitant comprendre ou analyser l'ensemble de données. Il est particulièrement précieux pour les chercheurs et les analystes. Un livre de codes décrit le contenu et les variables d'un ensemble de données, y compris les définitions et les considérations méthodologiques. Il contient également les valeurs et les formats possibles pour toutes les variables. Des livres de codes sont fournis sur CTDC afin de comprendre les différentes sources de données de l'ensemble de données combiné, ainsi que les particularités de chacune des contributions.

Dictionnaire de données

Un dictionnaire de données décrit la structure d'une base de données ou d'un ensemble de données en répertoriant et en classant toutes les variables et en spécifiant le format dans lequel les données sont stockées. Il comprend également des tables de recherche pour les variables pertinentes. Il vise généralement à aider les programmeurs ou les administrateurs de bases de données à travailler avec un ensemble de données. Des dictionnaires de données sont fournis sur CTDC spécialement à l'usage des futurs contributeurs de données, afin qu'ils comprennent le format et les valeurs auxquels ils doivent adhérer.

Normalisation des données

Un ensemble de données standardisé est un ensemble de données pour lequel des définitions de données, des formats, des catégories et des structures communs de tous les éléments de données ont été convenus. Pour le CTDC Global Dataset, les données de différentes organisations contributrices sont combinées et standardisées afin de produire un ensemble de données unifié qui adhère à ces normes communes.

Désidentification

La désidentification des données fait référence au processus de suppression ou d'obscurcissement des informations des données individuelles d'une manière qui minimise le risque qu'un individu soit identifié à travers les données. Il existe différentes méthodes de désidentification des données, dont certaines ne transforment pas les données mais permettent de les « ré-identifier » et dont certaines suppriment définitivement les caractéristiques d'identification des données (telles que l'anonymisation).

SIG

SIG signifie Système d'Information Géographique. C'est un logiciel qui aide à visualiser, analyser et interpréter les données géographiques pour comprendre les relations, les modèles et les tendances. Les SIG permettent généralement d'afficher plusieurs couches d'informations géographiques sur une seule carte. CTDC utilise le SIG via le logiciel de cartographie ArcGIS. Ce logiciel cartographie les principales tendances de la traite des êtres humains sur la base des données des victimes identifiées ou assistées, aux niveaux national, étatique et régional, sans indiquer les coordonnées d'itinéraire spécifiques.