هذه قائمة أولية من التعريفات المفيدة للمصطلحات المستخدمة في جميع أنحاء الموقع.
إخفاء هوية البيانات
يشير إخفاء هوية البيانات إلى العملية التي يتم من خلالها إزالة المعلومات التي قد تؤدي إلى تحديد هوية الفرد من البيانات. إخفاء هوية البيانات هو عملية إلغاء تعريف البيانات مما يعني أنه لا يمكن ربط البيانات الناتجة مرة أخرى بالبيانات الأصلية ؛ بعبارة أخرى ، لا يمكن "إعادة تعريفها". في كثير من الأحيان ، يتضمن إخفاء هوية البيانات تحويل البيانات ، والذي يتضمن عمليات تغيير هيكل / تنسيق البيانات.
إخفاء هوية K
إخفاء الهوية K هو أسلوب لإخفاء هوية البيانات يعمل على تنقيح الحالات التي تقع في مجموعات تضم أقل من أعضاء k-1 ، حيث يتم تحديد كل مجموعة من خلال مجموعة فريدة من قيم المتغيرات المختلفة في مجموعة البيانات. هذا يعني أنه من غير الممكن الاستعلام عن مجموعة بيانات وإرجاع عدد أقل من عدد (k-1) من النتائج المحدد مسبقًا ، بغض النظر عن الاستعلام. يعتمد الحد المناسب لعدد النتائج على طبيعة مجموعة البيانات وحجمها. بناءً على البحث والاختبار ، k = 11 لبيانات CTDC ، مما يعني أنه تم تنقيح الحالات من مجموعة البيانات العالمية بحيث لا يمكن للاستعلامات إلى مجموعة البيانات العالمية إرجاع أقل من 10 نتائج.
كتاب البرمجة
دفتر الرموز هو سجل شامل يتم توفيره لأي شخص يرغب في فهم مجموعة البيانات أو تحليلها. إنه ذو قيمة خاصة للباحثين والمحللين. يصف كتاب الشفرات محتوى ومتغيرات مجموعة البيانات ، بما في ذلك التعريفات والاعتبارات المنهجية. يحتوي أيضًا على القيم والصيغ الممكنة لجميع المتغيرات. يتم توفير دفاتر التشفير على مركز تطوير البرامجيات (CTDC) من أجل فهم مصادر البيانات المختلفة لمجموعة البيانات المجمعة ، فضلاً عن خصوصيات كل من المساهمات.
قاموس البيانات
يصف قاموس البيانات بنية قاعدة البيانات أو مجموعة البيانات من خلال سرد وتصنيف جميع المتغيرات ، وتحديد التنسيق الذي يتم تخزين البيانات ضمنه. يتضمن أيضًا جداول البحث عن المتغيرات ذات الصلة. يهدف عادةً إلى مساعدة المبرمجين أو مسؤولي قواعد البيانات على العمل مع مجموعة بيانات. يتم توفير قواميس البيانات على CTDC خاصة لاستخدام المساهمين بالبيانات في المستقبل ، بحيث يفهمون التنسيق والقيم التي يحتاجون إلى الالتزام بها.
توحيد البيانات
مجموعة البيانات الموحدة هي مجموعة بيانات تم الاتفاق على تعريفات وتنسيقات وفئات وهياكل البيانات المشتركة لجميع عناصر البيانات. بالنسبة لمجموعة البيانات العالمية CTDC ، يتم دمج البيانات من مختلف المنظمات المساهمة وتوحيدها من أجل إنتاج مجموعة بيانات موحدة تلتزم بهذه المعايير المشتركة.
إزالة الهوية
يشير إلغاء تحديد البيانات إلى عملية إزالة المعلومات أو حجبها من البيانات على المستوى الفردي بطريقة تقلل من مخاطر التعرف على الفرد من خلال البيانات. هناك طرق مختلفة لإلغاء تعريف البيانات ، بعضها لا يحول البيانات ولكنه يسمح "بإعادة تحديدها" وبعضها يزيل بشكل دائم ميزات التعريف من البيانات (مثل إخفاء الهوية).
GIS
GIS تعني نظام المعلومات الجغرافية. إنه برنامج يساعد على تصور البيانات الجغرافية وتحليلها وتفسيرها لفهم العلاقات والأنماط والاتجاهات. يسمح نظام المعلومات الجغرافية عادةً بعرض طبقات متعددة من المعلومات الجغرافية على خريطة واحدة. يستخدم CTDC GIS من خلال برنامج رسم الخرائط ArcGIS. يرسم هذا البرنامج خرائط للاتجاهات الرئيسية للاتجار بالبشر استنادًا إلى بيانات الضحايا التي تم تحديدها أو مساعدتها ، على مستوى الدولة والولاية والمستوى الإقليمي ، دون الإشارة إلى إحداثيات مسار محددة.