English →

FAIR 원칙

FAIR라는 용어는 2014년 로렌츠 워크숍(Lorentz Workshop)에서 유래했으며, 이를 통해 2016년 연구 자료를 찾기 쉽고(Findable), 접근하기 쉽고(Accessible), 상호운용성이 뛰어나며(Interoperable), 재사용이 가능하도록(Reusable) 만들기 위한 15가지 지침 원칙이 발표되었습니다.

FAIR 원칙은 데이터, 메타데이터, 그리고 이를 지원하는 인프라(예: 검색 엔진)에 적용됩니다. 특히 기계 실행 가능성(machine-actionability), 즉 사람의 개입을 최소화하면서 시스템이 데이터를 탐색·접근·상호운용·재사용할 수 있는 능력을 강조합니다.

탐색성 (Findability)

데이터를 (재)사용하기 위한 첫 단계는 데이터를 찾는 것입니다. 메타데이터와 데이터는 사람과 컴퓨터 모두에게 쉽게 발견될 수 있어야 합니다.

  • F1. (메타)데이터는 전역적으로 고유하고 영구적인 식별자가 할당되어야 한다.
  • F2. 데이터는 풍부한 메타데이터로 기술되어야 한다.
  • F3. 메타데이터는 기술하는 데이터에 대한 명확하고 명시적인 식별자를 포함해야 한다.
  • F4. (메타)데이터는 검색 가능한 자원에 등록 또는 색인화되어야 한다.

접근성 (Accessibility)

사용자가 필요한 데이터를 찾은 후에는, 해당 데이터에 어떻게 접근할 수 있는지 알아야 하며, 여기에는 인증과 권한 부여가 포함될 수 있습니다.

  • A1. (메타)데이터는 표준화된 통신 프로토콜을 사용하여 식별자로 검색된다.
  • A1.1. 프로토콜은 개방형이며, 무료이고 보편적인 방법으로 구현 가능해야 한다.
  • A1.2. 프로토콜은 (필요한 경우) 인증과 권한 부여 절차를 허용해야 한다.
  • A2. (메타)데이터는 더 이상 사용할 수 없는 경우에도 계속 접근할 수 있어야 한다.

상호운용성 (Interoperability)

데이터는 일반적으로 다른 데이터와 통합될 필요가 있으며, 분석·저장·처리를 위한 애플리케이션이나 워크플로우와 상호운용 가능해야 합니다.

  • I1. (메타)데이터는 지식 표현을 위해 공식적이고 접근 가능하며 공유되고 광범위하게 적용 가능한 언어를 사용해야 한다.
  • I2. (메타)데이터는 FAIR 원칙을 따르는 어휘를 사용해야 한다.
  • I3. (메타)데이터는 다른 (메타)데이터에 대한 정규화된 참조가 포함되어야 한다.

재사용성 (Reusability)

FAIR의 궁극적인 목표는 데이터의 재사용을 최적화하는 것입니다. 이를 위해 메타데이터와 데이터는 충분히 잘 설명되어 다양한 환경에서 재현되거나 결합될 수 있어야 합니다.

  • R1. (메타)데이터는 정확하고 관련성이 높은 속성이 여러 개 있어야 한다.
  • R1.1. (메타)데이터는 명확하고 접근 가능한 데이터 사용 라이선스로 공개되어야 한다.
  • R1.2. (메타)데이터는 상세화된 출처(provenance)와 관련이 있다.
  • R1.3. (메타)데이터는 도메인 관련 커뮤니티 표준을 충족해야 한다.

참고 문헌

  • 김학래. (2021). FAIR 원칙: 데이터 관점의 디지털 아카이브 구현을 위한 고려사항. 한국기록관리학회지, 21(2), 155-172.
  • 박하람, 강지우, 송채은, 안지은, 이정윤, 장소정, 조하연, 차화준, 김학래. (2024). FAIR 데이터 원칙을 적용한 국내 디지털 아카이브 평가와 개선 방향. 한국기록관리학회지, 24(4), 113-134.
  • Wilkinson, M. D., et al. (2016). The FAIR Guiding Principles for scientific data management and stewardship. Scientific Data, 3, 160018.

FAIR에 대한 최신 정보와 15개 원칙의 전체 내용은 GO FAIR 공식 문서 go-fair.org/fair-principles 에서 확인할 수 있습니다.