1. 서론
천문우주 분야에서 관측 대상은 태양, 행성, 별, 은하 등 지구 밖의 모든 천체와 지구의 전리권과 자기권 등 플라즈마(plasma) 영역까지 포함한다. 이러한 대상들을 다양한 방법으로 관측하여 얻은 자료와 이를 처리하고 분석한 모든 결과를 자료라 한다. 자료는 과학 연구에 있어 가장 기본적이고 중요한 수단이기 때문에 자료를 얻기 위한 다양한 프로젝트(project)가 국내외에서 진행되고 있다.
일반적으로 우주 관측소를 구축하고 위성을 개발하는 프로젝트에는 막대한 예산이 필요하다. 이러한 프로젝트로부터 얻은 성과를 일회성으로 사용하는 데 그치지 않고, 그 효과를 보다 지속적으로 활용하고 성과를 극대화하기 위해서는 프로젝트 예산에 관측 시스템을 구축하는 비용과 함께 자료를 처리하고 저장하는 데 필요한 하드웨어(hardware) 및 소프트웨어(software)의 비용도 포함되어야 한다. 미국이나 유럽 같은 선진국에서는 자료에 대한 예산을 프로젝트 계획 초기부터 고려하고, 자료 처리 방법이나 소프트웨어 개발도 관측 시스템 구축과 함께 준비한다. 특히 자료 수명 주기(data lifecycle)에 대한 관리 정책을 수립하여 막대한 예산이 투입되어 얻어진 자료가 유실되거나 왜곡되지 않고 최대한 많은 사용자들이 자료를 활용할 수 있도록 한다.
2014–2040 우주개발 중장기 계획(제2차 우주개발진흥 기본계획 수정)[1]에 따르면 우리나라에서도 2040년까지 달 및 행성탐사, 우주과학, 태양 및 근지구 우주환경 감시, 미래 우주탐사, 우주환경감시 및 우주위험 대응 분야 등 약 20여 개의 우주 임무를 계획하고 있으며, 우주관측을 위한 다양한 국제협력 우주 임무도 진행하고 있다. 또한 기술 발전으로 인한 빅 데이터(big data)화는 자료의 효율적인 관리와 활용을 위한 천문우주 자료 관리 정책 수립에 대한 필요성을 더욱 증가시켰다1. Fig. 1은 우리나라의 행성탐사 및 우주과학 계획(안)으로 우주개발 중장기 계획에 포함된 다양한 우주 임무를 보여주고 있다.
우주 임무의 목표를 달성하는 데 있어 핵심 단계는 고품질의 자료를 생성하고 분석하는 것이다[2]. 또한, 이렇게 얻은 중요한 자료를 효율적으로 관리하고 활용할 수 있는 자료 관리 정책이 필수적이지만, 우리나라의 경우, 자료 관리 정책은 물론 자료의 중요성에 대한 인식조차 부족하다[3]. 이는 천문우주 분야의 관측 시스템 개발 관련 정책이 관측 시스템 자체를 구축하는 것에 초점이 맞추어져 있었기 때문으로 보인다. 이제는 우리가 생산한 자료에 눈을 돌릴 때이다. 막대한 예산과 인력, 시간을 투입해 개발하는 관측 시스템의 자료 활용을 확대하기 위한 방안이 반드시 필요하다. 국가 R&D 사업으로 구축된 관측 시스템에서 생산된 자료는 공공재적 성격을 가지며, 연구자 개인이 아닌 관측 시스템을 운영하는 기관이나 국가에서 자료에 대한 체계적인 관리를 해야 한다. 이를 위해서는 국가 차원의 자료 전략을 세우고, 이 전략을 바탕으로 자료 관련 기관에서는 자료 정책을 수립해야 할 것이다. 이 논문에서는 우리나라의 우주관측 자료 전략 수립을 위해 천문우주 분야의 선진 기관인 미 항공우주국(National Aeronautics and Space Administration, NASA)의 자료 전략을 분석하였다. 이를 바탕으로 우리나라의 실정에 맞는 우주관측 자료 전략과 권고 사항을 제안한다.
논문의 2장에서는 우주관측 자료 전략에 대해 언급하기 전에 기본적인 배경인 우주관측 자료의 정의, 우주관측 자료 전략 및 정책에 대한 일반적인 사항을 정리하였다. 3장에서는 NASA 과학임무부서(science mission directorate, SMD)의 자료 전략을 요약하고, 이를 심도 있게 분석하였다. 4장에서는 우리나라의 우주관측 자료 전략 수립을 위한 전략 및 권고 사항을 제안하여 앞으로 한국의 우주관측 자료 정책을 수립하는 데 기여하고자 한다.
2. 배경
위성 자료는 인공위성을 이용하여 획득한 모든 자료를 포함하며, 우주개발진흥법[4]에서는 위성정보라고 표현하고 있다. 위성 자료는 관측 대상에 따라 다시 지구관측 자료(earth observation data)와 우주관측 자료(space observation data)로 구분할 수 있다. 지구관측 자료는 우주 임무를 통해 얻어진 모든 형태의 지구를 관측한 자료(지질, 지형, 해양, 대기 등)이다. 우주관측 자료는 우주 임무를 통해 천문우주 분야 대상(별, 은하, 태양, 우주 플라즈마, 달, 행성 등)을 관측한 자료다. 두 자료 모두 관측 자료를 가공 및 활용한 것까지 포함한다. Table 1은 지구관측 자료와 우주관측 자료 정의를 정리한 것이다. Fig. 2와 Fig. 3은 각각 지구관측 자료와 우주관측 자료의 예를 보여준다. 이 논문에서는 우주관측 자료에 대한 내용을 다룬다.
우주관측 자료 전략은 우주관측 자료를 효율적으로 생산 및 관리하고 활용을 극대화하기 위한 포괄적인 방침과 계획으로, 우주관측 데이터 전략의 대상에는 천문우주 전 분야(천체물리, 태양물리, 행성과학 등)의 자료가 모두 포함된다. 천문우주 분야의 과학 자료 아카이브(archive) 자원은 관측 자료뿐만 아니라, 모델(model) 자료, 자료 관련 툴(tool), 소프트웨어2, 메타데이터(metadata), 문서 등 범위도 넓고 분야별로 종류도 다양하다[2]. 이러한 자료를 하나의 엄격한 관리 체계를 정하고, 이를 절대적으로 따르도록 하는 것은 비효율적이며, 실제로도 적용하기 힘들다. 그렇기 때문에 NASA에서는 전 분야의 자료를 아우를 수 있는 상위의 계획(NASA Plan for Increasing Access to the Results of Scientific Research)을 수립하여 전체적인 개요, 요점, 필수 사항을 정의한다. 그리고 이를 바탕으로 NASA의 SMD에서는 하부 조직인 천체물리 본부(Astrophysics Division), 지구과학 본부(Earth Science Division), 태양권물리 본부(Heliophysics Division), 행성과학 본부(Planetary Science Division)를 위한 보다 구체적인 자료 관리 및 컴퓨팅(computing) 전략을 수립하였다. 이 또한 전체적인 개요와 필수 사항, 권고 사항만을 제시하였고, 각 부서에서는 그대로 따르거나 이를 바탕으로 본부 수준의 자료 정책을 수립하기도 한다.
우주관측 자료 정책 또는 자료 관리 정책은 자료 전 주기 동안의 자료에 대한 생산, 사용, 저장 및 접근방법에 관한 지침을 제시해야 한다[2]. 자료를 생성하고 분석하는 일은 관측기를 개발하거나 연구를 수행하는 팀에 국한된 일이 아니다. 연구 목표에 도달하기 위해서는 관측기나 시스템 정보, 관측 자료, 기타 자료, 툴과 소프트웨어 등이 필요하며, 자료의 생산, 처리, 배포 및 보관의 모든 단계는 연구자들과 기술개발자들 간의 긴밀한 협력으로 이루어져야 한다. 이러한 과정을 일관되고 효율적으로 진행하기 위해 자료 정책이 필요하다. 우주관측 자료 정책에는 보다 구체적인 아카이브 운영 및 계획, 자료 모델, 자료 서비스에 관한 내용이 포함되며, 자료 전략을 기준으로 하여 각 분야의 특성에 맞는 자료 정책을 수립해야 한다.
3. NASA 자료 전략 분석
이 장에서는 NASA의 자료 전략에 대해 내용을 요약하고 이를 분석하였다. NASA 이외에도 유럽우주국(European Space Agency, ESA)과 일본국립천문대(National Astronomical Ob-servatory of Japan, NAOJ) 등 국외 기관과 국내 연구기관의 자료 전략과 정책을 조사하였지만, NASA를 제외한 다른 기관에는 우주관측 자료를 위한 명문화된 자료 전략이나 자료 관리 정책 자료를 찾을 수 없었다. ESA의 경우, 유럽 연합(European Union)에서 제시하는 유럽 데이터 전략(European Data Strategy)을 따르겠지만, 이는 분야를 특정하지 않는 모든 자료에 대한 내용이다. 우리나라의 경우, 국가 과학자료센터 구축을 위한 다양한 연구[3,5,6]를 수행하였으나, 이 또한 전 분야의 과학자료를 고려하는 것이며, 여기에도 자료 전략이나 정책에 대한 내용은 없었다. 이러한 이유로 비교적 상세하게 정리되어 있는 NASA의 자료 전략만을 분석하였다.
NASA는 획기적인 과학 발견을 위해서는 과학 자료 및 컴퓨팅 시스템이 매우 중요함을 인식하고, 이를 위한 새로운 전략을 세우고자 하였다. 이를 위한 첫 단계로 NASA 자문위원회(NASA Advisory Council, NAC)는 빅 데이터의 모범 사례를 연구하고 식별하기 위한 빅 데이터 태스크포스(Big Data Task Force, BDTF)를 구성하였다. BDTF는 2015년부터 2017년까지 활동하였으며, ‘Data Science: Statistical and Computational Methodologies for NASA’s Big Data in Science’, ‘Making NASA Science Data More Usable’, ‘Modeling Workflows’, ‘Server-side Analytics’ 등 총 4종의 최종 보고서를 제출하였고, 이는 NASA의 자료 정책과 전략을 세우기 위한 기초 자료가 되었다. 이를 바탕으로 NASA SMD에서는 정보 기술의 발전을 활용하여 과학 컴퓨팅과 자료 아카이브를 개선하고, 향후 5년 동안 더 큰 과학적 발견을 가능하게 하는 새로운 전략을 개발하기 위해 각 부서의 대표, 민간 기업의 IT 전문가와 함께 전략 자료 관리 워킹 그룹(Strategic Data Management Working Group, SDMWG)을 조직하였다. SDMWG는 2018년 10월에 자료 관리 전략 워크숍을 개최하고, 빅 데이터(big data), 클라우드 컴퓨팅(cloud computing), 오픈 사이언스(open science), 학제간 연구(inter-disciplinary research) 등 네 가지 주요 주제를 중점적으로 토론하였다. 또한 SDMWG는 2018년에 “SMD의 2019년부터 2024년까지의 자료 관리와 컴퓨팅 전략 보고서[7]”를 작성하였고, SMD는 이를 승인하여 4개의 과학 부서(천체물리 본부, 태양권물리 본부, 행성과학 본부, 지구과학 본부)를 통해 구현해 나가고 있다.
SMD는 전략적인 자료 관리 및 컴퓨팅을 위한 비전, 사명, 세 가지 목표 및 11개의 관련 전략으로 구성된 전략을 수립하였으며, 이러한 전략을 구현하는 데 필요한 지침과 현재 상황 분석, 조사 결과와 권고 사항을 제시하고 있다.
또한 SMD는 자료 관리 전략 목표를 오픈 사이언스, 지속적인 자료 및 컴퓨팅 시스템 개선, 전략적 협업관계로 세우고, 다양한 권고 사항을 제시하였다. 이러한 권고 사항을 개발할 때에는 아래와 같이 세 가지 주요 운영 원칙[7]을 지정하였다.
Table 2는 SMD의 자료 관리 및 컴퓨팅 전략을 요약한 내용이다.
SDMWG는 전략 문서를 작성하는 시점의 요구 사항과 모범 사례가 5년 동안 동일하게 유지되지 않을 것으로 예측하였다. 따라서 SMD의 자료 및 컴퓨팅 요구 사항에 대한 주기적인 재평가가 필요하며, 각 과학 부서에서 이를 검토하여 역량을 꾸준히 발전시키도록 권장하고 있다.
NASA는 자료 정책을 위한 SMD의 자료 전략을 세우고 연구 커뮤니티(community), 학계, 민간기업, 국제 협력 기관 등으로부터 들어오는 의견이나 모델을 기반으로 연구 환경을 발전시키고 있다. 우리나라도 우주관측 자료에 대한 기술 협력과 지속적인 투자를 통해 시스템, 자료 활용, 기술 확대 방안을 마련해야 한다. 이 장에서는 NASA의 자료 전략 목표를 분석하여 이를 바탕으로 우리나라의 우주관측 자료 전략을 수립하는 데 도움이 되고자 한다. 아래는 NASA 자료 관리 및 컴퓨팅 전략 목표 3가지[7]이다.
첫 번째 오픈 사이언스는 최근 천문학 및 우주과학 분야의 경향이다. NASA는 과학 자료, 소프트웨어 및 정보를 검색하고, 접근이 가능하게 하면 협업과 혁신이 촉진되고, 투명성이 높아진다고 강조하였다[7]. ESA의 전 사무총장인 Jan Wörner도 “ESA의 이미지, 정보 및 지식에 대한 접근을 개방하는 것은 Space 4.0 환경에서 정보를 제공하고, 혁신하고, 상호 작용하고, 영감을 주는 우리 목표의 중요한 요소(This evolution in opening access to ESA’s images, information and knowledge is an important element of our goal to inform, innovate, interact and inspire in the Space 4.0 landscape)”라고 했다[8]. 이러한 관점에서 우리나라는 개방형 과학 자료 생태계를 구축하여야 한다. 개방형 과학 자료 생태계는 자료의 접근성을 높이는 것과 함께 다양한 인터페이스 표준을 지원하는 개방형 소프트웨어 프레임워크(frame-work)를 중심으로 구성될 수 있다. 개방형 소프트웨어+ 프레임워크는 자료 수집, 검색, 접근 및 분석을 위한 클래스(class), 라이브러리(library), 응용프로그램 인터페이스(application pro-gramming interface, API), 응용프로그램, 서비스 시스템 구성 등을 제공하며, 각 프로젝트 또는 부서 간에 재사용 가능한 환경을 구축하여 지속적으로 개선하고 활용될 수 있도록 한다. 또한 개방형 소프트웨어 프레임워크의 라이브러리와 과학 자료를 공개하여 타 분야 연구자와 일반인들도 이를 사용할 수 있도록 하고, 다양한 분야에서 활용되고 관련 기술이 확대될 수 있는 환경을 제공해야 할 것이다.
두 번째 전략 목표인 지속적인 자료 및 컴퓨팅 시스템 개선은 자료와 소프트웨어의 관점에서 중요한 전략 목표이다. 일단 관측시스템 운영이 시작되면 시스템의 고장으로 운영이 중단되기 전까지 수년에서 수십년의 기간 동안 자료를 수집하게 된다. 과학 임무가 진행되는 동안 시간이 지남에 따라 자료 및 소프트웨어, 하드웨어에 대한 새로운 기술이 등장할 수 있고 기존의 방법 대신 새로운 자료 처리 방법이나 혁신적인 컴퓨팅 기능을 적용할 수도 있게 될 것이다. 이에 따라 자료의 가치가 크게 달라질 수 있기 때문에 기존 자료에 새로운 기술을 적용하는 것을 장려해야 한다. 이를 위해서는 임무 주기 전반에 걸쳐서 자료 및 컴퓨팅 시스템에 대한 지속적인 평가가 필요하고, 새로운 기술을 사용하고 효율적으로 적용하기 위한 방안을 마련해야 한다. 또한 자료, 소프트웨어 및 하드웨어와 관련된 기술 개발, 선정, 투자를 지원할 수 있는 방향으로 자료 정책을 수립해야 한다. 자료 관리 및 컴퓨팅 시스템 개선을 지원하기 위한 자료 시스템, 컴퓨팅 접근 방식 및 기술을 활용하는 인력에 대한 투자가 필요하며, 이러한 과정을 효과적으로 진행하기 위해 자료 과학자와 협력하는 것은 필수적이다[7].
세 번째 목표인 전략적 파트너십은 국내외 커뮤니티뿐만 아니라, 기관 간 또는 기관내의 부서 간의 적극적인 협업을 포함한다. 또한 타 분야와의 협업, 예를 들면 컴퓨터 공학이나 자료 과학 분야와의 융합 연구를 통해 관련 도구, 타 분야 혁신 기술 등을 인식하고 활용할 수 있는 기회를 마련할 수 있다. 효율적인 협업을 위한 협력 시기나 구체적인 방법은 각 기관별로 자료 정책을 통해 결정할 수 있으며, 각 기관의 특성에 맞게 시스템을 관리할 수 있는 임무와 책임, 유연성도 함께 주어야 할 것이다.
4. 한국 우주관측 자료 전략 수립을 위한 권고 사항
세계적으로 천문우주 분야의 다양한 연구와 기술 개발, 대형 사업이 진행되고 있으며, 이를 바탕으로 각 기관에서는 과학기술정책을 수립하거나 전문인력을 양성하는 등 학계뿐만 아니라, 국가적으로도 연구, 기술, 개발(research, technology, development, RTD) 성과를 확산하고 있다. 이러한 맥락에서 과학 자료도 RTD 성과 중 하나로 다뤄져야 하며, 우주관측 자료 전체를 연구 커뮤니티, 민간기업, 학계, 일반인들에게 개방하는 것도 중요하다.
우리나라도 큰 틀에서의 자료 계획을 세우는 것이 필요하다. 특히 우주관측 자료는 규모나 양이 기하급수적으로 증가하고 있고, 그에 따라 자료 센터(아카이브)는 자료 관리, 큐레이션(curation), 접근, 분석, 컴퓨팅 등에 대한 중요한 역할을 해야 한다. 이를 통해 양질의 자료를 쉽고 빠르게 획득하여 최대한 많이 활용될 수 있도록 함으로써 과학 연구와 새롭고 혁신적인 발견을 할 수 있는 기회를 제공해야 한다. 이를 준비하기 위해 이 장에서는 우리나라의 우주관측 자료 전략 권고 사항을 제안하고자 한다.
우주관측 자료 전략 권고 사항을 언급하기 전에 과학 자료에 대한 운영 원칙 2가지를 강조하고자 한다. 이는 NASA의 SMD 자료 관리 및 컴퓨팅 전략에서도 나오는 내용으로 실제 구현하는 단계에서 고려해야 하는 주요한 운영 원칙이다. 우리나라에서도 아래 원칙을 바탕으로 자료 정책을 수립하기를 제안한다.
첫 번째 원칙은 과학 자료 전 분야에서 가장 중요하게 인식되어야 할 항목이다. 과학 자료는 연구 목적에 따라 가공/변형되면서 정보가 손실되거나 추가될 수 있다. 따라서 원본 자료를 보존하는 것은 연구의 투명성과 윤리성을 담보한다. 또한 자료는 수많은 자원(예산, 인력, 시간, 노력 등)이 투입된 결과물로서 상당한 가치를 가진다. 예를 들어 2010년 발사된 NASA의 태양 관측 위성인 Solar Dynamics Observatory(SDO)의 개발 예산(첫 5년간의 운영비 포함)은 865백만 달러(약 9천억 원)[9]이고, 위성 개발 계획부터 개발 후 발사까지 약 10년이 걸렸다. NASA측 프로젝트 투입 인력만 수십 명이고, 위성체와 발사체 관련 인력, Atmospheric Imaging Assembly(AIA)와 Helioseismic and Magnetic Imager(HMI)를 개발한 스탠포드 대학과 록히드마틴까지 포함하면 수백 명에 이를 것으로 보인다. SDO는 발사 후 현재까지 10년 넘게 운영되고 있으며, 자료 용량은 약 6 PB이다. 또한 SDO와 관련된 연구 결과 논문은 한 해에 수백 편이 출판되며, 2020년까지 인용횟수는 약 6만 건이 넘었다[10]. SDO의 관측 자료는 특히 장기간 다량의 자료를 이용한 빅 데이터와 딥 러닝 기반의 태양 물리 연구를 가능하게 하였다. 이처럼 과학적 관측 또는 연구를 기반으로 생성된 자료는 대체 불가능한 자료(irreplaceable data)이고, 과거 자료이든 최신 자료이든 생성된 시기에 상관없이 동일하게 중요한 가치를 지닌다. 예산, 인력 등 그 어떤 이유로 이미 수집한 자료를 훼손하는 것은 절대 하지 말아야 할 것이다.
두 번째 원칙은 시스템 관점에서의 전략이다. IT 시스템의 하드웨어와 소프트웨어 관련 기술은 끊임없이 발전하고 있고, 짧은 주기로 새로운 기술이 소개되고 있다. 이에 맞춰 사용자 경험도 수준이 높아져 자료를 제공하고 관리하는 기관 입장에서는 이러한 상황 변화에 부응해야 한다. 특히 아카이브 관점에서는 자료를 저장하고 처리/분석/배포하는 전반적인 작업을 하드웨어(저장장치, 계산 자원 등)와 소프트웨어에 절대적으로 의존하고 있기 때문에 이러한 시스템을 주기적으로 개선할 필요가 있다. 이를 위해서는 예산이 필요한데, 새로운 임무 계획에 따라 시스템 개선을 계획한다면 전체적인 시스템을 보다 효율적으로 운영할 수 있을 것이다. 또한 현재 시스템의 상태에 대한 평가와 진단을 지속적으로 수행하고, 이를 토대로 신규 임무의 자료 관리 계획과 기존 자료의 이전(migration) 작업의 계획을 세울 수 있다.
위 두 가지의 우주관측 자료 운영 원칙을 기반으로 다음과 같은 우주관측 자료 전략 수립을 위한 권고 사항을 정리하였다. 우주관측 자료 전략 권고 사항은 학계, 민간 산업, 군 등 다양한 분야의 자료 사용자들과 우주관측 자료 정책을 수립할 때 근간이 되기를 강력하게 권장한다.
-
가. 프로젝트를 계획할 때부터 장기간의 자료 관리에 대한 계획을 포함해야 한다. 자료 관리 계획에는 자료 제품(data product), 관련 소프트웨어 및 툴 개발, 자료 배포 계획 등이 포함되어야 한다. 또한 프로젝트 주기에 맞춰 자료 관리 계획도 구체화되어야 한다.
-
나. 모든 우주 임무에 대한 자료 개방 정책 표준을 확립해야 한다. 자료의 활용성을 확대하기 위해서는 자료 접근성, 용이성, 개방성을 높여야 하며, 이를 위한 표준을 세워 우리나라에서 진행하는 우주 임무(새로운 임무는 물론 운영 중인 임무도 포함)에 적용해야 한다.
-
다. 기관 차원의 우주관측 자료의 아카이브 계획을 세워야 한다. 임무가 종료된 이후 자료를 장기적으로 관리하는 방법을 계획할 때 자료 수명 주기 접근 방식을 취해야 한다. 각 프로젝트 단위의 임무 아카이브, 최종 아카이브, 딥 아카이브에 대한 계획과 구체적인 운영 계획이 필요하다.
-
라. 오픈 소스 및 협업 도구를 채택하여 개발해야 한다. 국내외의 광범위한 과학 커뮤니티에서는 오픈 소스 사용이 확대되고 있고, 협업을 위한 다양한 도구 활용도 커지고 있다. NASA에서도 과학, 공학, 의학 분야에서의 오픈 소스 정책을 채택하고 있다. 단, 중요 기술에 대해서는 비공개 정책을 준수해야 한다.
-
마. 아카이브의 IT 시스템에 대한 평가 및 개선은 5년 이내의 주기로 계획한다. 통상적인 IT 시스템의 수명주기는 5년이다. 때문에 5년 이내로 시스템에 대한 평가 및 개선이 이루어져야 한다. 이를 통해 저장장치의 용량, 서버 자원 요구 사항(컴퓨팅 자원 포함) 등을 평가하고, 새로운 리소스에 대한 수요를 조사하기 위한 전략 개발에 사용되어야 한다.
-
바. 자료 분석, 계산, 소프트웨어 개발, 자료 관리 등은 학계(타 분야 포함)와 산업계에 있는 자료 전문가들과 협력해야 한다. 자료 및 소프트웨어 관련 기술은 빠르게 변화하고 있으며, 이러한 환경에서 연구자들이 주도하는 자료 분석 및 관련 소프트웨어 개발은 한계가 있을 수 있다. 이를 고려하여 자료 과학 전문가(data science professionals)를 영입하는 것이 필요하며, 다양한 분야의 전문가들과 공동 연구를 진행해야 한다. 또한 새로운 기술을 지속적으로 도입하고 분석해야 하며, 자료 관리를 위한 방법 및 알고리즘에 대한 개발과 교육도 지속적으로 병행해야 한다.
-
사. 자료 및 소프트웨어의 유용성, 검색 용이성, 접근성을 평가할 수 있는 프로세스(process)를 개발해야 한다. 여기에는 컴퓨팅 자원 활용도도 포함되어야 한다. 보통은 자료를 얼마나 잘 생성하고 운영하는지 정도만 파악하고, 위의 항목들과 관련된 사항은 고려되지 않는다. 자료 및 소프트웨어의 유용성, 검색의 용이성, 접근성, 컴퓨팅 자원 활용도까지 파악할 수 있는 프로세스가 개발되면 수집된 정보를 통해 아카이브 운영에서 의사 결정하는 데 사용할 수 있다.
-
아. 학제 간 연구를 가능하게 하는 메타자료를 개발해야 한다. 과학 자료는 임무별로 생성되지만 여러 임무 자료를 융합하여 사용할 수 있도록 해야 한다.
-
자. 클라우드 컴퓨팅 및 인공지능(artificial intelligence, AI)/기계학습(machine learning, ML)을 포함한 새로운 계산 기술을 연구하도록 장려해야 한다. 또한 AI/ML을 사용하는 새로운 연구 방법에 대해 커뮤니티에 장려하고 교육하기 위한 투자를 해야 한다.
-
차. 관련 기관에서는 우주관측 자료 정책에 대한 지속적인 개선을 위한 위원회를 조직하고, 과학 자료 및 정보 책임자를 임명해야 한다. 위원회와 책임자는 아래와 같은 업무에 포함된다.
-
우주관측 자료 정책 설정, 규정 준수 확인 및 외부 정책에 대한 인식
-
새로운 기회 포착, 선택 및 예산 조달을 위한 부서 간 협력 유지
-
목표와 기능에 투자하고 진행 상황 추적
-
워크숍, 연구, 교육 등을 통해 우주관측 자료 및 컴퓨팅 커뮤니티 육성
-
우주관측 자료 및 컴퓨팅 포트폴리오의 구조와 내용에 대해 주기적인 평가
마지막으로 우주관측 자료 전략 개선, 커뮤니티 의견 수렴, 최종적으로 자료 정책 수립을 위한 협의체를 구성하는 방안에 대해 언급하고자 한다. 이러한 협의체들은 다양한 분야의 연구, 기술, 개발하는 실무자들로 구성되어야 하며, 연구 커뮤니티, 민간기업, 학계까지 포함하여 폭넓은 관점과 지식, 의견을 수렴할 수 있어야 한다. 이를 위해 각 협의체의 목적과 필수적인 구성원도 아래와 같이 권고한다.
5. 결론
세계적으로 다양한 천문학 및 우주과학 관측 시스템이 운영되고 있고, 우리나라에서도 국제협력을 통해서 또는 독립적으로 관측 시스템을 개발하고 있다. 두 가지 경우, 모두 정부에서 예산을 투입하여 직간접적으로 개발 및 운영하는 것이기 때문에 여기서 나오는 자료도 체계적인 관리가 필요하다. 지금까지 프로젝트 또는 기관별로 자료 관리에 대한 고민을 해왔을 것이다. 하지만 이를 실현하기 위한 구체적인 지침이나 정책은 없는 실정이다.
미국은 국가 차원에서 자료 계획에 대한 큰 그림의 개념을 가지고 있으며, 이를 바탕으로 NASA에서는 과학, 기술, 의학에 관련된 디지털 자료 계획을 수립하였다. NASA의 자료 계획에는 디지털 자료 관리 원칙, 관리 대상 범위, 요구 사항, 적용 범위, 계획 및 구현 등 실질적으로 자료 정책을 수립하는 데 필요한 구체적인 사항을 포함한다. 이와 함께 NASA SMD의 자료 전략은 과학 자료에 특화된 내용을 담고 있다. 여기에는 과학 자료의 비전과 목표, 각 목표에 따른 전략들을 구체적으로 제시하고, 이를 토대로 전략 목표와 권고 사항을 기술한다. NASA SMD의 자료 전략은 연구 부서인 천체물리 본부, 지구과학 본부, 태양권물리 본부, 행성과학 본부를 위한 것으로, 각 부서에서는 분야별 특성에 맞는 과학 자료 관리 정책을 수립하거나 관리 체계를 갖추고 있다. NASA의 자료 계획이나 SMD 자료 전략에서 강조하는 것은 오픈 엑세스(open access)이다. 수많은 임무를 통해 획득한 자료를 최대한 많이 활용할 수 있도록 개방하고, 이를 위한 다양한 전략을 제시한다. 또 하나의 중요한 점은 이 두 문서에서는 가장 상위에서의 기본 지침(guideline)만 제시한다는 것이다. 임무나 연구 분야의 특성이 상이하고 같은 연구 부서 내에서도 관측 대상이나 관측 기기에 따라 자료가 매우 다양하기 때문에 일원화된 관리 체계를 강제할 수 없으며, SMD에서도 이를 인정하고 다양성과 유연성을 용인한다. 다만 NASA의 자료 계획이나 SMD 자료 전략의 기본적인 지침을 따르도록 하고, 조금 더 구체적인 사항은 연구 부서 자체의 자료 관리 정책으로 대신한다.
우리나라도 우주관측 자료 정책이 필요하다. 하지만 자료 정책을 수립하기 위한 상위 개념의 자료 계획이나 전략이 먼저 구성되어야 할 것이다. 이 논문에서는 우리나라의 우주관측 자료 전략 방향과 이를 위한 권고 사항을 제안하였다. 이는 높은 수준의 포괄적인 전략으로 우리나라의 우주관측 자료 정책을 수립하고, 우주관측 자료 활용성을 극대화할 수 있는 기반이 될 것이다.