한국과학기술정보연구원

KISTI MEDIA

Insight

총 게시글 11
  • 모두를 위한 과학을 향해, KISTI와 UNESCO가 함께하는 오픈 사이언스 협력

    모두를 위한 과학을 향해, KISTI와 UNESCO가 함께하는 오픈 사이언스 협력 1962년, KISTI의 전신인 한국과학기술정보센터(KORSTIC)의 설립에는 유네스코(UNESCO, 유엔교육과학문화기구)의 지원이 있었다. 그로부터 60년이 지나 KISTI는 국가 과학기술 데이터 전문 연구기관으로 자리매김했고, 2023년에는 유네스코와 오픈 사이언스 협력 및 세계기록유산의 디지털화를 위한 양해각서(MOU)를 체결했다. 이 같은 오랜 인연을 바탕으로 이제 KISTI와 유네스코는 보다 실질적이고 장기적인 협력 체계를 모색하고자 한다. 그 중심에는 바로 ‘오픈 사이언스’가 있다. 2025년, KISTI와 유네스코는 본격적인 공동연구의 첫발을 내디딘다. 왜 지금, 오픈 사이언스인가? 오픈 사이언스(Open Science)는 다국어로 된 과학 지식에 누구나 자유롭게 접근하며 활용·재사용할 수 있도록 보장하는 다양한 실천을 아우른다. 과학 지식의 생성 과정에 사회 전반의 참여를 확대해 협업과 투명성을 높이고자 하는 것이다. 그러나 여전히 많은 과학 지식은 일부의 전유물로 남아 있다. 과학적 성과에 자유롭게 접근할 수 있고 이를 활용할 수 있을 때, 보다 신뢰할 수 있는 과학 생태계를 구축할 수 있다. 개발도상국을 포함한 글로벌 사우스(Global South)에서는 오픈 사이언스가 과학기술 격차를 해소하는 중요한 열쇠가 된다. 고비용의 연구 인프라에 접근하기 어려운 상황에서 데이터, 소프트웨어, 지식 자원에 대한 개방은 각국의 상황에 맞는 해결책을 찾을 수 있도록 돕기 때문이다. 이처럼 오픈 사이언스는 지식 공유를 넘어 상생과 지속 가능한 발전을 위한 협력의 기반이 된다. 유네스코는 이러한 인식 아래, 2021년 제41차 총회에서 193개 회원국의 합의로 ‘오픈 사이언스 권고안(UNESCO Recommendation on Open Science)’을 채택했다. 이는 오픈 사이언스에 대한 최초의 국제 기준으로, 단순한 데이터 개방을 넘어 지식 생산과 공유 전반에서 포용성과 공정성을 실현하는 과학 생태계라는 정의를 제시한다. 권고안은 투명성, 협업, 포용성 등을 포함한 여섯 가지 핵심 원칙을 제시하며, 국제사회의 실천을 촉구한다. KISTI는 이러한 국제 흐름에 발맞춰 과학기술 데이터 분야 전문 연구기관으로 전문성을 확보해 왔다. 사이언스온(ScienceON), 국가연구데이터플랫폼(DataON), 국가오픈액세스플랫폼(AccessON) 등 KISTI는 연구자가 필요한 데이터에 손쉽게 접근하고 활용할 수 있는 연구 인프라를 운영하고 있다. 이러한 온라인 플랫폼을 활용한 과학기술 데이터 제공과 확산은 KISTI가 지난 수년간 집중해 온 주요 과제 중 하나로, 국내를 넘어 국제 협력의 토대가 되고 있다. KISTI는 그동안 축적한 전문성과 역량을 바탕으로 유네스코와 함께 오픈 사이언스 협력사업을 시작했다. KISTI의 기술력과 유네스코의 글로벌 네트워크를 통해 아시아, 아프리카 국가의 연구기관과 협력 관계를 구축하고 오픈 사이언스를 확산할 예정이다. 오픈 사이언스 협력의 첫발, 파리에서 내딛다 2025년 6월, 프랑스 파리 유네스코 본부에서는 ‘개방형 솔루션 육성, 오픈 사이언스 및 지속가능한 개발을 위한 KISTIUNESCO 협력사업’의 출범식이 열렸다. 본 공동연구는 2025년부터 2029년까지 4년간 진행되며, 오픈 데이터 정책 프레임워크 수립 및 역량 강화, 다이아몬드 오픈 액세스 확산 및 소프트웨어 헤리티지(Software Heritage) 내 소프트웨어 유산의 보존을 위한 협력을 진행한다. 또한, 아시아와 아프리카의 연구기관을 대상으로 오픈 데이터 플랫폼 도입 등을 포함한 파일럿 프로젝트를 추진할 예정이다. 출범식에 앞서 유네스코는 이틀간 ‘공공부문 AI 및 디지털 전환 역량 강화를 위한 컨퍼런스(UNESCO Conference on Capacity Building on AI and Digital Transformation in the Public Sector)’를 개최해 디지털 인프라의 중요성을 조명했다. 이후 출범행사가 개최되며 논의의 흐름을 이어갔다. 행사에는 KISTI 이식 원장, 주 유네스코 대한민국 대표부 박상미 대사, 프랑스 국립연구재단 클레르 지리 이사장을 비롯해 여러 국가의 연구자들이 참석했다. 본격적인 행사 시작 전 네트워킹 세션이 마련되어 참석자들은 각자의 경험과 기대를 나눴다. “KISTI-유네스코 공동연구를 넷플릭스 시리즈라고 생각한다면, 오늘은 그 예고편을 보는 날입니다.” 출범식은 유네스코 길헤르메 카넬라 국장의 인사말로 문을 열었다. 이번 행사는 유네스코 홈페이지를 통해 영어 및 스페인어로 전 세계에 실시간 중계되었으며, 유네스코 회원국 및 지역 사무소 직원들이 온라인으로 참여할 수 있도록 했다. 첫 순서는 박상미 대사, KISTI 이식 원장, 유네스코 토우픽 젤라시 커뮤니케이션·정보 부문 사무총장보의 개회사였다. 이들은 한국의 과학기술 성장의 역사, 디지털 인프라의 중요성과 오픈 사이언스 권고안의 이행을 강조했다. 다음으로 오픈 데이터 정책 설계, 소프트웨어 헤리티지 참여 등 공동연구 추진 로드맵 발표가 이어졌다. 이어 구체적인 오픈 사이언스 협력 방안을 논의하는 고위급 라운드테이블 토론이 진행되었다. 클레르 지리 이사장과 앙골라 고등교육과학기술혁신부 에우리코 곤굴라 국장, 소프트웨어 헤리티지 프로젝트 창립자인 로베트로 디 코스모 교수, KISTI 송사광 책임연구원이 토론 패널로 참여했다. 각국 연사들은 오픈 데이터 정책 수립과 실행 방안, 다이아몬드 오픈액세스 도입 및 소프트웨어 헤리티지 협력에 대한 열띤 토론을 이어갔다. 송사광 책임연구원은 “연구 데이터도 수도와 전기처럼 하나의 공공 인프라로 다루어져야 한다”며 KISTI의 오픈 데이터 활동을 소개했고, 로베르토 디 코스모 교수는 “과거에는 소프트웨어가 컴퓨터 공학 종사자들의 몫이라고 생각되었지만, 이제 모두가 활용할 수 있다”라며 소프트웨어 헤리티지 프로젝트의 의미를 강조했다. 이어 5년 후 오픈 사이언스 생태계의 모습 등 청중들의 다양한 질의가 오갔다.  폐회사는 유네스코 리디아 브리토 자연과학 부문 사무총장보가 맡았다. 그는 이번 협력이 다양한 협업 기반의 오픈 사이언스를 실현하는 출발점이 될 것이라며, 과학은 인류 모두를 위한 공공재임을 강조했다. 과학을 위한 협력에서 이제는 모두가 함께 실천하는 움직임으로, KISTI는 오픈 사이언스를 통해 보다 지속 가능한 과학기술 생태계를 향한 여정을 이어가고 있다.

  • 인공지능 시대, 일자리의 미래는 어떻게 달라질까?

    인공지능 시대, 일자리의 미래는 어떻게 달라질까? 기고 | 권기석 교수(국립한밭대학교 공공행정학과) AI 시대, 일자리의 지속가능성을 묻다 최근 몇 년 사이 인공지능(AI)의 발전은 그야말로 눈부시다. 예전에는 영화 속 상상으로 여겨졌던 기술들이 이제는 우리의 일상 속으로 깊숙이 들어오고 있다. 스마트폰 음성비서, 자동번역, 자율주행차, 상담 챗봇 등은 이제 낯설지 않은 기술이 되었고, 기업들은 AI를 활용해 업무 효율을 높이고 있다. 신기술이 등장할 때면 항상 노동에 대한 영향력이 이슈가 되어 왔다. 19세기 초 영국 산업혁명의 원동력이 되었던 신기술인 방적기계에 대한 노동자들의 파괴 운동인 러다이트 운동 (Luddite Movement)에서 나타난 바와 같이, 새로운 기술은 일자리를 감소시킨다는 우려는 자연스럽다고 볼 수 있다. 최근 AI의 발전도 일자리 시장에 광범위한 영향을 미치고 있다. 이러한 변화 속에서 많은 이들은 궁금해한다. ‘AI 때문에 내 일자리가 사라지는 건 아닐까?’, ‘미래에는 어떤 일을 해야 살아남을 수 있을까?’ 이러한 질문은 단순한 불안이 아니라, 이미 세계 곳곳에서 실제로 벌어지고 있는 변화 속에서 현실적인 고민이 되었다. AI가 바꾸는 일자리 풍경 AI 도입이 확대되면서 일자리에 미치는 영향의 방식은 점점 다양해지고 있다. 과거 기계는 인간의 단순 반복 작업을 대체했지만, 오늘날의 AI는 지능적인 판단과 언어처리까지 가능해져 사무직, 법률, 의료, 교육 등 다양한 분야에서 사람의 역할을 일부 대체하거나 보완하고 있다. 예를 들어, 자율주행차 기술이 발전하면 택시기사나 트럭 운전사 같은 운송 분야 일자리가 줄어들 수 있다. 실제로 미국에서는 자율주행 기술의 상용화로 향후 수백만 명의 운전직 종사자가 영향을 받을 수 있다는 전망도 있다. 이러한 변화는 과거 산업혁명 당시 농업과 수공업 일자리가 감소했던 것과 유사한 양상을 보인다. 법률 서비스 분야에서는 ‘리걸테크 (LegalTech)’라고 불리는 AI 기술이 계약서 분석, 판례 검색 등을 빠르게 수행하면서 변호사 업무의 일부를 대체하고 있다. 하지만 이러한 변화가 단지 ‘일자리를 없애는 일’만은 아니다. AI는 단순히 일자리를 대체하는 역할에 그치지 않고, 고도의 기술을 요구하는 새로운 분야에서 일자리를 창출하는 효과도 있다. 데이터 과학, 로봇 공학 조작, AI 시스템 관리 등은 전문 지식을 필요로 하는 분야로, AI 기술의 발전 덕분에 이러한 영역에서 새로운 일자리가 생겨나고 있다. 2023년 세계 경제 포럼의 「일자리의 미래 보고서」는 2025년까지 AI는 9,700만 개의 새로운 일자리를 창출하고 8,500만 개의 기존 일자리를 없앨 것으로 예측했다. 이는 AI가 일자리를 감소시키는 동시에 새로운 직업 기회를 창출한다는 사실을 보여준다. 직업과 기능에 따른 영향 AI가 모든 직업에 동일하게 영향을 미치는 것도 아니다. 어떤 일은 AI가 쉽게 사람의 일을 대체할 수 있지만, 어떤 일은 여전히 사람의 능력이 더 중요하다. 연구자들은 AI의 영향을 받기 쉬운 일과 그렇지 않은 일을 기능(skills) 중심으로 나누어 분석하고 있다. 예를 들어, 규칙적인 작업이나 수치 계산, 일정한 공식에 따라 처리되는 업무는 AI가 매우 잘 수행할 수 있다. 제조업에서의 단순 조립 작업, 단순한 데이터 정리가 대표적인 사례다. 반면, 사람과의 소통이 필요한 일, 창의성이 요구되는 일, 복잡한 판단과 감정적 고려가 필요한 일은 여전히 사람이 중심이 되는 경우가 많다. 상담, 기획, 디자인, 예술, 교육 분야 등을 그 대표적인 예로 볼 수 있다. 특히 최근 놀라운 속도로 진화하고 있는 챗GPT(ChatGPT) 같은 생성형 AI는 언어와 정보 처리 능력이 매우 뛰어나 일부 사무직과 콘텐츠 제작 영역에서 활용되고 있다. 보고서 작성, 이메일 초안 작성, 요약 정리 등의 업무는 AI가 빠르게 수행할 수 있어, 이러한 기술을 잘 활용하는 사람이 더 효율적인 업무 성과를 낼 수 있다. 그러나 AI의 능력이 뛰어나다고 해서 사람이 완전히 필요 없어지는 것은 아니다. 결국, 중요한 결정이나 인간적인 감성이 필요한 부분에서는 여전히 사람의 역할이 중요하며, AI는 그 보조 수단이 될 가능성이 크다. 실제 수치로 보는 일자리 변화 AI가 일자리에 미치는 영향을 수치로 예측하려는 연구도 활발히 이루어지고 있다. 2021년 「Technological Forecasting and Social Change」는 평균 22%의 인간노동이 AI로 대체되며, 5년 후엔 40%, 10년 후엔 60%대의 직업이 교체될 것으로 예측했다. 그리고 50년 후에는 99%의 인간의 노동이 대체될 것으로 전망했다. 특히, 기술이 빠르게 발전하는 분야 즉, 운송, 금융, 행정, 고객 응대 등의 업무에서 변화가 더 클 것으로 본다. 우리나라에서도 이러한 예측과 비슷한 연구결과가 보고되고 있다. 「한국경제포럼」은 우리나라 전체 일자리의 약 52% 가 AI와 로봇, 컴퓨터에 의해 대체될 것으로 추산하고 남성, 중장년층, 고졸 이하 학력자 등이 상대적으로 취약할 것으로 분석했다. 반면, 아직까지 AI가 실업률에 직접적인 영향을 주는 수준은 아니라고 보는 연구결과도 있다. 「OECD 고용전망보고서」 는 AI가 고용에 미치는 영향에 있어 아직 부정적 영향이 얼마나 클지 불확실하다고 결론지었다.  기술이 도입되더라도 실제로 업무처리 방식이 바뀌기까지는 상당한 시간이 걸리고, 제도나 사회적 환경이 그 변화를 흡수하기도 한다는 것이다. 결국, AI가 일자리를 얼마나 바꾸느냐는 단지 기술의 문제가 아니라, 사회와 제도의 준비 상태에 따라 달라진다는 것이다. 사회와 개인의 대응 전략 AI 시대의 일자리 문제는 단순히 ‘기술이 사람을 대체한다’는 시각보다는 ‘우리가 어떻게 준비하고 대응하느냐’에 따라 결정된다고 볼 수 있다. 실제로 많은 전문가들은 기술보다 더 중요한 것이 재교육 제도, 직업 전환 기회, 그리고 사회적 안전망이라고 강조한다. 예를 들어, 자동화 기술이 빠르게 확산하는 사회에서는 기존 직업이 사라질 수밖에 없다. 하지만 그 자리에 또 다른 새로운 직업이 생기기도 한다. 여기서 중요한 점은 사라지는 일에서 벗어나 새롭게 생겨나는 일로 이동할 수 있도록 돕는 시스템이 존재하는가이다. 이때 필요한 것이 바로 ‘직업 재교육’이다. 정부와 기업은 직업 교육을 확대하고, 실직자나 위기에 놓인 노동자에게 전환 기회를 제공해야 한다. 또한, 기술의 발전이 인간의 삶을 위협하지 않도록 하는 제도적인 장치가 필요하다. 예를 들어, AI가 사람의 삶에 영향을 주는 판단을 할 때, 그것이 얼마나 공정한지, 차별적이지 않은지 감시하고 평가하는 시스템이 마련되어야 한다. AI의 결정에 맹목적으로 따르기보다는 그것을 적절히 활용하고 통제할 수 있는 시민적 감수성이 필요한 이유이다. 「과학기술학 연구」 는 ‘알고리즘 통치’라는 개념을 비판하며, 인간의 자율성과 판단력을 지켜내야 한다고 주장했다. 기술이 삶을 통제하는 것이 아니라 인간이 기술을 도구로 활용할 수 있는 사회를 만들어야 한다는 것이다. 함께 준비하는 AI와의 공존 AI는 이제 거스를 수 없는 시대의 흐름이 되었다. 이 변화의 시대에 가장 중요한 것은 ‘준비된 개인’과 ‘책임 있는 사회’라 할 수 있다. 개인은 기술을 두려워하기보다는 배워야 하고, 사회는 누구도 뒤처지지 않도록 보호하고 도와야 한다. 이를 위해 학교에서의 교육은 물론, 직장 내 훈련과 평생학습 기회의 확대가 필요하다. 정부는 제도적 보호 장치를 만들고, 기업은 기술 도입과 함께 사람을 위한 전략을 함께 고민해야 하는 시점이다. 결국, AI 시대의 일자리는 새롭게 만들어지고 또 진화하고 있다. 우리는 변화의 시대에 살고 있으며, 그 변화는 우리 모두가 함께 준비해야 할 과제라 할 수 있다. 기술 자체는 중립적이며, 그것을 어떻게 활용하느냐 하는 것은 전적으로 사람의 몫이다. AI 시대, 우리의 일자리는 어떻게 바뀔까? 그리고 우리는 그 변화에 어떻게 대응할 준비가 되어있을까?

  • 과학기술의 출발, 인공지능(AI)

    과학기술의 출발, 인공지능(AI) 기고 | 이재길 교수(KAIST 전산학부) 오늘날 인공지능(AI) 기술은 우리 사회 전반의 혁신을 주도하며 눈부신 발전을 거듭하고 있다. 특히 챗GPT(ChatGPT)와 같은 생성형 AI의 등장은 인공일반지능(AGI) 시대의 도래 가능성에 대한 기대를 한껏 높이고 있다. 이러한 흐름 속에서 정부는 과학기술정보통신부를 과학기술정보통신인공지능부로의 전환을 위한 법안을 발의하고 대통령 직속 국가인공지능위원회를 신설하는 등 국가 차원에서도 AI의 중요성을 강조하고 있다. 이처럼 AI로의 대전환(DX AI)이 가속화되는 시점에서, 우리는 관련 기술과 서비스를 명확히 정리하고 이해할 필요성을 느낀다. 이미 자율주행, 헬스케어, 알파고, 국방 기기, 산업 로봇, 번역 애플리케이션, 챗GPT 등 다양한 분야에서 인공지능 기술을 자연스럽게 활용하고 그 도움을 받고 있다. 데이터, 알고리즘, 컴퓨팅 파워, 그리고 데이터 품질 혁신 인공지능(AI, Artificial Intelligence)은 기술 범위, 학습 방식, 인지 수준에 따라 다양하게 분류된다. AI 기술이 영향을 미치는 범위에 따라서는 특정 작업을 수행하는 협의의 인공지능(ANI), 인간처럼 다방면에 걸쳐 지능을 발휘하는 범용 인공지능(AGI), 그리고 인간의 지능을 초월하는 Super 인공지능으로 나눌 수 있다. 또한, 인지 수준에 따라서는 단순히 주어진 자극에 반응하는 반응형 AI(예: IBM의 딥 블루, 초기 알파고), 과거 경험을 기억하여 활용하는 제한된 기억 AI(예: 자율주행 시스템), 그리고 새로운 콘텐츠를 창조하는 생성형 인공지능(GAI) 등으로 구분할 수 있다. 이러한 다양한 인공지능의 성공에는 데이터, 알고리즘, 컴퓨팅 파워라는 세 가지 핵심 요소가 필수적이다. 특히 데이터는 인공지능의 ‘씨앗’이라 불릴 만큼 중요하며, 양질의 데이터 없이는 AI가 제대로 학습하고 기능하기 어렵다. 하지만 인공지능 기술을 실제 서비스로 구현하는 과정에서 ‘데이터 처리’는 중요한 난관이다. 데이터 마이닝 연구실을 운영하며 수행한 연구들은 인공지능 훈련 시 발생하는 레이블 오류, 레이블 부족, 데이터 중복과 같은 데이터 품질 문제를 획기적으로 개선하는 데 초점을 맞추고 있다. 이러한 데이터 품질 문제는 훈련 비용 증가로 이어지기 때문에 이를 극복하고 인공지능 훈련 파이프라인의 비용을 최소화하여 더욱 효율적이고 강력한 인공지능 구현을 목표로 한다. 인공지능의 핵심 요소, 고품질 훈련 데이터 확보 실제 인공지능 훈련 과정에서는 데이터 품질 문제로 인해 훈련 비용이 불가피하게 증가하는 경우가 많다. 이러한 문제를 극복하고 인공지능 훈련 파이프라인의 비용을 최소화하는 것이 매우 중요하다. 주요 품질 문제는 크게 레이블 오류, 레이블 부족, 그리고 데이터 중복으로 나눌 수 있다. 가장 빈번하게 발생하는 레이블 오류 문제는 예를 들어, 이미지 분류 모델 훈련 데이터에서 강아지 사진에 고양이라고 잘못 표시되는 경우이다. 이를 해결하기 위해 레이블 오류를 자동으로 탐지하고 대응하며 모델을 훈련함으로써 데이터 전처리 과정 없이 훈련 비용을 최소화하는 방법을 연구했다. 특히, 훈련 데이터 샘플에 부여된 레이블의 신뢰도를 모델 훈련 도중에 검사하여 신뢰도가 높은 레이블은 그대로 사용하고, 신뢰도가 낮은 샘플은 수정 가능성을 판단하여 수정 가능성이 높으면 부여된 레이블 대신 수정된 레이블을 사용하는 하이브리드 방식을 적용했다. 이 방식은 레이블 오류 비율이 40%일 때도 95% 이상의 정확도로 오류를 수정할 수 있으며, 실제 세계 이미지 데이터(WebVision)에서는 분류 정확도를 최대 9%포인트 향상시키는 효과를 보였다. 두 번째로 레이블 부족 문제는 시계열 분류 모델(예: 건강상태 모니터링) 훈련 데이터에서 심방세동 지점처럼 중요한 정보의 레이블이 누락된 경우에 발생한다. 우리 연구진은 이 문제를 해결하기 위해 레이블을 자동으로 유추하여 레이블 취득 및 훈련 비용을 최소화하는 방식을 개발했다. 구체적으로, 시계열 데이터 내 시점별 임베딩 벡터를 비교하여 레이블이 변경되는 시점(예: 걷기에서 뛰기로 전환되는 지점)을 정확하게 파악하고, 이를 추가 레이블 부여에 활용한다. 특히, 기존 방법이 단순히 임베딩 간의 거리를 비교했던 것과 달리, 임베딩 궤적의 곡률을 비교하는 혁신적인 방식을 채택하여 더욱 정밀하게 기능을 수행할 수 있도록 했다. 이 방식은 헬스케어 센서 데이터에서 점진적으로 변화하는 시점을 찾는 데 특히 효과적이며, 최신 방법 대비 최대 12.7%의 정확도를 향상시켰다. 아래 그림은 임베딩 궤적의 곡률을 비교하는 혁신적인 방식을 채택한 것이다. 마지막으로, 데이터 중복 문제는 이미지 분류 모델 훈련 데이터에 유사한 샘플이 여러 개 포함되어 훈련 효율을 저해하는 현상이다. 이를 해결하기 위해 데이터 중복을 자동으로 제거하고 모델 훈련에 가장 도움이 될 핵심 집합을 선별함으로써 정확도 저하 없이 훈련 비용을 최소화할 수 있었다. 즉, 적은 양의 훈련 데이터로도 전체 데이터와 대등한 정확도를 달성하는 것이 목표다. 또한, 최초로 레이블 오류를 수정하는 동시에 핵심 집합을 선별하는 방식을 제안했다. 연구 결과, 레이블 오류 수정에 필요한 최소한의 훈련 데이터가 가장 효과적인 핵심 집합이라는 점을 입증했다. 이러한 접근 방식을 통해 모델 정확도를 유지하면서도 모델 훈련 시간을 최대 1/10까지 단축하는 성과를 거두었다. 이를 종합적으로 정리하면 아래 그림과 같다. 우리나라 AGI의 현재와 규모의 전쟁 AI 성공의 핵심인 컴퓨팅 파워는 글로벌 빅테크 기업들이 막대한 자원을 투입하는 ‘규모의 전쟁’ 양상을 보이고 있다. 우리나라도 ‘국가 AI 컴퓨팅센터’ 구축 등으로 인프라를 확충하고 있으나, 하드웨어 규모 면에서는 여전히 선두 기업들과 격차가 존재한다. 하지만 대한민국은 세계 5위권의 AI 연구 경쟁력과 스마트폰, 자동차 등 강력한 산업 생태계를 보유하고 있다. 이러한 강점을 바탕으로 우리는 규모의 전쟁을 직접 추구하기보다는 차별화된 AI 발전 전략을 모색해야 한다. 이를 ‘웹(Web)의 비유’를 통해 설명하고자 한다. 초기 인터넷의 기반을 만든 다르파(DARPA)보다 팀 버너스 리가 개발한 ‘웹’이 실제 생활에 더 큰 파급력을 가져왔듯이, GPT나 라마(Llama)와 같은 거대 언어 모델(LLM)을 그대로 따라가기보다는 새로운 접근 방식을 고민해야 한다. 즉, 막대한 자원이 필요한 기존 방식에서 벗어나, 우리나라가 강점을 가진 엔드 디바이스 제조 역량을 활용하여 개인의 상황과 맥락에 최적화된 ‘맞춤형 범용 인공지능(AGI)’ 개발에 집중하는 것이다. 이는 자원 효율성을 높이고 사용자 만족도를 극대화할 수 있으며, 우리의 비교 우위 산업에 자원을 집중하여 글로벌 AI 경쟁에서 우위를 점하는 전략이 될 수 있다. 따라서 우리의 AI 전략은 모든 곳에 동일한 AGI 환경을 제공하는 거대 모델 구축이 아닌, 컨텍스트별 AGI 자원을 효율적으로 배분하여 s-LLM, 엣지 AI, 피지컬 AI 등 엔드 디바이스의 가치를 높이는 방향으로 AGI 환경을 구축하는 것이 바람직하다. 인공지능 연구가 가져올 변화 AI의 발전은 연구자의 역할에도 큰 변화를 가져왔다. 생성형 AI가 아이디어 생성, 실험 설계, 결과 해석까지 수행하는 공동 연구자로 진화하면서, AI와의 효과적인 협업이 연구 생산성과 창의성의 핵심이 되고 있다. 궁극적으로 AI는 우리 생활 속에 자연스럽게 녹아들어 삶을 풍요롭게 하는 동반자가 되어야 한다. 이를 위해서는 AI 연구자들이 기술적 성취를 넘어 사회적 책임감을 가지고 끊임없이 소통하고 협력하는 것이 중요하다. AI 분야 연구자로서 학생들에게 세 가지를 당부하고 싶다. 첫째, 기술 너머의 문제를 보는 안목이 필요하다. AI 연구는 모델의 정확도를 높이거나 새로운 논문을 발표하는 것 이상을 목표해야 한다. 우리가 개발하는 기술이 사회에 어떤 영향을 미칠지, 누구에게 이로움을 줄 것이며, 혹여 누구에게는 부정적인 영향을 미칠 가능성은 없는지 끊임없이 자문해야 한다. 기술의 궁극적인 가치와 사회적 책임을 고민하는 것이야말로 진정한 연구자의 자세라고 생각한다. 둘째, 깊이와 지속성을 추구해야 한다. 인공지능 분야는 놀라운 속도로 발전하고 변화하고 있다. 하지만 진정으로 의미 있는 연구 성과는 단기적인 유행을 쫓기보단, 오랜 시간에 걸친 구조화된 사고와 꾸준한 실험을 통해 탄생한다. 눈앞의 성과에 연연하기보다 자신만의 문제의식과 방법론을 꾸준히 발전시키는 인내심과 끈기가 중요하다. 셋째, 협력과 융합을 두려워하지 않아야 한다. AI는 더 이상 컴퓨터 과학만의 전유물이 아니다. 기후 변화, 제조 혁신, 헬스케어, 교육 등 사회 전반의 문제를 해결하고 AI를 통해 사회를 변혁시키기 위해서는 다양한 분야와의 협력이 필수적이다. 타 분야 전문가들과 소통하고 융합하며 문제를 해결하는 태도는 앞으로 AI 연구자에게 가장 중요한 역량 중 하나가 될 것이다.

  • 한-아세안 디지털 협력, KISTI가 여는 슈퍼컴퓨팅의 미래

    한-아세안 디지털 협력, KISTI가 여는 슈퍼컴퓨팅의 미래 한-아세안 디지털 혁신 플래그십(Korea-ASEAN Digital Innovation Flagship, 이하 KADIF)프로젝트는 한국과 아세안의 디지털 협력을 본격화하기 위해 2023년 한-아세안 정상회의에서 제안된 협력 이니셔티브다. 데이터 및 HPC 기반 인프라 조성, 인적 역량 강화, AI 활용 확산이라는 세 가지 부문으로 구성된 KADIF 프로젝트에서 KISTI는 인프라 조성 부문을 맡아 고성능 컴퓨팅(HPC) 기반 마련의 핵심 역할을 수행하고 있다. 이러한 협력의 출발점을 알리는 공식 행사가 지난 3월 10일 인도네시아 자카르타에서 열렸다. ‘아세안 데이터 활용을 위한 HPC 인프라 및 HPC 역량 구축’ 사업 착수 행사, 그날의 생생한 분위기를 함께 만나보자. 사업의 출발을 알린 착수 행사 현장 자카르타 중심가에 위치한 인도네시아 연구혁신청은 이른 아침부터 분주했다. 행사 시작을 앞두고 현지 관계자들이 한국과 아세안 회원국 등지에서 도착한 참석자를 맞이했고, 회의실 한편에서는 주요 인사들의 사전 미팅이 진행되고 있었다. 100여 명의 참석자가 자리한 이번 행사는 주아세안 대한민국 대표부 이장근 대사의 환영사로 시작되었다.  이 대사는 “디지털 혁신은 아세안이 미래로 나아가기 위한 핵심 동력”이라며, 협력에 대한 기대를 밝혔다. 이어진 개회사에서 이식 KISTI 원장은 “KISTI는 그동안 축적해 온 HPC와 데이터 기반 연구 경험을 아세안 지역과 나눌 준비가 되어있으며, 이번 사업이 아세안 국가의 디지털 역량 강화에 기여하길 바란다”고 말했다.  Laksana Tri Handoko 인도네시아 연구혁신청 청장은 “치비농(Cibinong)에 위치한 연구혁신청 데이터센터가 HPC 설치 장소로 선정된 것에 감사를 표하며, 아세안 회원국이 의미 있게 활용할 수 있도록 설치와 운영 전반에 걸쳐 적극 지원하겠다”며 협력 의지를 밝혔다. 행사 후반에는 사업 추진 현황과 향후 계획에 대한 발표가 이어졌다. 김승해 KISTI 한아세안디지털혁신사업애자일팀장은 HPC 및 과학기술지식정보 플랫폼 구축 절차 등을 소개하며 향후 4년간 펼쳐질 사업 추진 로드맵을 공유했다. 객석에 자리한 아세안 회원국 정부와 연구기관 관계자들은 본 사업에 대한 공동의 이해를 모았다. 이후 이어진 네트워킹 세션에서는 기관별 실무자 간 교류도 이루어졌다. HPC 인프라 조성, 플랫폼 구축, 인재 양성으로 이어지는 디지털 혁신 아세안 데이터 활용을 위한 HPC 인프라 및 HPC 역량 구축사업은 한-아세안협력기금(ASEAN-Korea Cooperation Fund)의 지원을 받아 1,000만 달러(한화 약 147억 원) 예산으로 2024년부터 2028년까지 4년간 추진된다. 아세안 10개국이 공동 활용할 GPU 기반 HPC 인프라를 조성하고, 국가별 수요를 바탕으로 국가과학기술지식정보서비스(NTIS) 플랫폼을 구축하며, 현지 연구자와 전문가들이 이를 제대로 활용할 수 있도록 디지털 역량 강화 교육도 함께 추진된다. 단순한 인프라 구축을 넘어, 지속적인 디지털 생태계를 조성하는 것이 사업의 궁극적인 목표다. 지난 1월, KISTI는 본 사업의 일환으로 아세안 회원국의 과학기술 분야 연구자 20명을 초청해 디지털 역량 강화를 위한 HPC 연수 교육을 진행했다. 5일간 슈퍼컴퓨터 활용과 머신러닝, NTIS 활용법 등을 학습했으며, KISTI 연구시설과 타 연구기관 견학을 통해 실무 중심의 경험도 쌓았다. 본 교육은 연 2회씩 4년간 8회 운영되며, 총 160명의 전문가를 양성할 계획이다. 한편, KISTI가 보유한 NTIS의 보급을 통한 과학기술정보의 디지털화도 함께 추진 중이다. 아세안 각국의 국가 R&D 정보 및 활용 플랫폼을 개발해 과학기술정보의 등록, 관리, 검색을 지원할 예정이며, 이를 통해 아세안 내 과학기술 정보의 연계성과 공동연구 기반이 한층 강화될 것으로 기대된다. 앞으로 HPC 센터 개소, NTIS 시스템 구축, 전문가 양성 교육 개최 등 굵직한 일정들이 예정되어 있다. KISTI는 국가슈퍼컴퓨터 운영과 과학기술지식정보 플랫폼 개발 역량을 바탕으로 한국과 아세안 간 디지털 협력의 지도를 더욱 넓혀가는 한편, KISTI만의 전문성을 한층 더 공고히 해나갈 것이다. 과학기술 발전을 향한 아세안과의 동행이 지속 가능한 협력의 토대로 이어지길 기대해 본다.

  • 난제 해결의 Key, 첨단바이오 산업

    난제 해결의 Key, 첨단바이오 산업 기고 | 남진우 단장/교수(KRF 차세대바이오단, 한양대학교 생명과학과) 바이오 분야는 현재 인공지능(AI)과의 융합, 혁신적인 유전자편집 기술의 임상 적용, mRNA 백신 및 치료제 개발 등 다양한 이슈로 주목받고 있다. 이러한 변화는 난치병 치료의 새로운 가능성을 열고, 의료 및 산업 전반에 걸쳐 획기적인 혁신을 가져올 것으로 기대된다. 특히, 우리나라의 첨단바이오기술은 국가 전략기술로써 국민 건강과 산업 경쟁력에 기여할 잠재력을 지니고 있다. 글로벌 바이오 경제 시장이 급성장함에 따라, 연구자들은 융합형 역량을 갖추고 최신 기술 동향을 지속적으로 습득해야 할 것이다. 미래 바이오 분야의 경쟁력을 확보하기 위해서는 실패를 두려워하지 않는 도전 정신이 필수적이며, 지금이 바로 그 정신을 발휘해야 할 때이다. 암의 신속한 탐지 기술을 발견하다, ETCHING 암은 전 세계적으로 발병률과 사망률이 가장 높은 질환으로, 새로운 치료 표적과 진단 기법 개발이 시급하다. 이를 위해 계산학적 RNA 생물학(Computational RNA Biology) 연구는 필수적이며, 유전체 수준의 변화, 특히 암 관련 비암호화 RNA의 변화를 파악하는 것이 중요하다. 지금까지의 성과 중에서는 난치성 식도암에서 세계 최초로 규명한 HERES와 XIST lncRNA 유전자 연구가 가장 의미 있는 업적으로 평가된다. 이 연구는 새로운 비암호화 RNA가 암 발생을 조절한다는 사실을 밝혀 향후 치료 표적 개발에 기여했다. 현재는 AI를 접목한 바이오 빅데이터 분석을 통해 암 및 희귀 질환 유전체 변이 해석의 정확도를 높이고, 새로운 RNA 기반 치료 표적을 발굴하는 연구에 집중하고 있다. 유전체의 구조 변이가 발생하면 새로운 유전자가 발현될 수 있으며, 이러한 변화는 암의 발생 및 전이와 밀접한 관련이 있어 신속한 탐지가 필요하기 때문이다. 이러한 필요에 따라 개발된 것이 바로 고속 유전체 분석 기술인 ETCHING(에칭)이다. 우리 연구팀과 KISTI의 이준학 박사님이 협력하여 개발한 ETCHING은 암 환자에서 구조 변이를 빠르게 탐지할 수 있는 혁신적인 방법이다. ETCHING 기술을 개발할 당시, 연구실의 리소스만으로는 대규모 데이터를 분석하기 어려웠기 때문에 KISTI의 컴퓨팅 인프라를 활용하여 분석을 진행했다. 현재는 우리 연구실의 인프라만으로도 수십만 명의 데이터를 분석할 수 있는 상황이 됐다. 그러나 이 기술은 암 유전체 변이 중 구조 변이를 빠르게 분석하는 데 특화되어 있어, 다양한 분석을 수행하기에는 한계가 있다. 따라서 여전히 많은 연구자들이 대규모 유전체 분석을 위해 KISTI의 슈퍼 컴퓨팅과 같은 큰 컴퓨팅 인프라가 필요하다. 첨단바이오와 사회·정책의 융합으로 난제 해결 AI 기술은 신약 개발과 유전체 빅데이터 분석에 혁신을 가져오고 있으며, 현미경 이미지나 의료 영상에서 세포 및 조직의 변화를 자동으로 판별하여 진단에 활용되고 있다. 최근에는 파운데이션 AI 모델을 기반으로 한 AI 세포, AI 유전체, AI 비임상 플랫폼과 같은 디지털 트윈을 이용한 다양한 바이오 현상-기전연구, 바이오 시스템 예측 및 시뮬레이션, 바이오 분자 설계와 같은 혁신적 연구에 AI가 적극 활용되고 있다. 이처럼 AI 기술을 접목하면 인간의 직관에만 의존하던 연구에 데이터 기반의 정밀성과 속도를 부여해 혁신적인 성과를 이끌어 낼 수 있다.  또한, CRISPR와 같은 유전자편집 기술은 난치병 치료에 새로운 가능성을 열고 있다. 코로나19 팬데믹을 계기로 mRNA 기술은 백신뿐만 아니라 항암치료 등 다양한 분야로 확대 적용되며 큰 주목을 받고 있으며, 고령화 시대의 도래로 노화 연구, 정밀의료, 바이오 빅데이터 활용 등이 중요한 이슈로 떠오르고 있다.  이러한 바이오 분야의 주목과 함께 차세대 바이오단은 글로벌 바이오 난제를 해결하기 위한 다양한 연구 사업과 정책 방향을 추진하고 있다. 이 난제에는 노령화, 식량 부족, 인구절벽, 기후 변화 등이 포함되며, 이를 공동으로 해결하기 위한 노력이 진행되고 있다. 과학기술정보통신부는 지난해 NSF와 6개 국가가 협력하는 글로벌 센터 과제를 선정하고, 식량과 기후 변화 문제를 해결하기 위한 연구를 지원하고 있다. 이 과제에서는 합성 생물학과 바이오 파운드리 기술을 활용하여 새로운 바이오 소재를 개발하거나 탄소 저감을 위한 생명체를 창조하는 연구가 포함된다. 바이오 난제는 매우 광범위하지만, 정부와 협력하여 투자 방향을 결정하고 있다. 일반 국민들이 바이오 난제를 해결하는 연구의 성과를 체감하기까지는 시간이 걸리겠지만, 바이오 소재 분야는 가장 빠르게 체감할 수 있는 분야가 될 것이다. 경북대 김경진 교수의 경우, 합성생물학 연구를 통해 바이오 플라스틱을 개발하여 이미 플라스틱 문제 해결에 기여하고 있다. 신약 및 치료제 개발의 경우, 소요 기간을 ½~⅓로 단축하는 것이 핵심이다. 이를 해결하는 방법이 디지털과 바이오의 융합이며, 구글 딥마인드의 알파폴드와 같은 기술들이 이를 가속화 하고 있다. 실제로, 이전에 20~30년이 걸렸던 신약 개발이 최근에는 AI를 활용한 전임상 및 임상 시뮬레이션 덕분에 10년으로 단축됐다. 특히 mRNA 백신은 임상 단계에 진입하는 데 6개월밖에 걸리지 않았다. 이 밖에도 줄기세포와 재생의학은 조직 손상을 치유하고 노화를 지연시켜 건강수명을 연장할 수 있으며, 유전자편집과 합성생물학 기술은 작물의 생산성과 영양을 향상시켜 식량 문제에 대응할 수 있다. 세포 치료와 생식의학의 발전은 난임 치료와 맞춤형 의료를 통해 저출산 문제 완화에 기여할 것으로 기대된다. 이러한 복합 난제를 해결하기 위해서는 과학기술과 사회·정책적 노력이 융합되어야 한다. 우리나라 첨단바이오 산업의 전망 첨단바이오 기술이 12대 국가전략기술로 선정된 이유는 바이오 분야가 미래 신산업 창출과 국민 건강·안보에 미치는 영향력이 막대하기 때문이다. 바이오기술은 신약, 백신, 유전자치료 등 의료 분야의 혁신을 이끌 뿐만 아니라 농업, 식품, 환경 분야와 연계된 바이오 경제의 핵심축으로써 거대한 부가가치와 일자리를 창출할 잠재력을 지니고 있다. 특히 코로나19 팬데믹을 통해 백신 및 원료의약품의 자급화와 바이오기술 주권 확보의 중요성이 다시 한번 확인되면서, 첨단바이오는 국가 전략기술로서의 위상이 더욱 강화됐다. 국가 산업 측면에서 첨단바이오는 제약 및 의료기기 등 바이오헬스 산업을 고도화하여 미래 성장동력을 확보하고, 합성생물학 기반의 바이오 소재나 세포·유전자 치료와 같은 새로운 산업 분야의 발전을 촉진하는 역할을 한다. 또한, AI와 데이터 융합을 통한 디지털 바이오로 기존 산업의 혁신을 가속화하고, 국민 건강 증진과 생명 안보 강화에 기여하는 등 다방면에서 국가 경쟁력의 핵심축으로 작용하고 있다. 우리나라가 글로벌 바이오 강국으로 성장하기 위해서는 기초과학부터 응용연구에 이르는 전 주기의 연구개발 투자와 첨단 연구 인프라 확충이 필수적이다. 정부는 장기적 관점에서 안정적인 연구비 지원과 규제 개선을 통해 혁신을 촉진하고, 국가 바이오 데이터센터, 대형 바이오뱅크, 고성능 슈퍼컴퓨터와 같은 연구 인프라 구축에 힘써야 한다. 기업은 과감한 R&D 투자와 오픈이노베이션을 통해 신기술 개발과 상용화에 앞장서며, 대학 및 연구기관과의 협력으로 연구성과를 산업화하는 역할이 중요하다. 학계는 창의적인 아이디어와 우수 인재를 배출하고, 국제 공동연구와 네트워킹을 통해 연구 경쟁력을 높여야 한다. 따라서 KISTI와 같은 전문 연구기관은 바이오 빅데이터의 통합 관리 활용 플랫폼 개발과 초고성능 연산 지원 등 연구자들에게 필수적인 데이터·분석 플랫폼 인프라를 제공하고, 산학연 연계를 촉진하는 허브 역할을 수행해야 할 것이다. 이러한 노력이 결합한다면 우리나라는 글로벌 바이오 강국으로 도약할 수 있을 것이다. 글로벌 첨단바이오 산업의 전망과 미래 글로벌 첨단바이오 연구와 산업은 의료, 농업, 환경 등 다양한 분야에서 빠른 혁신과 성장을 이어갈 전망이다. 유전자 치료제와 세포 치료제의 상용화는 난치병 치료의 새로운 장을 열고 있으며, mRNA 백신 기술과 CRISPR 유전자편집 치료가 의료 현장에서 현실화되고 있다. 이러한 혁신은 개인의 유전체 정보를 활용한 정밀의료를 가능하게 하여 맞춤형 치료와 질병 예측·예방이 일상화될 것으로 전망된다. 또한, 이와 관련하여 과거 불치병으로 여겨지던 질환도 치료가 가능해지고, 건강수명이 연장되어 고령화 사회의 삶의 질이 향상될 것이다.  농업과 식량 분야에서는 유전자편집 작물과 배양육 등 첨단 식품기술이 식량 안보를 강화하고, 환경친화적인 바이오 제조공정 도입으로 산업의 지속가능성은 커질 것이다. 이러한 변화는 첨단바이오 산업의 성장으로 새로운 일자리와 시장을 창출하며, 전반적인 경제 구조와 생활 방식에도 큰 변화를 가져올 것으로 예상된다. 이에 따라 글로벌 바이오 경제 시장 규모는 향후 수조 달러대로 성장하게 될 것이며, 미국, 유럽, 중국 등 각국이 전략적 투자를 확대하여 기술 패권 경쟁도 한층 치열해질 전망이다. 이러한 미래를 대비하기 위해 바이오 연구를 꿈꾸는 학생들과 젊은 연구자들은 경쟁력을 갖출 필요가 있다. 우선, 생명과학 연구에 대한 폭넓은 융합형 역량을 갖추는 것이 중요하다.  탄탄한 분자생물학, 유전학 등의 기초 지식을 쌓는 동시에 프로그래밍과 AI 데이터 분석능력을 키워 바이오 빅데이터를 다룰 수 있어야 한다. 실험 기술뿐 아니라 논문 작성 능력과 영어 소통 능력을 배양하여 글로벌 공동연구에 참여할 준비를 해야 한다. 끊임없는 학습과 호기심으로 최신 기술 동향을 습득하고, 실패를 두려워하지 않는 도전 정신으로 연구에 임한다면, 미래 바이오 분야에서 큰 경쟁력을 가질 수 있을 것이다. 이러한 준비가 첨단바이오의 발전과 함께 개인의 성장에도 기여할 것이다.

  • 초고성능 컴퓨팅으로 완성하는 디지털 바이오AI 강국

    초고성능 컴퓨팅으로 완성하는 디지털 바이오AI 강국 기고 | 이준학 단장(디지털바이오컴퓨팅연구단) 초고성능 컴퓨팅과 바이오 데이터가 만나 디지털 바이오 혁신을 이끌고 있다. KISTI 디지털바이오컴퓨팅연구단은 국가 바이오 데이터 스테이션(K-BDS)을 중심으로 대규모 바이오 데이터를 수집·분석하며 AI 기반 연구 환경을 구축 중이다. 정밀 의료 시대, 초고성능 인프라와 데이터가 만든 새로운 바이오 생태계는 어떤 미래를 열어갈까? 초고성능 컴퓨팅과 바이오 데이터, 미래를 연다 차세대 염기서열 분석(Next-Generation Sequencing, NGS) 기술의 비약적 발전과 바이오산업의 급성장에 따라, 생명과학 분야에서 대규모 생물정보학 데이터의 중요성이 더욱 커지고 있다. 특히, 최첨단 기술과 접목된 정밀의료의 부상으로 바이오 연구의 패러다임이 근본적으로 변화하고 있다. 바이오 데이터는 생명과학 연구 과정에서 생성·활용되는 모든 생물학적 정보를 포괄하며, 유전체(Genome), 전사체(Transcriptome), 단백체(Proteome), 대사체(Metabolome) 등의 다중오믹스(Multi-omics) 데이터를 포함한다. 그러나 이러한 데이터는 수십~수백 테라바이트(TB), 경우에 따라서는 페타바이트(PB) 규모에 달하며, 비정형성과 높은 복잡성으로 인해 개별 연구기관이나 의료기관 차원의 전산 인프라만으로는 빅데이터를 활용한 생물정보 분석과 활용에 한계가 있다. 이 같은 한계를 극복하기 위해 주요 선진국들은 바이오 데이터의 대규모 생산·집적·표준화를 넘어, 최적화된 분석 플랫폼과 인공지능(AI) 기술을 접목하여 연구 및 임상에 적용하는 정책을 적극적으로 추진하고 있다. 우리나라 또한 2024년 ‘첨단 바이오 이니셔티브’를 발표하고, 유전체 기반 정밀의료, 디지털 헬스케어, 차세대 바이오 신약 등 바이오 전 분야의 혁신을 통해 2035년까지 글로벌 바이오 기술 강국으로 도약하기 위한 전략을 본격화하고 있다.  이러한 국정 아젠다의 성공적인 구현을 위해서는 대규모 바이오 데이터를 체계적으로 수집·분석하고, 연구자와 기업이 이를 효율적으로 활용할 수 있는 국가 바이오 빅데이터 인프라 및 활용환경 구축이 필수적이며 이를 위해 KISTI 디지털바이오컴퓨팅연구단은 국가 바이오 데이터 플랫폼과 바이오 분야의 초고성능 컴퓨팅(Supercomputing) 인프라 구축을 적극적으로 추진하여 디지털 바이오 혁신을 가속화하고 있다. 구체적으로, 2025년에 국가전략기술 첨단바이오 분야-디지털 헬스데이터 분석·활용 중점기술분야의 특화연구소 지정을 추진하고 있으며, 디지털 헬스데이터의 확보에서부터 초고성능 컴퓨팅 인프라 기반의 분석 기술 개발, 지속 가능한 운영 및 지원까지 전 주기적 연구 생태계를 구축 중이다. 이를 통해 AI-HPC 기반의 디지털헬스데이터의 연구 환경을 산·학·연·병 연구자들에게 제공하여 연구 생산성을 극대화하고, 첨단 바이오 연구의 성과 창출을 촉진하고 있다. K-BDS, 바이오 연구를 연결하다 특히 연구단은 국가 생명정보사업의 핵심 기관으로서 2021년부터 국가생명연구자원정보센터(KOBIC)와 협력하여 국가 바이오 데이터 스테이션(K-BDS)의 구축 및 운영을 수행하고 있다. K-BDS는 바이오 연구·개발(R&D) 과정에서 생성되는 데이터를 통합적으로 수집·관리하며, 품질 관리를 거친 데이터를 연구자들에게 제공하고 이의 분석 및 활용을 지원하는 국가 바이오 데이터 플랫폼으로서 연구단은 K-BDS 체계에서 연구자를 위한 데이터 분석 및 활용환경 구축 부문을 담당하고 있다. 현재 K-BDS는 국가에 산재한 바이오 데이터의 종합적 수집, 연계 및 데이터 제공 뿐 아니라 관련 부처 간 데이터 고속 전송 네트워크와 분석 도구 및 고성능 컴퓨팅 기반 연구 환경을 제공하고, 연구자와 기업 간 협업을 지원하는 등 국가 바이오 데이터의 통합 관리와 전략적 활용을 위한 핵심 기반으로 운영되고 있다.  데이터 분석 및 활용 환경을 위해 CPU 2,432코어, A100(40G/80G) 55개 GPU, 2PB 스토리지를 갖춘 바이오 빅데이터 분석 전용 컴퓨팅 인프라를 구축했으며 대략 연간 50만 노드시간 이상을 연구자에게 지속적으로 제공하고 있다. 또한, 대규모 바이오 데이터 분석 환경의 효율성과 효과성을 위하여 분석 도구, 공개 데이터베이스(DB), K-BDS 연구데이터를 함께 제공하고 확대해 나감으로써 데이터 접근성과 분석 편의성을 지속적으로 높이고 있다.  2024년 한 해 과제 47건(구축 이후 누적 159건) 지원 및 기술지원 102건(누적 258건)을 달성했으며, 현재까지 71건의 학술지 게재, 특허 출원 등 다양한 연구 성과를 창출했다. 시스템 가용률은 99.18%, 인프라 활용률은 88.7%로서 그 안정성과 유용성을 입증하여 연구자뿐 아니라 기업 사용자들로부터도 높은 신뢰를 얻고 있다. 참고로 과제 종료 후에는 분석 도구 및 데이터셋 기탁 등 재공유를 통해 국내 바이오 데이터 분석 활성화에 실질적으로 기여하는 선순환 구조로 운영된다.  연구단은 앞으로도 K-BDS를 중심으로 하는 국가 바이오 데이터 활용환경의 고도화 및 활용 활성화를 지속 추진하고, 국가 바이오 연구 생태계의 경쟁력 강화를 위한 핵심 인프라로서의 역할을 충실히 수행해 나갈 계획이다. 디지털 바이오 생태계 구축, 건강한 미래를 완성할 수 있을까? 뿐만 아니라, 디지털바이오컴퓨팅연구단은 AI 기반 바이오 연구 생태계 구축에 앞장서며, 첨단 기술과의 융합을 통해 난제 해결에 주도적인 역할을 수행하고 있다. 이를 위해 ‘AI 기반 질환 데이터 분석 개방형 플랫폼 구축’ 과제를 수행하며, 질환 및 다양한 오믹스 원시·학습 데이터의 수집 및 공유, 사전학습 및 응용 AI 모델의 개발과 서비스, 고성능 분산 스토리지 및 연산 자원을 포함한 AI 분석 인프라 환경을 구축하고 있다. 특히, 지속적인 자원 도입을 통해 초고성능 컴퓨팅 기반의 정밀 데이터 분석 기술 확보에 주력하고 있으며, 2025년에는 H200 GPU 16기 도입이 예정되어 있다. 이를 통해 자원의 효율적 활용, 유연한 인프라 관리 및 확장성을 보장할 계획이다. 또한, 2025년부터는 국가 바이오 연구 개발사업에서 축적된 분석 기술과 플랫폼을 지속 활용하기 위한 ‘통합 바이오 데이터 분석·활용 시너지 플랫폼 개발’ 사업도 병행 추진된다. 본 사업은 기존 성과를 체계적으로 통합·관리할 수 있는 기반을 마련함으로써, 연구 생태계의 자생적 활성화와 디지털 바이오혁신의 가속화를 도모할 것으로 기대된다.  이러한 흐름은 2026년 하반기 개방될 예정인 ‘바이오 빅데이터 플랫폼’으로 이어진다. 이 플랫폼은 ‘국가 통합 바이오 빅데이터 구축 사업’의 일환으로, 2032년까지 한국인 100만 명의 임상정보, 의무기록, 공공기관 보유 데이터, 개인생성건강정보, 유전체 및 그 외 오믹스 데이터를 포함한 통합 바이오 빅데이터를 분석·처리·저장·활용할 수 있는 핵심 R&D 인프라로 기능하게 된다. 디지털바이오연구단은 이 사업에서 대규모 데이터 분석을 위한 컴퓨팅 인프라 구축과 연구자 맞춤형 연구지원 플랫폼인 ‘바이오 빅데이터 플랫폼’ 개발을 담당하고 있다. 또한, 클라우드 및 고속 병렬 처리 기술 기반의 통합 바이오 빅데이터 분석 플랫폼을 개발하여 방대한 임상정보 및 유전체 데이터를 효율적으로 처리하고 분석할 수 있는 연구환경 개발을 목표로 하고 있다. 이러한 노력을 통해 질병의 원인 규명 및 예측·예방을 통한 국민 보건 향상과 바이오산업 혁신을 위한 정밀 의료·맞춤 의료 연구 발전에 크게 기여할 것으로 예상된다.

  • AI로 편리해진, 새로워진 ScienceON

    AI로 편리해진, 새로워진 ScienceON   ScienceON, 신규 개발 AI 서비스 3종 적용   누구나 무료로 이용할 수 있는 과학기술정보 전문 플랫폼 ScienceON(사이언스온)이 새로운 기능들로 더 편리해졌다. 이용자의 편리한 정보 검색, 더욱 지능적인 정보 수집을 위한 세 가지의 인공지능(AI) 서비스가 적용된 것. 사이언스온은 국내외 논문, 특허, 국가R&D 보고서 등 과학기술정보와 연구데이터, 정보 분석 서비스 및 연구 인프라를 연계·융합하여 한 곳에서 제공하는 지식정보 플랫폼이다. 과학기술 분야의 많은 연구자와 개발자, 학생 등이 자료 검색과 활용을 위해 사이언스온을 찾고 있다. KISTI는 연구 활동의 배경이 되는 사이언스온을 고도화함으로써 연구 효율성 증진에 기여하고자 다양한 AI 서비스들을 더했다.   대화형 AI 통합 검색 서비스 - SAI(ScienceON AI)   “과학기술과 하나 되는 우리!”라는 메시지와 함께 ‘SAI’라는 이름의 생성형 AI 기능이 등장했다. SAI는 기존 키워드 기반 검색 방식에서 벗어나 AI와의 대화를 통해 연구에 필요한 정보를 찾아주는 서비스다. 이용자가 AI에게 질문을 하면, AI는 질문에 관한 논문, 특허, 보고서, 동향 등 다양한 정보를 분석해 답변을 제공한다. 답변에는 AI가 참고한 자료의 정보가 표기되며, 이용자에게 추천하는 질문과 검색어도 제시된다. 본 기능으로 이용자들은 더 넓은 범위에서 정보를 탐색하고 새로운 연구 방향을 발견할 수 있다. 이번 기능은 사이언스온이 보유한 1억 8천만 건의 데이터를 활용하고, KISTI가 자체 개발한 생성형 언어 모델 고니(KONI)와 검색 증강 생성(RAG) 기술을 바탕으로 개발돼 환각 현상을 최소화했다. 연구의 정확성과 신뢰성을 높이는 SAI를 통해 더 효율적이고 생산적인 과학기술 연구가 이뤄지기를 바란다.   ScienceON TREND 화면   원하는 주제로 과학기술 트렌드 직접 만든다 - ScienceON TREND   사이언스온은 과학기술 분야의 트렌드 정보를 제공하는 ‘사이언스온 트렌드(ScienceON TREND)’ 서비스에 새 기능을 추가했다. 이용자가 자신의 관심사에 관한 트렌드 콘텐츠를 직접 생성하는 기능을 더한 것이다. 기존의 사이언스온 트렌드 코너는 뉴스와 이용자의 검색 로그 등을 바탕으로 최신 이슈를 탐지하여 제공해 왔는데, 이번 기능 추가로 이용자가 직접 관심 키워드를 입력하고 해당 키워드에 대한 트렌드를 생성할 수도 있게 됐다. 일방적인 서비스에서 이용자 맞춤형으로 운영되는 서비스로 탈바꿈한 것이다. 트렌드 생성 버튼을 통해 과학기술 키워드를 입력하면, 키워드 클라우드, 관심도 변화, 주요 출원인, 웹 뉴스 등 내외부 지식 인프라를 바탕으로 한 이미지가 자동으로 생성된다. 그간 트렌드 서비스는 43만 회 이상 이용되며 사이언스온의 대표 서비스로 자리매김했다. 이번 업그레이드로 더 많은 관심과 호응을 이끌 것으로 기대된다.   대화형 AI 통합 검색 서비스 ‘SAI’ 화면   논문 자동 비교 분석으로 인사이트 제시 - AI-Reviewer   여러 논문을 비교하여 인사이트를 제공하는 ‘AI-Reviewer’ 기능도 추가됐다. 본 기능은 최대 10개의 논문을 자동으로 비교·분석하여 연구의 목적, 제약 및 한계점, 선행연구와의 차별점, 연구 방법 등 11개의 관점에서의 리뷰 결과를 제공한다. 사이언스온 내의 논문은 물론, 이용자가 별도로 업로드한 논문도 분석해 준다. 이용자는 AI와 질의응답 형식의 대화도 나눌 수 있다. 기존에 제공되던 ‘AI-Helper’라는 이름의 논문 요약·번역·용어 설명 AI 서비스와 연계돼 논문 내용 검토 또한 지원한다. 문헌조사는 연구의 기본이자 중요한 과정이다. 똑똑한 AI-Reviewer를 통해 새로운 발견과 아이디어가 창출되기를 바란다.   AI-Reviewer 서비스 화면  

  • 한국과 프랑스, 과학기술 협력을 도모하다!

    한국과 프랑스, 과학기술 협력을 도모하다!   Inria-KAIST-KISTI, AI·HPC 공동 협력을 위한 세미나 개최   세계 각국은 기술 패권을 주도하기 위한 경쟁과 동시에 서로의 역량과 자원을 나누어 상생하고자 하는 협력 또한 활발히 추진하고 있다. 과학기술 경쟁력 향상을 위해 국가 간 우수한 연구성과와 동향을 공유함으로써 새로운 기회를 모색하는 것은 중요하고 필수불가결한 일이다. KISTI는 국내 과학기술 전문대학인 KAIST와 함께 프랑스와의 국제협력 기회를 모색하기 위해 AI와 HPC 분야의 공동 세미나를 개최했다. 서울에 반가운 첫눈이 내린 11월 27일, 서울 AI 허브에서 개최된 ‘French-Korean Workshop’을 찾았다.   우수 성과와 국가별 연구 동향 공유   KISTI와 KAIST, 프랑스의 국립디지털과학기술연구소(Inria)가 한국-프랑스 양국 간 인공지능(AI), HPC(High Performance Computing) 분야의 협력을 도모하는 공동 세미나 ‘French-Korean Workshop’을 개최했다. 이번 세미나는 각 기관의 AI 연구 현황을 공유함으로써 공동 연구 기회를 발굴하기 위한 자리로 마련됐다. KISTI의 임철수 글로벌전략팀장은 개회사에서 “이번 세미나를 계기로 AI와 HPC 분야에서 선구적인 역량을 가진 프랑스와 KAIST, 그리고 KISTI가 상호 협력하여 공동 연구를 활발히 추진해 나가기를 바란다”라며 “국가 간 경계를 넘은 국제협력을 통해 더 혁신적이고 우수한 성과가 창출될 것”이라고 말했다.   이어서 한국과 프랑스 각국이 어떠한 국제협력 체계와 전략을 갖추고 있는지 소개하는 시간을 가졌다. 첫 연사로 나선 김주영 주한유럽연합대표부 과학기술혁신정책관은 유럽연합(EU)이 주관하는 연구 혁신 프로그램인 ‘호라이즌 유럽(Horizon Europe)’에 대해 상세히 소개했고, KAIST 재학생 등 참관객으로부터 많은 질문을 받았다. Inria의 Cecile Vigouroux 국제협력부장은 당 연구소의 국제협력 투자 현황 등에 대해 소개하면서 KISTI를 비롯한 한국의 연구기관과의 협력 현황을 언급했다. 그는 “2023년 6월 KISTI와 업무협약을 체결한 이래 강한 파트너십을 유지해 오고 있다”고 말했다.   French-Korean Workshop 참가자 일동   세계의 관심사, AI   세미나의 오전 프로그램으로는 기관별 인공지능 기술 개발 동향과 성과를 공유하는 ‘AI Research’가 진행됐다. 이번 세미나를 주최한 세 개의 기관인 Inria, KAIST, KISTI에서 한 명씩 발표자가 나서 자신이 속한 기관의 AI 기술 개발 현황과 주요한 성과 사례들을 발표했다. 기관 간 서로 다른 AI 개발 전략과 역량을 공유함으로써 서로가 도우며 협력할 만한 과제를 발굴하기 위함이었다.   KISTI에서는 초거대AI연구단의 장광선 선임기술원이 발표자로 나서 ‘과학기술을 위한 자연어 처리(Natural Language Processing, NLP) 모델’을 주제로 KISTI가 개발한 NLP 모델과 이를 적용한 대국민 과학기술 서비스들을 소개했다. 그는 KISTI가 오픈사이언스를 위한 데이터 플랫폼들을 운영하고 있음을 강조하며, 디지털큐레이션센터의 과학기술 문헌 대상 정보 자동 추출 기술의 우수성뿐만 아니라, 오픈액세스 전문 플랫폼인 AccessON과 과학기술 지식 인프라 통합 서비스 플랫폼인 ScienceON에 적용된 여러 AI 기술 적용 사례를 이야기했다.   장광선 선임기술원이 속한 초거대AI연구단은 과학기술정보 기반의 거대언어모델(LLM)을 개발하고 연구하고 있으며, 과학기술정보 특화 생성형 언어 모델 ‘KONI(KISTI Open Natural Intelligence, 한글명 고니)’를 개발했다. 장 선임기술원은 발표에서 KONI를 소개하며 KISTI가 가진 AI 분야의 강점 역량을 알렸으며, “글로벌 오픈사이언스를 위한 한국-프랑스 간 데이터 공유 협력이 이어지기를 소망한다”고 말했다.   ‘과학기술을 위한 자연어 처리 모델’을 주제로 발표한 장광선 초거대AI연구단 선임기술원   "과학기술정보 기반의 거대언어모델(LLM)을 개발하고 연구하고 있으며, 과학기술정보 특화 생성형 언어 모델 ‘KONI(KISTI Open Natural Intelligence, 한글명 고니)’를 개발했다."   혁신 연구를 위한 핵심, HPC   이날 세미나의 본격적인 강연과 토론은 오후부터 이어졌다. 총 세 가지의 세션으로 나뉘었으며, KISTI는 ‘생성형 인공지능(Generative AI)’과 ‘AI와 HPC’라는 세션에 각각 참여했다. HPC 세션에서는 이종숙 HPC융합플랫폼연구단 책임연구원이 좌장을 맡았고, 슈퍼컴퓨팅인프라센터 시스템팀의 이국화 선임기술원이 ‘KISTI 국가슈퍼컴퓨팅센터 소개’를 주제로 발표했다.   이국화 선임기술원은 프랑스 연구자들에게는 생소할 한국의 슈퍼컴퓨팅 체계에 대해 상세히 다뤘다. 특히 KISTI가 운용하고 있는 슈퍼컴퓨터 5호기 ‘누리온(Nurion)’에 관하여 시스템의 체제부터 활용 현황, 성과까지 자세히 안내해 프랑스 연구진들의 한국의 HPC 운용 현황에 대한 이해를 돕고, 대학 기관인 KAIST의 구성원들이 슈퍼컴퓨터 활용에 관심을 가지고 참여할 수 있도록 장려했다. 또한 누리온이 CPU 기반이나, GPU 기반의 클러스터 뉴론(Neuron) 활용을 지원하고 있다고 설명했다. 이어 슈퍼컴퓨터 6호기 시스템 도입 계획도 소개했다. 한국의 차세대 HPC가 될 6호기 시스템은 현재의 5호기 대비 23배 이상 빠른 600PF의 성능을 목표로 하고 있으며 GPU 약 1만 개, CPU 약 5천 개로 구성할 예정이라 전했다.   슈퍼컴퓨터 활용 현황에 관해서는 현재 5호기 시스템이 최대 사용률 99.45%, 평균 사용률 76.3%를 기록한다고 말하며 한국의 슈퍼컴퓨터 활용이 활발한 점을 알렸다. KISTI는 슈퍼컴퓨터 자원의 90%를 무료로 개방하고 있는데 이는 R&D 혁신 지원 프로그램을 통해 선정된 연구 프로젝트를 지원하는 것이다. 이국화 선임기술원은 “우리의 R&D 혁신 지원 프로그램으로 슈퍼컴퓨터를 활용하는 연구 문화가 활성화되고, 기초과학, 의학, 바이오 등 다양한 분야에서 세계적인 연구성과가 창출됐다”며 “6호기 도입 후에도 더 많은 혁신을 위해 슈퍼컴퓨터 활용을 적극 지원할 것”이라는 포부를 밝혔다.   생성형 인공지능 세션에서는 장광선 선임기술원이 다시 연사로 나서 KISTI가 개발한 거대언어모델 KONI에 대해 자세히 소개했다. 그는 “KONI는 ‘연구 자동화’라는 비전을 달성해 줄 AI 모델로써 개발했다”며 KISTI의 지향점을 강조하는 한편, “한국어 LLM에 대한 종합적인 사고력을 측정하는 LogicKor 벤치마크 리더보드에서 KONI가 동일 크기 LLM 중 1위, 70B 이하 LLM 중 처음으로 8점을 넘어선 성과를 달성했다”며 KISTI가 가진 AI 역량을 홍보하고 기관 간 협력도 도모했다.   ‘KISTI 국가슈퍼컴퓨팅센터 소개’를 주제로 발표한 슈퍼컴퓨팅인프라센터 시스템팀의 이국화 선임기술원   "우리의 R&D 혁신 지원 프로그램으로 슈퍼컴퓨터를 활용하는 연구 문화가 활성화되고, 기초과학, 의학, 바이오 등 다양한 분야에서 세계적인 연구성과가 창출됐다."   한국-프랑스, 공동 연구에 한마음 한뜻   Inria는 프랑스의 과학 및 경제 발전을 위해 1967년 설립된 디지털 사이언스 및 기술 분야의 국가 연구기관이다. 4천여 명의 연구자가 재직하고 있으며 225개의 프로젝트팀으로 구성된 큰 규모의 연구소다. 이러한 Inria와 KISTI의 인연은 2017년에 시작됐다. 이들 기관은 당해 빅데이터 처리 및 가시화 기술 개발을 위해 협력하기로 양해각서를 체결한 데 이어 오늘날까지 협력 관계를 이어오고 있다. 지난 2021년에는 프랑스 국무장관과 함께 Inria의 담당자가 KISTI를 내방한 적도 있다. 이들은 한국-프랑스 간 공동 연구에 대해 더욱 심도 있는 논의를 진행했었다.   그리고 지난해 6월, 양 기관은 HPC와 연구망 네트워크, 과학기술 데이터 인프라의 디지털 전환 등 다양한 부문에 관한 협력을 다짐하며 업무협약을 체결했다. 오랜 기간의 인연을 더욱 공고히 하며 더 큰 도약을 함께 약속한 것이다. 이처럼 긴 세월을 함께하는 것은 각자의 발전과 성장을 확인하며 신뢰를 쌓았기 때문일 것이다. 머나먼 거리와 보이지 않는 경계를 넘어, 우리나라와 프랑스의 거대한 융합을 바라본다.

  • 디지털 전환 실행을 위한 데이터 고려 사항과 관리 기준

    디지털 전환 실행을 위한 데이터 고려 사항과 관리 기준   ISSUE BRIEF 제72호   사회 전반에서 AI와 빅데이터를 통한 디지털 전환이 추진되고 있다. 디지털 전환에 사용되는 AI 기술은 데이터 학습을 통해 발전되므로, 데이터의 양과 품질 등 데이터 관리는 디지털 전환에 있어서 핵심 사항이다. KISTI 이슈브리프 제72호는 디지털 전환 시 고려해야 할 사항과 이에 따른 데이터 관리 기준을 제시하고, KISTI의 디지털 큐레이션 성숙도 모델을 활용한 디지털 전환 시 데이터 관리 기준 개발 및 적용 사례를 소개한다.   디지털 전환의 의미와 데이터 고려 사항   디지털 전환은 AI, 빅데이터 등 디지털 기술을 활용한 조직 업무 프로세스를 혁신하는 것을 의미한다. 최근에는 디지털 전환에 사용되는 AI 기술 개발 방향이 생성형 AI로 발전하면서 사전 학습에 더욱 큰 규모의 데이터가 요구되고 있다. 또한 데이터의 활용 목적과 사용 방식에 따라 데이터 품질 기준도 다양해지고 있으며, 정형·비정형 데이터 등 다양한 데이터의 활용, AI 확산의 주요 요소인 데이터 상호운용성, 신뢰성, 무결성 등을 비롯한 데이터 편향에 관한 품질 관리 역시 요구받고 있다.   한편 디지털 전환은 데이터를 기반으로 하므로 고품질의 데이터가 체계적으로 정리되고, 공유될 수 있으며, 상호 연결되도록 데이터 관리 전략을 수립하는 것이 중요하다. 또한 조직의 목표 달성을 지원하는 데이터 거버넌스, 디지털 전환 성공의 핵심 요인이 되는 조직 구성원들의 디지털 전환 수용 태도와 기술 역량도 데이터 관리를 위한 중요한 항목이 된다. 이와 더불어 빠르게 진화하는 기술 발전에 따른 데이터의 저작권 관리, 개인정보 보호 등의 법/제도 규제 관리도 디지털 전환을 위한 데이터 고려 사항으로 여겨진다.   디지털 큐레이션 성숙도 모델을 활용한 데이터 관리   KISTI는 오픈 사이언스와 데이터 중심 연구 시대에 대응하기 위해 디지털 기술을 활용하여 큐레이션 체제의 혁신과 지능화를 추진하고 있다. 이에 KISTI는 과학기술정보 큐레이션 업무 디지털 전환 측정·관리의 객관적 기준을 마련하고자 디지털 큐레이션 성숙도 모델을 개발했다. 성숙도 모델 개발을 위해 관련 분야의 다양한 성숙도 모델을 벤치마크하여 예비 모델을 구성하고, 대학, 연구소 등 고경력 데이터 전문가 100여 명의 검증을 거쳐 최종 모델을 도출했다.   디지털 큐레이션 성숙도 모델은 디지털 전환에 관한 데이터와 디지털 기술 수준 관리를 중심으로 개발되었다. 측정 범주는 디지털 큐레이션 전주기에 관련된 전략, 조직, 기술, 데이터, 영향력 등 5개로 구성되었으며, 각 범주별로 핵심 측정 지표 3~10개로 구체화했다. KISTI는 디지털 큐레이션 업무와 디지털 큐레이션 성숙도 항목을 매핑하여 디지털 전환 관리 포인트를 제시함으로써 디지털 전환 목표를 관리하고 조직 구성원 및 관계자들의 이해와 참여를 증진하고 있으며, 디지털 큐레이션 성숙도 측정 지표를 사용하여 디지털 전환 수준을 진단하고 목표 관리 및 개선 활동을 실시하고 있다.   KISTI 디지털 큐레이션 성숙도 모델   성공적인 디지털 전환을 위한 데이터 관리 방법은?   데이터를 기반으로 하는 디지털 전환은 데이터를 중심으로 내외부 이해관계자들과 협력하고, 원활한 데이터 확보 및 활용을 위한 전사적 디지털 전환 전략을 수립하는 것이 필수다. 이를 위해 디지털 시대에 부합하는 전사적 데이터 거버넌스 체제 수립, 구성원들의 디지털 역량 및 디지털 리터러시 강화가 필요하다. 그리고 국내외 데이터 관련 법/제도 수립, 정책 모니터링 대응 활동, 데이터 생애주기에 관계된 이해관계자를 식별하고 데이터 권리 확보를 통해 안전하고 적법한 데이터 활용을 추진해야 한다.   또한 디지털 전환 전략과 추진 목표에 부합하도록 조직의 디지털 기술 개발 및 서비스 요구 수준에 부합하는 데이터 품질 기준, 데이터 관리 기준, 법/제도적 규제 관리 기준 등 디지털 전환 목표 달성을 지원하는 데이터 관리 기준을 수립해야 한다. 뿐만 아니라 데이터 생애주기 관점에서 데이터를 모니터링하고 전사적인 관점의 데이터 개선 활동을 할 수 있는 데이터 관리 전담 조직을 마련하여 우리 사회 각 분야에서 디지털 전환이 성공적으로 이뤄질 수 있도록 준비해야 한다.   KISTI 과학기술 큐레이션 체계의 디지털 전환 개념도

  • 과학기술정보를 자동 구축하는 AI 시스템, DiCuON

    과학기술정보를 자동 구축하는 AI 시스템, DiCuON   더 유익하고 더 쉽게… 과학기술 AI 생태계에 활력을!   바야흐로 디지털 대전환 시대, 데이터의 생산과 활용이 경제와 사회 전반의 혁신을 이끄는 핵심 요소로 부각되고 있다. 방대한 데이터를 수집하고 분석함으로써 새로운 인사이트를 도출하고, 이를 바탕으로 사회 전 분야에서 효율적인 의사결정과 새로운 가치 창출이 가능한 것. 이에 KISTI는 데이터를 자동 구축하고, 인공지능 기반의 큐레이션을 제공하는 DiCuON 시스템을 통해 과학기술정보를 더 쉽게 활용할 수 있도록 적극 운영하고 있다. KISTI의 데이터지능화팀을 만나 DiCuON의 운영 현황과 향후 활용 계획에 대한 자세한 이야기를 들어보았다.   Q. 데이터지능화팀은 어떤 팀인가요? 팀의 역할과 업무 등의 소개를 부탁드립니다.   데이터지능화팀은 학술논문, R&D보고서 등 과학기술정보를 중심으로 지능형 데이터 구축, 표준식별자 등록·연계, 인공지능 개발을 통해 과학기술정보가 다양한 수요에 요긴하게 활용될 수 있도록 노력하고 있습니다. 구체적으로 말씀드리자면, 학술논문과 R&D보고서의 메타데이터 구축에 인공지능 기술을 적용하여 구축 생산성을 높이고, 구축한 메타데이터를 기반으로 질의응답 데이터, 문장·문서 분류 데이터 등 지능형 데이터를 구축하고 배포하는 일을 하고 있습니다. 구축한 데이터는 ScienceON, AIDA, NTIS, DataON 등 다양한 채널에서 검색이나 응용 서비스를 통해 제공되며, 이를 통해 산학연 연구자뿐만 아니라 전 국민이 과학기술정보를 좀 더 유익하고 쉽게 다가갈 수 있도록 하는 역할을 맡고 있습니다.   Q. DiCuON은 어떤 시스템인지 소개해주세요.   DiCuON은 ScienceON, NTIS와 같은 과학기술정보 서비스에서 제공되는 학술정보를 생성하는 과학기술정보 큐레이션 시스템으로, 학술정보 구축 프로세스 표준화, 구축 기능 모듈화, 인공지능-인간 협업화를 도입한 지능형 데이터를 구축하고 관리하는 데 도움을 주는 시스템입니다. 데이터 유형에 상관없이 표준화된 데이터 처리 프로세스(수집-가공-저장-배포-활용)로 데이터 관리 효율성을 높이고, 구축에 필요한 기능·기술을 PnP(Plug and Play) 방식으로 모듈화하여 시스템 개발 및 유지보수 효율성을 높입니다. 또한 데이터 구축 프로세스에 휴먼인더루프(Human In The Loop) 체계를 도입하여 인공지능과 구축자가 협업을 통해 인공지능의 성능 개선과 더불어 고품질의 데이터를 자동으로 구축할 수 있습니다. 현재 학술논문, R&D보고서의 메타데이터와 과학기술 기계학습데이터 구축에 활용하고 있습니다.   DiCuON 메인 화면   Q. 어떤 목적으로 본 시스템을 개발하게 되었고, 운영 현황은 어떠한가요?   내 논문 메타데이터 구축 시스템과 공정을 분석한 보고서를 확인한 결과, 수작업에 의존한 데이터 구축 공정과 경직된 구축 프로세스로 인해 많은 인력과 예산이 비효율적으로 사용되고 있음을 확인하였습니다. 이를 개선하기 위해 이용자 친환경 시스템, 유연한 구축 공정, 구축 자동화를 목표로 구축 시스템을 개발함과 동시에 구축 자동화 모델을 개발하여 시스템에 적용하였습니다. 현재는 구축에 불필요한 요소 제거와 자동화율 확대로 구축자의 편의성과 만족도가 향상되었고, 기존의 구축 공정 중 한 가지 기능에 문제가 발생하면 시스템의 모든 기능의 사용을 중지해야 했던 문제를 해결하여 시스템의 유지보수 효율과 안정성이 확대되었습니다.   DiCuON 시스템 흐름도   Q. DiCuON의 주요 특징이나 강점은 무엇인가요?   DiCuON 시스템은 구축에 필요한 다양한 기능과 기술을 PnP 방식으로 결합하여 데이터 구축 공정을 구성할 수 있습니다. 예를 들어, 문서의 이미지와 캡션을 구축하기 위해 문서 뷰어, 이미지 추출 기술, OCR 기술 모듈을 결합하여 공정을 구성할 수 있으며, 성능이 개선된 OCR 기술은 기존 기술을 해제하고 바로 대체할 수 있습니다. 데이터지능화팀에서는 매년 데이터 구축 효율화를 위해 개발된 인공지능 모델을 시스템에 적용하여 데이터 생산성을 높이고 있습니다. 빠르게 발전하는 인공지능 기술을 시스템에 바로 접목할 수 있어 기술 발전에 따른 시스템 최신성과 신뢰성을 쉽게 확보할 수 있는 점이 강점입니다.   Q. 시스템을 개발하면서 어떤 점이 가장 보람차고 즐거우셨나요?   과학기술정보 구축의 효율성을 높이고자 논문과 R&D보고서 메타데이터 구축 공정을 분석하면서 문제점을 파악하고 AI 모델을 개발해 나갔던 매순간들이 기억에 남습니다. 구축자, 구축 관리자와의 지속적인 소통과 구축 환경 분석을 통해 도출한 비효율적인 문제점을 개선할 수 있는 최적의 인공지능 모델을 개발하였으며, 실제 시스템에 적용하여 구축 효율을 높였을 때 가장 보람차고 뿌듯했습니다. 개발한 학술정보 추출 인공지능 모델은 한국정보통신기술협회(TTA)의 확인 및 검증(V&V) 시험에서 평균 99%의 정확성을 달성하여 사람을 대체할 수 있을 정도의 높은 예측 성능이 증명되었으며, 해당 주제로 IT 분야 주요 SCI 저널에 논문 2편을 게재하여 국내외에서 모델 및 기술의 신뢰성을 입증하였습니다.   Q. 본 시스템은 현재 어떻게 활용되고 있나요?   과학기술정보 큐레이션 시스템에 논문 메타데이터 자동 추출 모델, 참고문헌 속성 자동 분리 모델, 표/그림 자동 추출 모델, 개체 자동 식별 모델을 적용하여 매년 국내 학술논문 556종 대상 3만여 건을 구축하는 데 활용되고 있습니다. 위에서 언급한 모델들의 적용을 통해 학술논문을 검색하거나 서비스를 위해 필요한 메타데이터 구축과 참고문헌 구축 작업의 경우 수작업 대비 14.5%의 비용 절감 효과를 얻을 수 있으며, 구축 작업에 소요되는 시간이 연간 약 3,592시간 단축되었습니다. 아울러 논문 메타데이터 외에 질의응답 데이터, 문장 의미 태깅 데이터, 문서 주제 분류 데이터, 전문(FullText) 데이터 등을 자동 구축 모델을 적용하여 효율적으로 구축하고 있습니다.   DiCuON 시스템 활용 예시   Q. DiCuON과 관련해 향후 어떠한 계획을 가지고 계신가요?   과학기술정보를 활용하는 산학연 이용자의 수요와 사회적 이슈에 부합하는 데이터로 세상을 바꾸고자 합니다. 다양한 이용자들의 특성과 과학기술 분야에 대한 관심사를 분석하여 활용 가치가 높은 데이터를 발굴하겠습니다. 또한 교통 문제, 도시 재난, 자연 재해, 감염병 등 사회적 이슈를 해결하기 위한 기반 데이터를 제공하여 과학기술 AI 생태계에 활력을 불어넣겠습니다. 더불어 매년 지속적으로 증가하고 있는 과학기술정보 구축 업무에 신속하고 효율적으로 대응하고, 디지털 전환을 통한 지능형 과학기술정보 큐레이션 체제 구축으로 정보 스펙트럼을 확장하고, 다양한 서비스에 대응할 수 있는 유연한 콘텐츠를 제공하겠습니다.

  • 사회문제 해결을 위한 소리데이터

    ISSUE BRIEF 제66호 <사회문제 해결을 위한 소리데이터> 요약 데이터 산업의 성장과 관련 정책 촉진, 산업 규제 완화, 데이터와 첨단 과학기술의 활용을 통한 사회문제 해결 요구 증대 등으로 인해 데이터 및 AI 관련 분야의 성장이 기대되고 있다. 이와 관련하여 기존의 이미지, 텍스트와 같은 데이터뿐만 아니라, 소리데이터 활용에 대한 관심이 증가하고 있다. KISTI 이슈브리프 제66호는 사회문제 해결을 위한 소리데이터 활용 방안과 KISTI가 수행한 소리데이터 연구를 소개하고, 공공 부문에서의 소리데이터 활용 역할과 소리데이터 생태계 활성화를 위한 방안을 제시한다. 소리데이터를 사회문제 해결에 이용하려면 사회문제 해결을 위해 첨단 과학기술과 데이터를 활용해야 한다는 사회적인 요구가 증가하고 있다. 이러한 요구와 맞물려 소리데이터 분야도 발전할 것으로 예상된다. 소리데이터 활용을 위한 제반 조건이 충족되고 있고 소리데이터를 AI 기술과 접목하여 활용하기 위한 노력과 이에 대한 관심도 커지고 있다. 소리데이터의 수집, 전처리, 분석은 상대적으로 복잡한 컴퓨팅 성능과 전문성을 요구하는데, 컴퓨팅 성능의 향상, AI 기술 발달 등으로 소리를 활용한 AI 솔루션 개발이 가능해졌다. 소리데이터는 다른 유형의 데이터와의 융합을 통해 가치를 확장할 수 있다. 사람은 본래 오감을 통해 획득하는 복합적인 정보를 조합하여 상황을 파악한다. 이처럼 시각 정보가 부족한 경우, 소리데이터를 청각 정보로 활용하여 상황 인지 문제를 해소할 수 있다. 소리데이터는 모니터링, 진단과 같은 상황에서 데이터로 파악하기 어려운 추가적인 정보를 제공해 준다. 소리데이터 확보를 위한 장비 등 데이터 수집 비용이 저렴한 것은 소리데이터 연구 접근성에 유리한 배경이다. 데이터 획득 방법과 목적에 따라 다를 수 있으나, 음파 수신을 위한 마이크로폰 장비는 저렴한 편이다. 소리데이터의 활용을 위해서는 데이터 라이프사이클(Life-Cycle) 측면에서의 접근이 필요하다. KISTI는 소리데이터를 ‘가청 및 비가청 음파를 2진수로 디지털화한 소리’로 정의하고, 사회문제 해결을 위한 소리데이터 활용을 수집-저 장-처리-분석-응용의 5단계로 구성하였다. 공공장소에서의 소리데이터 활용을 예로 들면 다음과 같다. 수집 및 저장 단계에서는 사람들의 음성, 배경 소음 등을 마이크로 수집하여 데이터셋을 구성하고, 대량의 오디오 클립을 압축·저장 후 라벨링하는 일이 수행된다. 처리 단계에서는 잡음 제거, 오디오 품질 개선, 데이터 다양성 증대를 위한 스펙트럼 변형 등의 일이 수행된다. 분석 단계는 의미 있는 요소를 추출하고 선정하는 것이다. 마지막으로 응용 단계는 모델 학습 및 최적화 등에 이어 실제 문제 해결 활동을 포함한다. 다양한 분야에서 활용 가능한 소리데이터 국내에서는 산업, 교통 등 다양한 부문에서 소리데이터가 활용되고 있다. 산업 현장의 설비, 기계의 이상을 진단하기 위한 소리데이터 기술이 개발되고 실제 산업 현장에 적용되고 있다. 또한 교통수단 운행 시 발생하는 소리를 AI로 모니터링, 진단하는 기술이 활용되고 있다. 이외에도 도시 생활 환경을 비롯한 여러 부문에서 소리데이터를 활용한 AI 솔루션 적용 사례를 확인할 수 있다. 해외에서도 선진국을 중심으로 다양하게 소리데이터가 활용되고 있다. 미국과 독일은 차량의 고장, 주행 중인 차량의 이상을 진단하는 등의 AI 장비 또는 솔루션을 개발하였다. 일본에서는 공장 설비 관련 시스템과 축사 환경에 적용되는 소리데이터 활용 AI 시스템을 개발하였다. 이와 같이 국내외에서 소리데이터와 AI를 활용한 사례들이 적지 않게 확인되는데, 아직까지는 소리데이터 기술 및 시장은 초기 단계로 판단된다. 그러나 향후 발전 가능성이 높은 만큼 참여자는 늘어나고 있는 추세다. KISTI는 소리데이터와 AI를 활용하여 산업, 교통, 생활 안전 등의 분야에서 발생하는 사회문제를 해결하고자 관련 연구를 수행하고 있다. 일례로, AI 통합 플랫폼(AI-Hub)에서 제공하는 재난안전 관련 ‘위급상황 음성/음향’과 소음 반영을 위한 ‘도시 소리데이터’를 활용한 연구가 있다. 본 연구로 개발한 AI 모델은 소음 환경에서 위급상황 소리를 구분할 수 있고, 도시 환경 속에서 위급상황을 탐지하는 모니터링 시스템에 적용될 수 있다. 소리데이터는 국민의 안전과 관련해 많은 가치를 가진다. 공공장소에서 발생하는 각종 문제 상황이 발생할 때 시각데이터와 소리데이터의 융합 분석을 통해 상세하게 상황을 확인할 수 있다. 또한 교통 고장 진단에 활용되어 사고 예방, 교통 안전 확보에 기여할 수 있다. 기존에는 인력 위주로 안전 점검, 진단이 이뤄졌다면, 소리데이터 기반 모니터링으로 운행 중인 교통수단과 설비의 이상을 신속하게 감지할 수 있다. 이러한 소리데이터는 대규모로 확보하기가 어렵고, 데이터 의 종류가 파편화되어 있다는 어려움이 있다. 따라서 이와 관련한 데이터 제공 등에서 공공 부문의 역할이 매우 중요할 것이다. 민간의 연구개발 활성화를 위한 소리데이터 규제 샌드박스 활성화 지원도 중요하다. KISTI와 더불어 많은 공공의 기관들이 소리데이터 생태계를 조성해 나가기를 기대한다. ※본 글은 <KISTI 이슈브리프 제66호>의 내용을 요약한 글입니다.