멋진 조약돌을 빚어내는 AI 데이터 전문가, ㈜페블러스
이주행 (주)페블러스 대표
KISTI는 과학기술정보 인프라 혁신을 선도하는 기관으로서, 연구성과를 기업과 공유하며 국가 기술 경쟁력 강화에 기여하고 있다. KISTI의 거대 언어 모델 (Large Language Model, LLM)인 ‘KONI(KISTI-Open Neural Intelligence)’ 기술을 이전받아 과학기술 분야 AI 솔루션 개발에 나선 (주)페블러스의 이주행 대표를 만나, 기술사업화 협력 과정과 미래 비전을 들어보았다.

Q. 자기소개와 함께 페블러스에 대한 소개 부탁드립니다.
저는 한국전자통신연구원(ETRI)에서 약 23년간 연구원으로 근무했습니다. ETRI에서는 주로 로봇 연구를 했고, 학술적인 일을 많이 했습니다. 한국CDE학회(Society for Computational Design and Engineering) 회장도 역임한 바 있습니다. 2015년 무렵부터 AI를 위한 데이터 관련 연구를 시작했는데, 특히 합성 데이터(Synthetic Data) 분야에 집중했습니다. 이후 ETRI에서 만난 이정원 부대표와 함께 2021년 11월 10일에 페블러스를 공동 창업했습니다.
페블러스는 인공지능(AI) 중에서도 데이터를 전문적으로 다루는 회사입니다. AI 시대에는 데이터가 모래알처럼 많다고 이야기하지만, 저희는 창업할 때 모래알 같은 데이터가 아니라 손으로 꼭 잡을 수 있는 단단하고 신뢰할 수 있는 데이터를 고객에게 전달하겠다는 목표를 세웠습니다. 회사 이름 ‘페블러스(Pebblous)’는 모래알처럼 흩어진 데이터가 아니라 손에 잡히는 단단한 조약돌 같은 데이터, 즉 ‘Fabulous+Pebble’을 만들겠다는 뜻을 담고 있습니다.
Q. 페블러스를 대표하는 데이터 클리닉(Data Clinic)은 어떤 기술인가요?
저희는 합성데이터를 ‘데이터 치료제’ 라고 생각합니다. AI 성능을 높이기 위한 치료제인데, 문제는 얼마나 써야 하는지 기준이 없었다는 것입니다. 영양제를 먹을 때에도 하루 복용량이 있듯이, 나에게 맞는 처방이 있으려면 진단이 필요합니다. 데이터도 마찬가지입니다. 그런데 데이터는 그런 처방과 진단 없이 오남용 되는 경향이 있었습니다. 무조건 많이 넣으면 좋겠지 하는 믿음의 영역이었습니다. 이에 데이터에도 일종의 의료체계가 필요하다고 생각했고, 그래서 솔루션 이름을 ‘데이터 클리닉’이라고 지었습니다.
데이터 클리닉은 한마디로 말하면 데이터의 종합병원입니다. 데이터를 엑스레이 찍듯이 분석하고, 부족한 부분은 합성데이터로 보충해주며, 이상치나 규제·저작권 문제 요소를 제거하는 등 데이터의 ‘진단–처방–치료’ 과정을 표준화한 솔루션입니다. 초기의 합성 데이터가 ‘양을 늘리는 방식’이었다면, 지금은 소량의 고품질 데이터가 AI 성능을 좌우하는 시대입니다. 데이터 클리닉은 국제표준에 기반해 데이터 품질을 정밀 진단하고 최적의 보완 전략을 제시합니다.
Q. 이번 기술이전은 연구개발특구 R&BD 사업을 통해 진행되었는데요. KISTI와 기술이전을 결정하게 된 계기가 궁금합니다.
올해 여름쯤 연구개발특구 내 공공 연구기관이 보유한 AI 기술을 기업이 이전받아 사업화해 혁신기업을 육성 하는 ‘글로벌 빅테크 R&BD(Research & Business Development)’ 지원사업이 오픈되었습니다. 저희 투자사인 로우파트너스에서 이 사업을 소개해 주시며 KISTI의 성과확산실과 매칭까지 시켜 주셔서 KISTI와의 인연이 처음 시작됐습니다.
성과확산실에서는 사업화 성공 가능성을 높이기 위해 단순한 기술이전 중개가 아닌 End-to-End 방식(과제 기획부터 선정, 사업화 연계까지 7단계의 전과정을 총괄하여 수행하는 방식)을 채택해 KISTI와 페블러스 간의 공동의 가치가 증진될 수 있도록 추진했습니다.
이후 이경하 초거대 AI연구센터장과 연결되어 KISTI가 자체 개발한 거대 언어 모델(LLM)인 KONI에 대한 정보를 듣게 되었습니다. 이 과정에서 매칭점을 확인하고 빠르게 협업이 이루어졌습니다. 성과확산실 등 KISTI의 관련 부서와 여러 차례 온·오프라인 미팅을 진행하며 기술 활용 방안, 이전 범위 등 프로젝트 내용을 정교하게 조율했습니다. 짧은 사업 기간에도 불구하고 매우 효율 적이고 긴밀하게 협의가 진행됐습니다.
기술이전을 선택한 결정적인 계기는 KONI의 도메인 특화 능력과 저희 회사의 핵심 역량을 결합할 수 있다는 확신 때문이었습니다. 저희는 AI시대에 데이터의 AI 적합성을 평가하고 개선하는 솔루션을 제공하는 것이 핵심입니다. KONI는 KISTI의 방대한 과학기술 데이터를 기반으로 학습되어 과학기술 도메인에 특화된 강점을 가지고 있습니다. 이러한 최고 수준의 과학기술 도메인 LLM과 저희의 데이터 및 LLM 출력 품질 평가 전문성이 결합되면, 연구 시장에 혁신적인 솔루션을 제공할 수 있다고 판단했습니다.
Q. KONI가 가지고 있는 가장 큰 우수성은 무엇이라고 생각하시나요?
KONI는 좋은 데이터를 학습시켜 잘 만들어진 LLM입니다. 특히, KONI의 가장 큰 우수성은 과학기술 도메인에 특화되어 있다는 점입니다. 일반적인 LLM이 일상적이거나 범용적인 지식 생성에 강하다면, KONI는 이공계 학생이나 과학기술 분야 연구자들이 실제 사용하는 수학식 (Mathematical Formula), 코드, 복잡한 표(Table), 그림(Figure)과 같은 비정형 데이터를 처리하고 생성하는 데 강점을 가지고 있습니다. 과학기술에 대해 정말 똑똑하고 정밀한 모델입니다.
페블러스가 구축한 데이터 품질 특화 데이터셋을 결합해 실험해 본 결과, 특정 도메인 질문에서는 ChatGPT보다 더 높은 성능을 보이기도 했습니다. KISTI가 보유한 과학기술 데이터의 양·질·정밀성은 세계적으로도 경쟁력이 있다고 느꼈습니다.
Q. KONI는 어떤 제품군에 적용하실 계획이실까요? 특히, ‘Agentic AI 데이터사이언티스츠(AADS)’ 기술 개발과의 연관성이 궁금합니다.
데이터 클리닉은 이미 아마존 클라우드 컴퓨팅 서비스(AWS)로 운영 중이며, 조달청에도 등록된 제품입니다. 국방 등 보안이 중요한 고객을 위해 온프레미스(On-Premise) 방식으로도 제공하고 있습니다. 고객이 데이터를 올리면 건강검진 보고서처럼 진단보고서를 제공해 드리고 데이터를 개선해 드립니다. 향후 출시되는 데이터 클리닉 2.0에는 AADS 기반 에이전트 기능이 탑재 됩니다. 여기에 KONI의 도메인 특화 능력을 결합함으로써 고객은 대화형으로 데이터 품질을 진단·개선하는 차세대 데이터 솔루션을 경험하게 됩니다. 지금은 사용자가 데이터 클리닉을 직접 매뉴얼을 보고 학습해 사용해야 하지만, 이 과정이 필요 없어집니다. AADS가 적용되면 “우리 데이터 어때?”라고 말만 해도 진단–분석– 개선 절차를 AI가 스스로 설계하고 수행하는 체계가 됩니다. 병원에 상담 선생님이 의사 선생님 진단을 쉽게 풀어 설명해 주는 것처럼 AADS가 그 역할을 하게 되는 것입니다. 현재는 KONI의 생성형 기능을 사용 중이며, 2차년도부터는 KONI의 에이전트 기능과 본격 결합해 업무 자동화 수준을 높일 계획입니다.

Q. KISTI와의 기술이전 협의 과정에서 어려웠던 점이 있다면 무엇이었고, 어떻게 극복하셨는지요?
기술사업화 과정에서 연구원과 기업 간의 관점 차이를 좁히는 것이 가장 어려웠습니다. KISTI와 같은 출연연은 기술의 개발 완성도와 연구의 완결성에 중점을 두는 반면, 페블러스와 같은 스타트업은 기술을 최대한 빠르게 시장에 적용하고 상용화해 고객의 문제를 해결하는 것을 최우선으로 합니다. 이로 인해 기술이전 범위와 상용화 목표 시점을 확정하는 데 이견이 있었습니다.
초기에 이러한 간극이 있었으나, 지속 적으로 대면하며 서로의 환경을 충분히 이해하면서 점차 기준을 맞춰갔습니다. 이 과정을 통해 KISTI의 높은 연구 기준은 오히려 저희에게 큰 학습이 되었고, 저희의 민첩함도 연구원 에서 긍정적으로 받아들여주셨습니다. 그 결과, 상호 목표와 입장을 깊이 이해할 수 있었고, 최종적으로 기술이전 범위를 명확히 확정해 특구 R&BD 사업을 원활하게 추진할 수 있었습니다.
Q. KISTI와 같은 연구기관과의 협업이 갖는 의미는 무엇인지요?
KISTI는 국가 과학기술 데이터를 기반으로 소버린 AI(Sovereign AI) 전략을 추진하고 있습니다. 페블러스는 모델 자체를 만들 수는 없지만, 데이터 품질 분야에서 세계적인 수준의 기술을 보유하고 있습니다. 따라서 KISTI가 구축하는 국가 AI 모델에 페블러스의 기술이 결합하면 양 기관 모두 더 강력한 경쟁력을 갖추게 됩니다. 이것이 출연연과 스타트업 간 협력 모델의 좋은 사례가 될 것이라 생각합니다. 저희가 KONI를 기반으로 성공적인 솔루션을 개발하고 매출을 올린다면, 이는 KISTI의 우수한 기술이 시장에서 상용화되었다는 성공적인 레퍼런스가 됩니다. 이는 KISTI의 기술사업화 성과를 높이는 데 기여할 것입니다.
더 나아가, KISTI가 개발하는 과학기술 도메인 LLM은 저희와 같은 스타트업의 기반 기술이 됩니다. 페블러스는 이 기반 위에 데이터 품질 평가에 특화된 기능을 더하여 소버린 AI 역량을 구축할 것입니다. 국가연구소의 기술을 기반으로 대전에서 출발한 스타트업이 성공적으로 성장하는 것은 국가 연구 성과의 사업화 및 지역 경제 활성화에 좋은 선례가 될 것으로 기대합니다. 이러한 협력 모델이 지속적으로 발전하여 국가 과학기술 경쟁력 강화에 기여하기를 바랍니다.