← 모든 케이스 스터디
대용량 NAS 기반 RAG 챗봇으로 기술이전 업무 고도화

대학교 산학협력단

대용량 NAS 기반 RAG 챗봇으로 기술이전 업무 고도화

85%

자료 탐색 시간 단축

4배

후보 기술 검토 속도 향상

회사 배경

이 기관은 교수 연구성과의 사업화와 기술이전을 지원하는 산학협력단으로, 논문, 특허, 기술소개자료, 연구보고서, 과제 이력, 보유 기술 목록, 이전 실적 자료를 장기간 축적해왔습니다. 기술이전 검토 과정에서는 개별 연구자의 성과를 단건으로 보는 것이 아니라, 관련 특허와 논문, 유사 과제, 이전 이력까지 함께 엮어 맥락을 파악해야 했습니다.

대부분의 핵심 자료는 대용량 NAS에 보관되어 있었고, 실제 업무에서는 기업 문의가 들어오면 짧은 시간 안에 어떤 기술이 연결 가능한지, 어느 연구자가 적합한지, 실용화 단계는 어느 수준인지 빠르게 판단해야 했습니다. 하지만 자료가 풍부할수록 오히려 필요한 문서를 찾는 시간이 길어지는 역설이 발생하고 있었습니다.

문제는 자료의 양이 아니라 활용 방식이었습니다. 파일 수가 많고 형식도 제각각이라 담당자가 폴더 구조와 파일명을 기억해가며 찾아야 했고, 한 건의 기술이전 검토를 위해 여러 문서를 직접 열어보며 비교·요약하는 수작업이 반복되고 있었습니다.

도전 과제

핵심 병목은 문서가 부족하다는 점이 아니라, 원하는 맥락으로 바로 조회하기 어려운 구조에 있었습니다. 기술이전 요청은 단순 키워드 검색이 아니라 '친환경 포장 기술 중 실제 사업화 가능성이 높은 후보', '센서 데이터 분석과 연계할 수 있는 교수 연구', '이전 경험이 있는 유사 기술'처럼 맥락이 강한 질문으로 들어오는 경우가 많았습니다.

하지만 관련 정보는 논문, 특허, 기술소개서, 과제 문서, 이전 실적 자료에 흩어져 있었고 PDF, PPT, HWP, DOCX처럼 형식도 제각각이었습니다. 기존에는 파일명이나 폴더명 중심으로 탐색하다 보니 누락이 잦았고, 실제로는 문서를 여러 개 열어 내용을 읽고 비교해야만 후보를 좁힐 수 있었습니다.

더 큰 문제는 기술이전 담당자의 판단이 단순 검색으로 끝나지 않는다는 점이었습니다. 담당자는 어떤 기술이 기업 수요와 맞는지, 연구자의 이전 가능성이 어느 정도인지, 산업군과 적용 분야가 맞닿아 있는지, 유사한 이전 실적이 있는지를 함께 살펴봐야 했습니다. 즉 '찾기'와 '판단'이 분리되지 않은 업무였기 때문에, 일반적인 문서 검색 도구로는 속도와 일관성을 확보하기 어려웠습니다.

결국 필요한 것은 NAS 안 문서를 검색 가능한 상태로 만드는 것을 넘어, 흩어진 연구성과를 기술이전 의사결정 맥락 안에서 다시 연결해주는 시스템이었습니다.

해결 방식

프로젝트 팀은 NAS에 분산된 대용량 문서를 직접 활용할 수 있는 RAG 기반 지식 탐색 챗봇을 설계했습니다. 목표는 단순히 '문서를 잘 찾는 검색기'가 아니라, 기술이전 담당자가 실제 검토 과정에서 사용하는 질문 흐름을 그대로 지원하는 업무형 시스템을 만드는 것이었습니다.

먼저 문서 수집·정제·색인 파이프라인을 구축해 NAS에 저장된 PDF, PPT, HWP, DOCX를 통합 처리하고, 제목, 저자, 연도, 기술 분야, 문서 유형, 프로젝트 이력, 연구자 정보 같은 메타데이터를 함께 정규화했습니다. 덕분에 자료가 어떤 형식으로 저장돼 있든 동일한 검색 구조 안에서 다룰 수 있게 됐고, 문서 단위뿐 아니라 연구성과 단위로도 묶어볼 수 있는 기반이 마련됐습니다.

문서는 의미 단위로 분할해 임베딩을 생성하고 벡터 검색 인덱스를 구성했습니다. 긴 보고서나 특허 문서 안에서도 핵심 문맥을 회수할 수 있도록 청크 단위를 조정했고, 기술명, 응용 분야, 산업군, 이전 가능성 신호가 질문과 함께 잘 매칭되도록 색인 전략을 설계했습니다.

검색 단계에서는 키워드 유사도만으로 끝내지 않았습니다. 질문 유형에 따라 기술 키워드, 응용 분야, 산업군, 실용화 단계, 기존 이전 실적 관점을 함께 반영해 초기 후보를 찾도록 했고, 특정 기업이나 산업이 주어질 경우 그 맥락에 맞는 문서와 기술을 우선적으로 끌어오도록 구성했습니다.

이후 Reranker를 적용해 초기 후보를 다시 정렬하고, LLM이 근거 문서를 바탕으로 답변을 생성하도록 설계했습니다. 답변에는 단순 요약만이 아니라 어떤 논문·특허·기술소개서가 근거가 되었는지 함께 제시해, 담당자가 추천 결과를 빠르게 검토하고 신뢰할 수 있도록 했습니다.

추가로 Recommendation Layer를 통해 기업 업종, 관심 분야, 보유 역량, 사업 방향을 입력하면 관련 후보 기술, 연구자, 논문, 특허를 묶어서 제안하도록 만들었습니다. 이 덕분에 담당자는 자료를 하나씩 찾는 데 시간을 쓰기보다, 왜 이 기술이 해당 기업과 맞는지 판단하고 후속 커뮤니케이션을 준비하는 데 더 집중할 수 있게 됐습니다.

기술 구성

  • RAG 아키텍처

    NAS 기반 대용량 문서에서 질문과 관련된 근거 문서를 검색하고, 이를 바탕으로 설명 가능한 답변을 생성하는 핵심 구성입니다.

  • 문서 수집·전처리 파이프라인

    PDF, PPT, HWP, DOCX 텍스트를 안정적으로 추출하고 문서 유형, 연구자, 기술 분야 같은 메타데이터를 정제해 검색 품질을 높였습니다.

  • Embedding + Vector Search

    문서 형식과 표현 차이를 완화하고 의미 기반으로 관련 자료를 회수하기 위해 임베딩 인덱싱과 벡터 검색을 적용했습니다.

  • Reranking

    초기 검색 후보를 질문 맥락, 산업군, 기술이전 목적에 맞게 재정렬해 상단 결과의 적합도를 높였습니다.

  • Metadata / Recommendation Layer

    연구자, 기술 분야, 산업군, 이전 이력 정보를 결합해 기업 맞춤 후보 기술과 연구성과를 함께 추천하는 계층을 구성했습니다.

  • Grounded Answering

    응답에 참고 문서와 근거 맥락을 함께 제시해, 담당자가 추천 결과를 빠르게 검토하고 후속 판단에 활용할 수 있도록 했습니다.

문서가 많다는 것은 자산이 많다는 뜻이기도 하지만, 동시에 찾기 어렵다는 뜻이기도 합니다. 이 프로젝트의 핵심은 NAS 안에 쌓인 연구성과를 단순 보관 자료가 아니라, 질문과 기업 수요에 맞춰 바로 활용할 수 있는 기술이전 지식 체계로 바꾸는 것이었습니다.

빅시프트 프로젝트팀 · 산학협력단 RAG 프로젝트 리드

RAG 챗봇 도입으로 산학협력단은 NAS에 잠겨 있던 연구성과를 단순 보관 자산이 아니라, 기술이전 검토와 기업 매칭 판단에 직접 활용하는 운영 자산으로 전환했습니다.

1

업무 효율화

기존 대비 자료 탐색 시간이 약 85% 단축됐고, 담당자가 여러 문서를 수작업으로 열어보며 맥락을 맞추는 시간이 크게 줄었습니다. 기업 문의가 들어왔을 때 초기 검토와 후보 정리가 훨씬 빠르게 이뤄지면서 응답 리드타임도 함께 개선됐습니다.

2

후보 기술 검토 속도 향상

기업 요청별로 연계 가능한 기술, 논문, 특허 후보를 빠르게 추려낼 수 있어 검토 속도가 약 4배 빨라졌습니다. 단순 문서 검색을 넘어 후보군이 먼저 구조화되면서 담당자의 판단 효율도 함께 높아졌습니다.

3

탐색 품질 개선

의미 기반 탐색과 근거 제시 덕분에 파일명 기반 검색으로는 놓치기 쉬웠던 연관 논문, 특허, 과제 자료, 유사 이전 사례를 함께 발견할 수 있게 됐습니다. 그 결과 단순 검색 정확도뿐 아니라 후보 발굴의 폭도 넓어졌습니다.

4

기술이전 지원 기반 확보

연구성과를 단순 보관 자산에서 질의응답, 추천, 기업 매칭 지원까지 가능한 지식 자산으로 전환해 향후 자동화된 매칭 추천과 기술 포트폴리오 관리로 확장할 수 있는 기반을 마련했습니다.

비슷한 AI 프로젝트를 준비 중이신가요?

기획 단계부터 데이터 구조, 모델 선택, 제품화 범위까지 함께 설계합니다.

다른 사례

유사한 문제를 다른 방식으로 해결한 프로젝트도 함께 보실 수 있습니다.