콘텐츠로 이동

국회기록원 현황 분석

국회기록원(archives.nanet.go.kr)의 현행 시스템 분석을 통해 AI 기반 아카이브 플랫폼의 개선 방향을 도출합니다.


구분건수비율
총 기록물1,050,156건100%
원문 온라인 제공494,233건56.9%
원문 미제공374,026건43.1%
유형건수비율특징
일반문서1,046,574건99.6%법률안, 보고서, 회의록 등
카드류3,454건0.3%인사카드, 색인카드 등
도면류111건0.01%건축도면, 설계도 등
사진/필름17건0.001%역사적 사진 자료

일반문서가 99.6%를 차지하여, 텍스트 기반 AI 처리에 최적화된 환경

생산기관건수비율
국회사무처893,387건85.1%
국회도서관68,183건6.5%
국회입법조사처6,264건0.6%
국회예산정책처3,581건0.3%
기타78,741건7.5%
연대건수비율비고
2011~2020년482,972건46.0%최다
2001~2010년289,965건27.6%
1991~2000년145,000건13.8%추정
1990년 이전132,219건12.6%임시의정원 포함

콘텐츠설명AI 활용 가능성
구술기록전직 국회의원, 직원 구술 채록STT 변환, 화자 식별, 주제 분류
임시의정원 기록1919~1945년 대한민국 임시정부 의정원역사적 맥락 연결, OCR 고도화
제헌의회 기록1948년 제헌국회 관련 기록헌법 제정 과정 분석
국회의원 명부역대 국회의원 인적 정보지식 그래프 노드 기초 데이터
  • 역대 국회의장 기록
  • 헌정 70주년 기념 특별전
  • 의정 사진 아카이브

시스템URL연계 데이터
열린국회정보open.assembly.go.kr의안, 회의록, 의원 정보
의안정보시스템likms.assembly.go.kr의안 상세, 심사 경과
국회회의록likms.assembly.go.kr/record본회의, 위원회 회의록
국회도서관nanet.go.kr입법자료, 학술DB
시스템연계 내용
국가기록원행정부 기록과의 연계
법제처 국가법령정보센터현행 법령 정보
헌법재판소헌법재판 결정문

한계상세개선 방향
키워드 검색만 지원정확한 용어를 알아야 검색 가능의미 기반 검색(Semantic Search)
맥락 파악 어려움개별 기록물 간 연결 부재지식 그래프 기반 연결
전문가용 인터페이스일반 국민 접근성 낮음자연어 질의응답
한계상세개선 방향
원문 미제공 43%디지털화 미완료 또는 비공개AI OCR, 자동 분류
메타데이터 불완전수동 입력으로 인한 누락/오류AI 기반 자동 추출
시스템 분산기록원, 회의록, 의안 등 분리통합 검색 플랫폼
한계상세개선 방향
단순 열람 중심분석, 비교 기능 부재AI 요약, 비교 분석
API 미제공외부 활용 불가Open API 제공
개인화 불가관심 분야 추적 기능 없음AI 추천 시스템

기능기술기대 효과
의미 기반 검색벡터 DB + RAG검색 정확도 향상
자동 요약LLM대량 문서 신속 파악
메타데이터 자동 추출NER데이터 품질 향상
기능기술기대 효과
지식 그래프 구축Neo4j + Entity Linking맥락 기반 탐색
법안 영향 분석관계 추론입법 예측
다국어 서비스번역 LLM글로벌 접근성
기능기술기대 효과
입법 AI 어시스턴트Agent + RAG입법 지원 고도화
열린 생태계Open API + SDK민간 혁신 촉진
디지털 헌정사시각화 + 스토리텔링민주주의 교육

  • 99.6%가 텍스트 기반 일반문서 → AI 처리 적합
  • 100만 건 이상의 대규모 데이터셋
  • 구조화된 메타데이터 체계 존재
  • 공신력 있는 공공 데이터
  • 원문 미제공 비율 43%
  • 연계 시스템 간 데이터 불일치 가능성
  • 과거 기록물 OCR 품질 이슈
  • 실시간 업데이트 지연
  • AI 기술 성숙으로 자동화 가능 영역 확대
  • 디지털 전환 정책 기조와 부합
  • 국민 알권리 강화 요구 증가
  • 개인정보 보호 규제 강화
  • AI 환각(Hallucination) 리스크
  • 예산 및 인력 제약