국회기록원(archives.nanet.go.kr)의 현행 시스템 분석을 통해 AI 기반 아카이브 플랫폼의 개선 방향을 도출합니다.
| 구분 | 건수 | 비율 |
|---|
| 총 기록물 | 1,050,156건 | 100% |
| 원문 온라인 제공 | 494,233건 | 56.9% |
| 원문 미제공 | 374,026건 | 43.1% |
| 유형 | 건수 | 비율 | 특징 |
|---|
| 일반문서 | 1,046,574건 | 99.6% | 법률안, 보고서, 회의록 등 |
| 카드류 | 3,454건 | 0.3% | 인사카드, 색인카드 등 |
| 도면류 | 111건 | 0.01% | 건축도면, 설계도 등 |
| 사진/필름 | 17건 | 0.001% | 역사적 사진 자료 |
일반문서가 99.6%를 차지하여, 텍스트 기반 AI 처리에 최적화된 환경
| 생산기관 | 건수 | 비율 |
|---|
| 국회사무처 | 893,387건 | 85.1% |
| 국회도서관 | 68,183건 | 6.5% |
| 국회입법조사처 | 6,264건 | 0.6% |
| 국회예산정책처 | 3,581건 | 0.3% |
| 기타 | 78,741건 | 7.5% |
| 연대 | 건수 | 비율 | 비고 |
|---|
| 2011~2020년 | 482,972건 | 46.0% | 최다 |
| 2001~2010년 | 289,965건 | 27.6% | |
| 1991~2000년 | 145,000건 | 13.8% | 추정 |
| 1990년 이전 | 132,219건 | 12.6% | 임시의정원 포함 |
| 콘텐츠 | 설명 | AI 활용 가능성 |
|---|
| 구술기록 | 전직 국회의원, 직원 구술 채록 | STT 변환, 화자 식별, 주제 분류 |
| 임시의정원 기록 | 1919~1945년 대한민국 임시정부 의정원 | 역사적 맥락 연결, OCR 고도화 |
| 제헌의회 기록 | 1948년 제헌국회 관련 기록 | 헌법 제정 과정 분석 |
| 국회의원 명부 | 역대 국회의원 인적 정보 | 지식 그래프 노드 기초 데이터 |
- 역대 국회의장 기록
- 헌정 70주년 기념 특별전
- 의정 사진 아카이브
| 시스템 | URL | 연계 데이터 |
|---|
| 열린국회정보 | open.assembly.go.kr | 의안, 회의록, 의원 정보 |
| 의안정보시스템 | likms.assembly.go.kr | 의안 상세, 심사 경과 |
| 국회회의록 | likms.assembly.go.kr/record | 본회의, 위원회 회의록 |
| 국회도서관 | nanet.go.kr | 입법자료, 학술DB |
| 시스템 | 연계 내용 |
|---|
| 국가기록원 | 행정부 기록과의 연계 |
| 법제처 국가법령정보센터 | 현행 법령 정보 |
| 헌법재판소 | 헌법재판 결정문 |
| 한계 | 상세 | 개선 방향 |
|---|
| 키워드 검색만 지원 | 정확한 용어를 알아야 검색 가능 | 의미 기반 검색(Semantic Search) |
| 맥락 파악 어려움 | 개별 기록물 간 연결 부재 | 지식 그래프 기반 연결 |
| 전문가용 인터페이스 | 일반 국민 접근성 낮음 | 자연어 질의응답 |
| 한계 | 상세 | 개선 방향 |
|---|
| 원문 미제공 43% | 디지털화 미완료 또는 비공개 | AI OCR, 자동 분류 |
| 메타데이터 불완전 | 수동 입력으로 인한 누락/오류 | AI 기반 자동 추출 |
| 시스템 분산 | 기록원, 회의록, 의안 등 분리 | 통합 검색 플랫폼 |
| 한계 | 상세 | 개선 방향 |
|---|
| 단순 열람 중심 | 분석, 비교 기능 부재 | AI 요약, 비교 분석 |
| API 미제공 | 외부 활용 불가 | Open API 제공 |
| 개인화 불가 | 관심 분야 추적 기능 없음 | AI 추천 시스템 |
| 기능 | 기술 | 기대 효과 |
|---|
| 의미 기반 검색 | 벡터 DB + RAG | 검색 정확도 향상 |
| 자동 요약 | LLM | 대량 문서 신속 파악 |
| 메타데이터 자동 추출 | NER | 데이터 품질 향상 |
| 기능 | 기술 | 기대 효과 |
|---|
| 지식 그래프 구축 | Neo4j + Entity Linking | 맥락 기반 탐색 |
| 법안 영향 분석 | 관계 추론 | 입법 예측 |
| 다국어 서비스 | 번역 LLM | 글로벌 접근성 |
| 기능 | 기술 | 기대 효과 |
|---|
| 입법 AI 어시스턴트 | Agent + RAG | 입법 지원 고도화 |
| 열린 생태계 | Open API + SDK | 민간 혁신 촉진 |
| 디지털 헌정사 | 시각화 + 스토리텔링 | 민주주의 교육 |
- 99.6%가 텍스트 기반 일반문서 → AI 처리 적합
- 100만 건 이상의 대규모 데이터셋
- 구조화된 메타데이터 체계 존재
- 공신력 있는 공공 데이터
- 원문 미제공 비율 43%
- 연계 시스템 간 데이터 불일치 가능성
- 과거 기록물 OCR 품질 이슈
- 실시간 업데이트 지연
- AI 기술 성숙으로 자동화 가능 영역 확대
- 디지털 전환 정책 기조와 부합
- 국민 알권리 강화 요구 증가
- 개인정보 보호 규제 강화
- AI 환각(Hallucination) 리스크
- 예산 및 인력 제약