AI 기반 국회기록원 아카이브 모형
연구 목적
섹션 제목: “연구 목적”국회기록원 디지털 아카이브에 AI를 통합하여, 다양한 국회기록의 수집·보존·활용을 혁신한다.
이 연구는 단순한 시스템 구축 계획이 아니라, AI 기술이 아카이브의 모든 기능에 어떻게 통합될 수 있는지를 탐구하는 모형 설계 연구이다.
핵심 원칙
섹션 제목: “핵심 원칙”1. AI 통합이 최우선이다
섹션 제목: “1. AI 통합이 최우선이다”AI는 보조 도구가 아니다. 아카이브 설계의 중심축이다.
| 전통적 접근 | AI 통합 접근 |
|---|---|
| 시스템 구축 후 AI 기능 추가 | AI를 중심으로 시스템 설계 |
| 메타데이터 수작업 입력 | AI 자동 추출 및 생성 |
| 키워드 기반 검색 | 의미 기반 검색 + 대화형 QA |
| 정적 기록 보존 | 동적 지식 연결 |
2. 국회기록원의 본질에 충실하다
섹션 제목: “2. 국회기록원의 본질에 충실하다”국회기록원은 입법부의 기록을 체계적으로 보존하고 활용하는 기관이다.
- 회의록, 법안, 의정활동 등 다양한 국회기록을 다룬다
- 입법 과정의 맥락과 관계를 보존한다
- 국민의 알 권리와 민주주의 기록화에 기여한다
4단계 발전 프레임워크
섹션 제목: “4단계 발전 프레임워크”국회기록 아카이브는 수집 → 연결 → 서비스 → 확장의 4단계로 발전하며, 각 단계는 AI 통합 계층에 의해 유기적으로 연결되고 지능화됩니다.
%%{init: {'theme': 'base', 'themeVariables': { 'fontSize': '14px' }}}%%
flowchart LR
C1["**1. 수집**<br/>Collection<br/>───<br/>기록의<br/>디지털 자산화"]
C2["**2. 연결**<br/>Connection<br/>───<br/>데이터의<br/>맥락 복원"]
C3["**3. 서비스**<br/>Service<br/>───<br/>국민 체감형<br/>스토리텔링"]
C4["**4. 확장**<br/>Expansion<br/>───<br/>열린<br/>생태계"]
C1 --> C2 --> C3 --> C4
C1 -.-> AI
C2 -.-> AI
C3 -.-> AI
C4 -.-> AI
AI["**AI 통합 계층**<br/>자동수집 · 메타추출 · 지식그래프 · 관계추론 · 검색QA · 요약 · API"]
style C1 fill:#fff,stroke:#333,stroke-width:1px
style C2 fill:#fff,stroke:#333,stroke-width:1px
style C3 fill:#fff,stroke:#333,stroke-width:1px
style C4 fill:#fff,stroke:#333,stroke-width:1px
style AI fill:#f5f5f5,stroke:#666,stroke-width:2px
1단계: 수집 (Collection)
섹션 제목: “1단계: 수집 (Collection)”“기록의 디지털 자산화” — 의원실의 업무 부담 없는 자동(Automatic) 수집
의원실이 별도의 작업 없이도 기록이 자연스럽게 아카이브로 흘러들어오는 체계
AI 핵심 역할
섹션 제목: “AI 핵심 역할”| 기능 | AI 활용 | 효과 |
|---|---|---|
| 자동 수집 에이전트 | 파일 변경 감지, 자동 동기화 | 의원실 업무 부담 제로 |
| 메타데이터 자동 추출 | NLP/OCR로 작성자, 법안, 키워드 자동 태깅 | 수작업 90% 절감 |
| 멀티미디어 처리 | STT(음성→텍스트), 영상 분석 | 비정형 데이터 아카이빙 |
| 품질 검증 | 누락/오류 자동 탐지 | 데이터 완전성 확보 |
주요 과제
섹션 제목: “주요 과제”%%{init: {'theme': 'base', 'themeVariables': { 'fontSize': '14px' }}}%%
flowchart LR
subgraph input["의원실"]
A1["PC/클라우드<br/>Google Drive<br/>Naver Works"]
A2["이메일/SNS<br/>메신저 기록"]
A3["회의 음성<br/>영상 자료"]
end
subgraph process["AI 처리"]
B1["① 파일 감지 & 수집"]
B2["② 메타데이터 추출<br/>(NER/OCR)"]
B3["③ 자동 분류 & 태깅"]
B4["④ 품질 검증"]
B1 --> B2 --> B3 --> B4
end
DB[("아카이브<br/>저장소")]
A1 -->|자동 동기화| B1
A2 -->|비정형 데이터| B1
A3 -->|STT 변환| B1
B4 --> DB
style input fill:#fff,stroke:#333,stroke-width:1px
style process fill:#f5f5f5,stroke:#666,stroke-width:1px
style DB fill:#fff,stroke:#333,stroke-width:1px
2단계: 연결 (Connection)
섹션 제목: “2단계: 연결 (Connection)”“데이터의 맥락(Context) 복원” — 산재된 문서를 연결하여 입법 과정의 전모 파악
개별 기록이 아닌, 입법 과정 전체의 맥락을 이해할 수 있는 지식 체계 구축
AI 핵심 역할
섹션 제목: “AI 핵심 역할”| 기능 | AI 활용 | 효과 |
|---|---|---|
| 지식 그래프 자동 구축 | 관계 추론, 엔티티 연결 | 의원-법안-위원회 관계망 |
| 데이터 정제 | 동명이인 식별, 법안명 표준화 | 데이터 품질 향상 |
| 맥락 추론 | 관련 이슈, 배경 자동 연결 | 숨은 관계 발견 |
| 시계열 분석 | 법안 변천사, 정책 흐름 | 역사적 맥락 파악 |
지식 그래프 구조
섹션 제목: “지식 그래프 구조”%%{init: {'theme': 'base', 'themeVariables': { 'fontSize': '14px' }}}%%
flowchart TB
법안["법안"]
의원["의원"]
정당["정당"]
위원회["위원회"]
회의["회의"]
의원 -->|발의| 법안
법안 -->|심사| 위원회
의원 -->|소속| 정당
위원회 -->|개최| 회의
의원 -->|발언| 회의
style 법안 fill:#fff,stroke:#333,stroke-width:1px
style 의원 fill:#fff,stroke:#333,stroke-width:1px
style 정당 fill:#fff,stroke:#333,stroke-width:1px
style 위원회 fill:#fff,stroke:#333,stroke-width:1px
style 회의 fill:#fff,stroke:#333,stroke-width:1px
AI가 자동으로:
- 의원 A가 법안 X를 발의 → 위원회 B에서 심사 → 회의 C에서 논의
- 법안 X와 법안 Y의 유사성 발견 → 관련 법안으로 연결
- 의원 A의 발언에서 언급된 정책 → 해당 정책 관련 기록 연결
입법 온톨로지 (Ontology)
섹션 제목: “입법 온톨로지 (Ontology)”%%{init: {'theme': 'base', 'themeVariables': { 'fontSize': '14px' }}}%%
flowchart LR
subgraph process["의정활동 프로세스"]
P1["발의"] --> P2["상정"] --> P3["심사"] --> P4["의결"] --> P5["공포"]
end
subgraph docs["산출 문서"]
D1["발의문<br/>제안이유"]
D2["상정안<br/>회부문서"]
D3["심사보고<br/>수정안"]
D4["의결문<br/>표결결과"]
D5["관보<br/>시행령"]
end
P1 -.-> D1
P2 -.-> D2
P3 -.-> D3
P4 -.-> D4
P5 -.-> D5
style process fill:#fff,stroke:#333,stroke-width:1px
style docs fill:#f5f5f5,stroke:#666,stroke-width:1px
3단계: 서비스 (Service)
섹션 제목: “3단계: 서비스 (Service)”“국민 체감형 스토리텔링” — 일반 국민이 쉽게 이해하고 탐험할 수 있는 서비스
복잡한 입법 과정을 누구나 이해할 수 있도록 시각화하고, AI가 맞춤형 정보 제공
AI 핵심 역할
섹션 제목: “AI 핵심 역할”| 기능 | AI 활용 | 효과 |
|---|---|---|
| 의미 기반 검색 | 벡터 검색, 하이브리드 검색 | 자연어로 원하는 정보 발견 |
| 대화형 QA | RAG 기반 질의응답 | ”우리 지역구 의원 법안은?“ |
| 3줄 요약 봇 | LLM 기반 요약 | 복잡한 법안을 쉽게 이해 |
| 맞춤 추천 | 관심사 기반 추천 | 개인화된 정보 제공 |
서비스 UI 구상
섹션 제목: “서비스 UI 구상”%%{init: {'theme': 'base', 'themeVariables': { 'fontSize': '14px' }}}%%
flowchart TB
subgraph ui["국민 서비스 인터페이스"]
direction TB
subgraph search["검색"]
Q["🔍 무엇이든 물어보세요<br/>예: 기후변화 관련 법안 심사 과정이 궁금해요"]
end
subgraph timeline["📊 법안 타임라인 뷰어"]
T1["2023.01<br/>발의<br/>[문서]"] --> T2["2023.06<br/>상정<br/>[회의록]"] --> T3["2023.12<br/>심사<br/>[수정안]"] --> T4["2024.03<br/>의결<br/>[결과]"]
end
subgraph bottom["AI 기능"]
direction LR
summary["🤖 AI 3줄 요약<br/>───<br/>1. 탄소중립 목표<br/>2. 기업 의무 부과<br/>3. 2050년 시행"]
qa["💬 AI Q&A<br/>───<br/>Q: 주요 쟁점은?<br/>A: 감축 목표율 논쟁<br/>[출처: 환노위 회의록]"]
end
end
style ui fill:#fff,stroke:#333,stroke-width:1px
style search fill:#fff,stroke:#333,stroke-width:1px
style timeline fill:#fff,stroke:#333,stroke-width:1px
style bottom fill:#f5f5f5,stroke:#666,stroke-width:1px
AI Q&A 예시
섹션 제목: “AI Q&A 예시”| 질문 | AI 답변 |
|---|---|
| ”우리 지역구 의원이 발의한 법안은?” | [지역구 기반 의원 식별 → 발의 법안 검색 → 목록 제공] |
| “반도체 특별법 쟁점이 뭐야?” | [관련 회의록 검색 → 찬반 발언 추출 → 요약] |
| “이 법안 비슷한 거 또 있어?” | [벡터 유사도 검색 → 유사 법안 추천] |
4단계: 확장 (Expansion)
섹션 제목: “4단계: 확장 (Expansion)”“열린 생태계와 참여” — 국민의 참여로 완성되는 리빙 아카이브
국회 기록이 외부와 연결되고, 국민이 함께 만들어가는 살아있는 아카이브
AI 핵심 역할
섹션 제목: “AI 핵심 역할”| 기능 | AI 활용 | 효과 |
|---|---|---|
| Open API | AI 기능 API 제공 | 민간 서비스 연동 |
| 소셜 아카이빙 | SNS 데이터 분석, 여론 연결 | 사회적 맥락 보강 |
| 기증 자료 처리 | 자동 분류, 메타데이터 생성 | 국민 참여 아카이브 |
| 품질 관리 | 기증 자료 검증, 중복 탐지 | 아카이브 무결성 유지 |
Open API 구조
섹션 제목: “Open API 구조”%%{init: {'theme': 'base', 'themeVariables': { 'fontSize': '14px' }}}%%
flowchart TB
subgraph api["국회기록 Open API"]
A1["/api/v1/search - 의미 기반 검색"]
A2["/api/v1/qa - AI 질의응답"]
A3["/api/v1/summarize - 문서 요약"]
A4["/api/v1/graph - 지식 그래프 탐색"]
A5["/api/v1/records - 원문 데이터 조회"]
end
U1["연구자<br/>분석툴"]
U2["시빅해커"]
U3["언론사<br/>서비스"]
api --> U1
api --> U2
api --> U3
style api fill:#f5f5f5,stroke:#666,stroke-width:1px
style U1 fill:#fff,stroke:#333,stroke-width:1px
style U2 fill:#fff,stroke:#333,stroke-width:1px
style U3 fill:#fff,stroke:#333,stroke-width:1px
리빙 아카이브 (Living Archive)
섹션 제목: “리빙 아카이브 (Living Archive)”%%{init: {'theme': 'base', 'themeVariables': { 'fontSize': '14px' }}}%%
flowchart TB
subgraph official["공식 기록"]
O1["회의록"]
O2["법안"]
O3["의정활동"]
end
subgraph citizen["국민 참여"]
C1["사진 기증"]
C2["영상 기증"]
C3["증언 기록"]
end
subgraph ai["AI 큐레이션"]
AI1["• 자동 분류"]
AI2["• 맥락 연결"]
AI3["• 품질 검증"]
end
exhibit["통합 전시<br/>예: 1987년 국회 특집"]
official <-->|AI 연결| citizen
official --> ai
citizen --> ai
ai --> exhibit
style official fill:#fff,stroke:#333,stroke-width:1px
style citizen fill:#fff,stroke:#333,stroke-width:1px
style ai fill:#f5f5f5,stroke:#666,stroke-width:1px
style exhibit fill:#fff,stroke:#333,stroke-width:1px
4단계 × AI 통합 요약
섹션 제목: “4단계 × AI 통합 요약”| 단계 | 목표 | AI 핵심 기능 | 핵심 가치 |
|---|---|---|---|
| 1. 수집 | 자동 수집 | 자동 수집, 메타추출, STT | 의원실 부담 제로 |
| 2. 연결 | 맥락 복원 | 지식 그래프, 관계 추론 | 입법 과정 전모 파악 |
| 3. 서비스 | 국민 체감 | 검색 QA, 요약, 시각화 | 누구나 쉽게 이해 |
| 4. 확장 | 열린 생태계 | Open API, 소셜 아카이빙 | 국민 참여 아카이브 |
5대 국회기록 유형
섹션 제목: “5대 국회기록 유형”4단계 프레임워크가 다루는 기록 유형:
| 유형 | 내용 | AI 적용 예시 |
|---|---|---|
| 회의록/속기록 | 본회의, 위원회 회의 기록 | 화자 분리, 요약, 쟁점 추출 |
| 법안/의안 | 발의 법안, 심사 과정 | 유사 법안 탐지, 조문 비교 |
| 의정활동 기록 | 의원 활동, 질의/답변 | 활동 패턴 분석, 관계 연결 |
| 국정감사 기록 | 감사 자료, 시정 요구 | QA 추출, 이행 추적 |
| 행정기록 | 국회 운영 문서 | 문서 분류, 개인정보 탐지 |
각 단계별 상세 내용은 아래 문서 구조를 참조한다.
문서 구조
섹션 제목: “문서 구조”| 장 | 제목 | 내용 |
|---|---|---|
| 1 | 수집 (Collection) | 자동 수집, 7대 참여자 역할, 5대 기록 유형별 수집 전략, AI 자동화 |
| 2 | 연결 (Connection) | 지식 그래프, 맥락 복원, 관계 추론, 입법 온톨로지 |
| 3 | 서비스 (Service) | 국민 체감형 서비스, 의미 검색, RAG QA, 자동 요약 |
| 4 | 확장 (Expansion) | Open API, 리빙 아카이브, 국민 참여, 거버넌스 |
| - | 부록 | 기술 스택, 용어집, OAIS 참조 모형 |
핵심 메시지
섹션 제목: “핵심 메시지”“수집 → 연결 → 서비스 → 확장, 모든 단계에서 AI가 핵심이다.”
국회기록원 디지털 아카이브는 4단계 발전 프레임워크를 따르되, 각 단계에서 AI가 중심 역할을 수행함으로써 국민 누구나 입법 과정을 이해하고 참여할 수 있는 민주주의의 기록이 된다.