콘텐츠로 이동

AI 기반 국회기록원 아카이브 모형

국회기록원 디지털 아카이브에 AI를 통합하여, 다양한 국회기록의 수집·보존·활용을 혁신한다.

이 연구는 단순한 시스템 구축 계획이 아니라, AI 기술이 아카이브의 모든 기능에 어떻게 통합될 수 있는지를 탐구하는 모형 설계 연구이다.


AI는 보조 도구가 아니다. 아카이브 설계의 중심축이다.

전통적 접근AI 통합 접근
시스템 구축 후 AI 기능 추가AI를 중심으로 시스템 설계
메타데이터 수작업 입력AI 자동 추출 및 생성
키워드 기반 검색의미 기반 검색 + 대화형 QA
정적 기록 보존동적 지식 연결

2. 국회기록원의 본질에 충실하다

섹션 제목: “2. 국회기록원의 본질에 충실하다”

국회기록원은 입법부의 기록을 체계적으로 보존하고 활용하는 기관이다.

  • 회의록, 법안, 의정활동 등 다양한 국회기록을 다룬다
  • 입법 과정의 맥락과 관계를 보존한다
  • 국민의 알 권리민주주의 기록화에 기여한다

국회기록 아카이브는 수집 → 연결 → 서비스 → 확장의 4단계로 발전하며, 각 단계는 AI 통합 계층에 의해 유기적으로 연결되고 지능화됩니다.

%%{init: {'theme': 'base', 'themeVariables': { 'fontSize': '14px' }}}%%
flowchart LR
    C1["**1. 수집**<br/>Collection<br/>───<br/>기록의<br/>디지털 자산화"]
    C2["**2. 연결**<br/>Connection<br/>───<br/>데이터의<br/>맥락 복원"]
    C3["**3. 서비스**<br/>Service<br/>───<br/>국민 체감형<br/>스토리텔링"]
    C4["**4. 확장**<br/>Expansion<br/>───<br/>열린<br/>생태계"]
    
    C1 --> C2 --> C3 --> C4
    
    C1 -.-> AI
    C2 -.-> AI
    C3 -.-> AI
    C4 -.-> AI
    
    AI["**AI 통합 계층**<br/>자동수집 · 메타추출 · 지식그래프 · 관계추론 · 검색QA · 요약 · API"]
    
    style C1 fill:#fff,stroke:#333,stroke-width:1px
    style C2 fill:#fff,stroke:#333,stroke-width:1px
    style C3 fill:#fff,stroke:#333,stroke-width:1px
    style C4 fill:#fff,stroke:#333,stroke-width:1px
    style AI fill:#f5f5f5,stroke:#666,stroke-width:2px

“기록의 디지털 자산화” — 의원실의 업무 부담 없는 자동(Automatic) 수집

의원실이 별도의 작업 없이도 기록이 자연스럽게 아카이브로 흘러들어오는 체계

기능AI 활용효과
자동 수집 에이전트파일 변경 감지, 자동 동기화의원실 업무 부담 제로
메타데이터 자동 추출NLP/OCR로 작성자, 법안, 키워드 자동 태깅수작업 90% 절감
멀티미디어 처리STT(음성→텍스트), 영상 분석비정형 데이터 아카이빙
품질 검증누락/오류 자동 탐지데이터 완전성 확보
%%{init: {'theme': 'base', 'themeVariables': { 'fontSize': '14px' }}}%%
flowchart LR
    subgraph input["의원실"]
        A1["PC/클라우드<br/>Google Drive<br/>Naver Works"]
        A2["이메일/SNS<br/>메신저 기록"]
        A3["회의 음성<br/>영상 자료"]
    end
    
    subgraph process["AI 처리"]
        B1["① 파일 감지 & 수집"]
        B2["② 메타데이터 추출<br/>(NER/OCR)"]
        B3["③ 자동 분류 & 태깅"]
        B4["④ 품질 검증"]
        B1 --> B2 --> B3 --> B4
    end
    
    DB[("아카이브<br/>저장소")]
    
    A1 -->|자동 동기화| B1
    A2 -->|비정형 데이터| B1
    A3 -->|STT 변환| B1
    B4 --> DB
    
    style input fill:#fff,stroke:#333,stroke-width:1px
    style process fill:#f5f5f5,stroke:#666,stroke-width:1px
    style DB fill:#fff,stroke:#333,stroke-width:1px

“데이터의 맥락(Context) 복원” — 산재된 문서를 연결하여 입법 과정의 전모 파악

개별 기록이 아닌, 입법 과정 전체의 맥락을 이해할 수 있는 지식 체계 구축

기능AI 활용효과
지식 그래프 자동 구축관계 추론, 엔티티 연결의원-법안-위원회 관계망
데이터 정제동명이인 식별, 법안명 표준화데이터 품질 향상
맥락 추론관련 이슈, 배경 자동 연결숨은 관계 발견
시계열 분석법안 변천사, 정책 흐름역사적 맥락 파악
%%{init: {'theme': 'base', 'themeVariables': { 'fontSize': '14px' }}}%%
flowchart TB
    법안["법안"]
    의원["의원"]
    정당["정당"]
    위원회["위원회"]
    회의["회의"]
    
    의원 -->|발의| 법안
    법안 -->|심사| 위원회
    의원 -->|소속| 정당
    위원회 -->|개최| 회의
    의원 -->|발언| 회의
    
    style 법안 fill:#fff,stroke:#333,stroke-width:1px
    style 의원 fill:#fff,stroke:#333,stroke-width:1px
    style 정당 fill:#fff,stroke:#333,stroke-width:1px
    style 위원회 fill:#fff,stroke:#333,stroke-width:1px
    style 회의 fill:#fff,stroke:#333,stroke-width:1px

AI가 자동으로:

  • 의원 A가 법안 X를 발의 → 위원회 B에서 심사 → 회의 C에서 논의
  • 법안 X와 법안 Y의 유사성 발견 → 관련 법안으로 연결
  • 의원 A의 발언에서 언급된 정책 → 해당 정책 관련 기록 연결
%%{init: {'theme': 'base', 'themeVariables': { 'fontSize': '14px' }}}%%
flowchart LR
    subgraph process["의정활동 프로세스"]
        P1["발의"] --> P2["상정"] --> P3["심사"] --> P4["의결"] --> P5["공포"]
    end
    
    subgraph docs["산출 문서"]
        D1["발의문<br/>제안이유"]
        D2["상정안<br/>회부문서"]
        D3["심사보고<br/>수정안"]
        D4["의결문<br/>표결결과"]
        D5["관보<br/>시행령"]
    end
    
    P1 -.-> D1
    P2 -.-> D2
    P3 -.-> D3
    P4 -.-> D4
    P5 -.-> D5
    
    style process fill:#fff,stroke:#333,stroke-width:1px
    style docs fill:#f5f5f5,stroke:#666,stroke-width:1px

“국민 체감형 스토리텔링” — 일반 국민이 쉽게 이해하고 탐험할 수 있는 서비스

복잡한 입법 과정을 누구나 이해할 수 있도록 시각화하고, AI가 맞춤형 정보 제공

기능AI 활용효과
의미 기반 검색벡터 검색, 하이브리드 검색자연어로 원하는 정보 발견
대화형 QARAG 기반 질의응답”우리 지역구 의원 법안은?“
3줄 요약 봇LLM 기반 요약복잡한 법안을 쉽게 이해
맞춤 추천관심사 기반 추천개인화된 정보 제공
%%{init: {'theme': 'base', 'themeVariables': { 'fontSize': '14px' }}}%%
flowchart TB
    subgraph ui["국민 서비스 인터페이스"]
        direction TB
        
        subgraph search["검색"]
            Q["🔍 무엇이든 물어보세요<br/>예: 기후변화 관련 법안 심사 과정이 궁금해요"]
        end
        
        subgraph timeline["📊 법안 타임라인 뷰어"]
            T1["2023.01<br/>발의<br/>[문서]"] --> T2["2023.06<br/>상정<br/>[회의록]"] --> T3["2023.12<br/>심사<br/>[수정안]"] --> T4["2024.03<br/>의결<br/>[결과]"]
        end
        
        subgraph bottom["AI 기능"]
            direction LR
            summary["🤖 AI 3줄 요약<br/>───<br/>1. 탄소중립 목표<br/>2. 기업 의무 부과<br/>3. 2050년 시행"]
            qa["💬 AI Q&A<br/>───<br/>Q: 주요 쟁점은?<br/>A: 감축 목표율 논쟁<br/>[출처: 환노위 회의록]"]
        end
    end
    
    style ui fill:#fff,stroke:#333,stroke-width:1px
    style search fill:#fff,stroke:#333,stroke-width:1px
    style timeline fill:#fff,stroke:#333,stroke-width:1px
    style bottom fill:#f5f5f5,stroke:#666,stroke-width:1px
질문AI 답변
”우리 지역구 의원이 발의한 법안은?”[지역구 기반 의원 식별 → 발의 법안 검색 → 목록 제공]
“반도체 특별법 쟁점이 뭐야?”[관련 회의록 검색 → 찬반 발언 추출 → 요약]
“이 법안 비슷한 거 또 있어?”[벡터 유사도 검색 → 유사 법안 추천]

“열린 생태계와 참여” — 국민의 참여로 완성되는 리빙 아카이브

국회 기록이 외부와 연결되고, 국민이 함께 만들어가는 살아있는 아카이브

기능AI 활용효과
Open APIAI 기능 API 제공민간 서비스 연동
소셜 아카이빙SNS 데이터 분석, 여론 연결사회적 맥락 보강
기증 자료 처리자동 분류, 메타데이터 생성국민 참여 아카이브
품질 관리기증 자료 검증, 중복 탐지아카이브 무결성 유지
%%{init: {'theme': 'base', 'themeVariables': { 'fontSize': '14px' }}}%%
flowchart TB
    subgraph api["국회기록 Open API"]
        A1["/api/v1/search - 의미 기반 검색"]
        A2["/api/v1/qa - AI 질의응답"]
        A3["/api/v1/summarize - 문서 요약"]
        A4["/api/v1/graph - 지식 그래프 탐색"]
        A5["/api/v1/records - 원문 데이터 조회"]
    end
    
    U1["연구자<br/>분석툴"]
    U2["시빅해커"]
    U3["언론사<br/>서비스"]
    
    api --> U1
    api --> U2
    api --> U3
    
    style api fill:#f5f5f5,stroke:#666,stroke-width:1px
    style U1 fill:#fff,stroke:#333,stroke-width:1px
    style U2 fill:#fff,stroke:#333,stroke-width:1px
    style U3 fill:#fff,stroke:#333,stroke-width:1px
%%{init: {'theme': 'base', 'themeVariables': { 'fontSize': '14px' }}}%%
flowchart TB
    subgraph official["공식 기록"]
        O1["회의록"]
        O2["법안"]
        O3["의정활동"]
    end
    
    subgraph citizen["국민 참여"]
        C1["사진 기증"]
        C2["영상 기증"]
        C3["증언 기록"]
    end
    
    subgraph ai["AI 큐레이션"]
        AI1["• 자동 분류"]
        AI2["• 맥락 연결"]
        AI3["• 품질 검증"]
    end
    
    exhibit["통합 전시<br/>예: 1987년 국회 특집"]
    
    official <-->|AI 연결| citizen
    official --> ai
    citizen --> ai
    ai --> exhibit
    
    style official fill:#fff,stroke:#333,stroke-width:1px
    style citizen fill:#fff,stroke:#333,stroke-width:1px
    style ai fill:#f5f5f5,stroke:#666,stroke-width:1px
    style exhibit fill:#fff,stroke:#333,stroke-width:1px

단계목표AI 핵심 기능핵심 가치
1. 수집자동 수집자동 수집, 메타추출, STT의원실 부담 제로
2. 연결맥락 복원지식 그래프, 관계 추론입법 과정 전모 파악
3. 서비스국민 체감검색 QA, 요약, 시각화누구나 쉽게 이해
4. 확장열린 생태계Open API, 소셜 아카이빙국민 참여 아카이브

4단계 프레임워크가 다루는 기록 유형:

유형내용AI 적용 예시
회의록/속기록본회의, 위원회 회의 기록화자 분리, 요약, 쟁점 추출
법안/의안발의 법안, 심사 과정유사 법안 탐지, 조문 비교
의정활동 기록의원 활동, 질의/답변활동 패턴 분석, 관계 연결
국정감사 기록감사 자료, 시정 요구QA 추출, 이행 추적
행정기록국회 운영 문서문서 분류, 개인정보 탐지

각 단계별 상세 내용은 아래 문서 구조를 참조한다.


제목내용
1수집 (Collection)자동 수집, 7대 참여자 역할, 5대 기록 유형별 수집 전략, AI 자동화
2연결 (Connection)지식 그래프, 맥락 복원, 관계 추론, 입법 온톨로지
3서비스 (Service)국민 체감형 서비스, 의미 검색, RAG QA, 자동 요약
4확장 (Expansion)Open API, 리빙 아카이브, 국민 참여, 거버넌스
-부록기술 스택, 용어집, OAIS 참조 모형

“수집 → 연결 → 서비스 → 확장, 모든 단계에서 AI가 핵심이다.”

국회기록원 디지털 아카이브는 4단계 발전 프레임워크를 따르되, 각 단계에서 AI가 중심 역할을 수행함으로써 국민 누구나 입법 과정을 이해하고 참여할 수 있는 민주주의의 기록이 된다.