데이터 정책
lawmaker.kr에서 사용하는 데이터의 출처, 수집 방식, 이용허락 범위, 한계를 공개합니다.
데이터 출처
수집 방식
- 공식 기관이 제공하는 Open API, 공식 다운로드, 공식 문서만 수집합니다.
- 서드파티 정제 데이터, 라이선스가 불명확한 데이터, 무단 스크래핑 데이터는 적재하지 않습니다.
- 수집 이력(source_sync_runs, last_synced_at)은 남기고 있으며, 행 단위 출처 URL·이용허락 메타데이터는 수집기별로 순차 보강 중입니다.
- 수집 스크립트는 정기 스케줄 또는 수동 트리거로 실행되며, 현재는 일 단위 배치와 수동 배치를 함께 운영합니다.
랭킹 산식 (잠정)
| 카테고리 | 비중 | 세부 계산 | 상태 |
|---|---|---|---|
| 입법 | 40% | 대표발의 × 3점 + 공동발의 × 0.5점 + 가결 × 5점 | 반영 중 |
| 표결 | 30% | 본회의 표결 참여율 | 반영 중 |
| 출석 | 15% | 본회의 및 위원회 출석률 | 데이터 수집 준비 중 |
| 발언 | 15% | 본회의 및 위원회 발언/질의 횟수 | 데이터 수집 준비 중 |
산식 가중치는 서비스 오픈 전 확정 예정이며, 베타 테스트 결과를 반영하여 조정될 수 있습니다. 커뮤니티에서 생산된 데이터(공감, 조회수 등)는 의정활동 랭킹에 영향을 주지 않습니다.
이용허락 범위
- 열린국회정보, 공공데이터포털의 공공 데이터는 공공누리 이용조건에 따릅니다.
- lawmaker.kr은 공식 데이터의 구조화, 시각화, 비교 도구를 제공하며, 원본 데이터의 재배포가 아닙니다.
- 재산공개 데이터는 공식 공개 문서를 기반으로 구조화하며, 원문 전체를 적재하지 않습니다.
- 이용조건이 변경될 경우 해당 수집기를 즉시 중단합니다.
데이터 한계 및 면책
- 현재 의안, 표결, 위원회 자동 수집은 22대 국회 기준으로 운영 중입니다.
- 의원별 본회의 표결 데이터는 공식 API 기준 20대 국회 이후가 중심입니다.
- 회의록과 발언 데이터는 아직 자동 수집기를 준비 중이며, 회기별 형식 차이로 파싱 오류가 발생할 수 있습니다.
- 재산공개 데이터는 국회공보 공시가격 기준이며, 시가와 다를 수 있습니다.
- 재산공개 자동 수집은 아직 준비 중이며, 현재는 시드 데이터와 수동 입력 흐름이 중심입니다.
- 재산 순위는 의정활동 평가와 무관하며, 자산의 많고 적음이 의원 역량을 의미하지 않습니다.
- 출석·발언 데이터는 아직 수집되지 않아 관련 랭킹 점수는 0으로 표시됩니다.
- 모든 수치는 데이터 수집 시점에 따라 최신 상태와 차이가 있을 수 있습니다.
정정 정책
- 데이터 오류를 발견하시면 커뮤니티 제보/정정 기능(준비 중)을 통해 알려주세요.
- 정정 요청은 원본 출처와 대조하여 검증한 뒤 반영합니다.
- 정정 공보 발행 시 해당 건만 우선 갱신합니다.
- 모든 정정 이력은 기록으로 보존됩니다.