통계청, 개인정보 노출위험 통계적 방지 프로그램(KOSTAT-Did) 보급

2025년 09월 04일

💰 경제·산업

AI 요약

가

AI 요약

다음은 대한민국 정부 부처에서 발표한 보도자료를 바탕으로 작성된 상세하고 포괄적인 요약입니다.

1. 핵심 요약

통계청은 2025년 9월 4일, 통계자료의 개인정보 노출 위험을 통계적으로 방지하는 자동 프로그램인 'KOSTAT-Did(De-identification)'를 개발하여 437개 국가통계작성기관에 보급한다고 발표했습니다. 이 프로그램은 마이크로데이터(개별 단위의 상세 통계자료)의 개인정보 노출 위험을 평가하고, 마스킹, 범주화, 통계적 잡음(노이즈) 첨가 등 15종의 비식별화 기법을 제공하여 특정 개인이나 사업체를 식별할 수 없도록 처리합니다. KOSTAT-Did는 인공지능(AI) 대전환 시대에 증가하는 상세 데이터 개방 요구에 부응하면서도 개인정보 보호를 강화하여, 국가통계의 안전하고 손쉬운 개방 및 활용을 지원하는 데 핵심적인 역할을 할 것으로 기대됩니다. 이를 통해 각 기관은 통계자료의 정보보호 수준을 객관적으로 측정하고 최적의 공개 범위를 설정할 수 있게 됩니다.

2. 주요 내용

KOSTAT-Did 프로그램 보급 시작: 통계청은 2025년 9월 4일부터 국가통계작성기관을 대상으로 개인정보 노출 위험 통계적 방지 프로그램인 'KOSTAT-Did'를 공식적으로 서비스합니다. 이 프로그램은 통계자료, 특히 마이크로데이터(개별 단위의 상세 통계자료)의 개인정보 노출 위험을 평가하고 방지하는 자동화된 도구로, 통계청장 안형준은 이번 보급이 실무에 적용 가능한 자동 프로그램을 제공하는 첫 사례라고 강조했습니다.
15종의 비식별화 기법 제공: KOSTAT-Did는 통계자료의 특성을 면밀히 고려하여 마스킹(예: "김OO"처럼 일부 정보를 가리는 방식), 범주화(예: 102세와 같은 특정 연령을 "100세 이상"과 같이 더 넓은 범주로 묶어 식별 위험을 줄이는 방식), 통계적 잡음(노이즈) 첨가, 자료교환(스와핑) 등 총 15가지의 다양한 비식별화 기법을 지원합니다. 이를 통해 데이터의 유용성을 최대한 유지하면서도 개인 식별 가능성을 최소화합니다.
자동화된 평가 보고서 및 시각화 기능: 프로그램은 비식별화 처리 완료 후 표준화된 평가 보고서를 자동으로 생성합니다. 이 보고서는 처리 전후의 정보 손실도(데이터가 비식별화 과정에서 얼마나 변형되었는지) 및 노출 위험도(개인정보가 식별될 가능성)를 시각화된 그래프와 정량화된 지표로 비교할 수 있게 하여, 통계 담당자가 정보보호 수준을 객관적으로 측정하고 평가할 수 있도록 돕습니다.
437개 국가통계작성기관 대상 보급 및 교육: 통계청은 전국 437개 국가통계작성기관에 KOSTAT-Did를 보급하여 국가통계의 안전한 개방 및 활용을 지원합니다. 2025년 9월 4일부터 통계정책관리시스템(www.narastat.kr/pms/index.do)을 통해 프로그램이 제공되며, 10월부터는 각 기관을 대상으로 KOSTAT-Did의 효과적인 활용을 위한 맞춤형 사용자 교육도 실시될 예정입니다.
AI 시대 데이터 개방 인프라 구축: 통계청은 정부가 'AI 대전환'을 통해 세계 3대 AI 강국으로 도약하려는 목표를 달성하기 위해 KOSTAT-Did를 개발했습니다. 이는 인공지능 학습용 데이터 등 양질의 국가통계를 안전하게 개방할 수 있는 필수적인 인프라를 제공하여, 상세 자료 제공 요구에 대응하고 데이터 기반 혁신을 지원하기 위함입니다.
수작업 비식별화 업무의 자동화 지원: 2023년 「통계작성 및 통계자료 제공을 위한 비식별화 가이드라인」 배포에 이어, 2024년 개발된 KOSTAT-Did는 기존에 통계 담당자들이 수작업으로 처리해 오던 비식별화 업무를 엑셀 기반의 자동 프로그램으로 전환하여 업무 효율성을 크게 향상시킵니다. 이는 비식별화 과정의 일관성과 정확성을 높이는 데 기여합니다.

3. 배경 및 목적

최근 인공지능(AI) 기술의 급격한 발전과 함께 'AI 대전환(AX) 시대'가 도래하면서, 인공지능 학습용 데이터 개방을 비롯하여 개인 및 사업체 단위의 상세한 통계자료, 즉 마이크로데이터 제공 요구가 전례 없이 증가하고 있습니다. 이러한 마이크로데이터는 정보의 유용성을 극대화하여 다양한 연구와 정책 개발에 기여할 수 있지만, 동시에 특정 개인이나 사업체를 식별할 수 있는 '개인정보 노출 위험'을 수반합니다. 국가통계작성기관들은 이러한 개인정보 노출 위험을 마이크로데이터 전면 개방의 가장 큰 장애 요인으로 인식하고 있으며, 정보의 상세함과 개인정보 보호 사이에서 균형을 찾는 것이 중요한 과제로 부상했습니다.

이러한 배경 속에서 통계청은 개인 및 단체의 기밀을 보호하면서도 통계적 유용성을 확보하기 위한 노력을 지속해왔습니다. 2023년에는 「통계작성 및 통계자료 제공을 위한 비식별화 가이드라인」을 배포하여 통계자료의 안전한 활용을 위한 기준을 제시했습니다. 그러나 가이드라인만으로는 현장의 수작업 비식별화 업무 부담을 해소하기 어렵다는 점을 인지하고, 실질적인 지원을 위해 자동화된 프로그램 개발의 필요성을 절감했습니다. 따라서 KOSTAT-Did는 AI 시대의 데이터 개방 요구에 부응하면서도 개인정보 보호라는 사회적 책임을 다하고, 국가통계작성기관의 비식별화 업무 효율성을 높여 안전하고 효과적인 통계자료 활용 환경을 조성하는 것을 궁극적인 목적으로 합니다. 이는 정부가 AI 대전환을 통해 세계 3대 AI 강국으로 도약하려는 목표를 달성하는 데 필수적인 인프라를 제공하는 의미도 갖습니다.

4. 세부 추진 내용

KOSTAT-Did 프로그램은 2024년에 엑셀 기반의 자동 프로그램으로 개발되었으며, 통계청 내부 및 외부 기관의 실무자와 전문가들의 철저한 테스트를 거쳐 최종 확정되었습니다. 이 프로그램은 2025년 9월 4일부터 통계청의 통계정책관리시스템(www.narastat.kr/pms/index.do)을 통해 전국 437개 국가통계작성기관에 공식적으로 보급됩니다. 이는 통계청이 통계자료 개방과 관련하여 단순한 지침이나 가이드라인 제공을 넘어, 실무에 직접 적용 가능한 자동화된 도구를 보급하는 첫 사례라는 점에서 의미가 큽니다.

KOSTAT-Did는 통계자료의 특성을 면밀히 고려하여 설계되었으며, 개인정보 노출 위험을 방지하기 위한 15가지의 다양한 비식별화 기법을 지원합니다. 주요 기법으로는 '마스킹'(예: "김OO"처럼 일부 정보를 가리는 방식), '범주화'(예: 102세와 같은 특정 연령을 "100세 이상"과 같이 더 넓은 범주로 묶어 식별 위험을 줄이는 방식), '통계적 잡음(노이즈) 첨가'(데이터에 미세한 무작위 값을 추가하여 특정 패턴을 모호하게 하는 방식), '자료교환(스와핑)'(데이터 내에서 일부 값을 무작위로 교환하여 식별성을 낮추는 방식) 등이 있습니다. 또한, 이 프로그램은 비식별화 처리 전후의 정보 손실도와 노출 위험도를 시각화된 그래프와 정량화된 지표로 비교할 수 있는 표준화된 평가 보고서를 자동으로 생성하여, 사용자가 데이터의 정보보호 수준을 객관적으로 측정하고 최적의 공개 범위를 설정할 수 있도록 지원합니다. 프로그램 보급과 더불어, 2025년 10월부터는 국가통계작성기관을 대상으로 KOSTAT-Did의 효과적인 활용을 위한 맞춤형 사용자 교육도 실시될 예정입니다.

5. 기대 효과

KOSTAT-Did 프로그램 보급을 통해 국가통계작성기관들은 마이크로데이터 개방 시 가장 큰 걸림돌이었던 개인정보 노출 위험을 효과적으로 관리할 수 있게 됩니다. 이 프로그램은 437개 국가통계작성기관의 통계 담당자들이 수작업으로 처리하던 비식별화 업무의 부담을 획기적으로 줄여 업무 효율성을 높이고, 통계자료의 정보보호 수준을 객관적으로 측정하고 평가할 수 있는 표준화된 기준을 제공합니다. 결과적으로, 통계청은 양질의 국가통계를 안전하게 개방할 수 있는 인프라를 확충하여 정부의 AI 대전환 목표 달성에 기여하고, 연구자, 기업, 정책 입안자 등 다양한 데이터 활용자들이 보다 손쉽고 안전하게 상세 통계자료에 접근하여 새로운 가치를 창출할 수 있도록 지원할 것으로 기대됩니다. 이는 궁극적으로 데이터 기반의 의사결정을 강화하고 국가 경쟁력을 높이는 데 크게 이바지할 것입니다.

6. 향후 계획

통계청은 KOSTAT-Did 프로그램 보급을 시작으로, 국가통계의 안전한 개방 및 활용을 위한 노력을 지속적으로 확대해 나갈 계획입니다. 안형준 통계청장은 최신 정보보호 신기술 연구와 인프라 확충에 적극적으로 투자하여, 437개 국가통계작성기관 전체가 더욱 많은 데이터를 손쉽고 안전하게 개방할 수 있도록 지원하겠다고 밝혔습니다. 이는 프로그램의 지속적인 업데이트와 기능 개선을 포함하며, 급변하는 데이터 환경과 정보보호 기술 발전에 발맞춰 국가통계의 신뢰성과 유용성을 동시에 확보하기 위한 장기적인 전략의 일환입니다. 또한, 10월부터 예정된 맞춤형 사용자 교육을 통해 프로그램의 현장 활용도를 높이고, 사용자 피드백을 반영하여 KOSTAT-Did를 지속적으로 발전시켜 나갈 것입니다.

보도자료 내용

보도자료 본문은 첨부파일을 참조하세요.

첨부파일

통계청, 개인정보 노출위험 통계적 방지 프로그램(KOSTAT-Did) 보급.pdf

PDF

통계청, 개인정보 노출위험 통계적 방지 프로그램(KOSTAT-Did) 보급.hwp

HWP

통계청, 개인정보 노출위험 통계적 방지 프로그램(KOSTAT-Did) 보급.hwpx

HWPX

원본 보도자료

정책브리핑 원문 보기

목록으로 돌아가기

AI 요약

1. 핵심 요약

2. 주요 내용

3. 배경 및 목적

4. 세부 추진 내용

5. 기대 효과

6. 향후 계획

보도자료 내용

첨부파일

원본 보도자료

정책온에어 AI 폴리