|
29일 과기정통부에 따르면 데이터 품질인증은 '데이터 산업진흥 및 이용촉진에 관한 기본법(이하 데이터산업법)'에 따라 데이터의 오류 여부와 품질관리 체계의 수준 등을 심사, 평가해 인증하는 제도다. 과기정통부는 본 제도의 시행을 위해 지난해 7월 데이터 품질인증 기관을 지정한 바 있다. 해당 기관들은 지난해 11월부터 정형데이터 품질인증을 수행 중이다.
새로 도입된 비정형데이터와 데이터 관리체계 품질인증은 생성형 인공지능 시대의 도래와 자율주행 등 전 산업 분야에 걸쳐 인공지능 기술이 보편화됨에 따라 데이터 품질에 대한 높아지는 산업적 요구에 대응하기 위해 마련됐다. 세부 인증 심사체계는 관련 국제표준을 기반으로 데이터 품질분야 전문가 및 인증기관 간 논의를 종합적으로 거쳐 수립됐다.
또 과기정통부는 데이터 품질인증에 대한 이해도를 높일 수 있도록 품질인증지표 및 심사방법, 인증 시 필요한 준비사항 등을 담은 데이터 품질인증 방침(가이드라인)을 마련하여 연말에 배포할 예정이다.
김경만 과기정통부 인공지능기반정책관은 "사회 전반으로 인공지능이 일상화되는 현시대에, 고품질 데이터는 신뢰할 수 있는 인공지능을 위한 핵심 자산"이라며 "과기정통부는 데이터 기반의 혁신적인 신기술·서비스 사업을 추진하는 기업들의 경쟁력 강화를 위해 제도를 지속적으로 고도화하고 지원을 확대해 나가겠다"고 밝혔다.
데이터 품질인증을 통해 고품질 데이터가 늘어나면, AI의 신뢰도 및 안정성 역시 강화될 전망이다. 최근 전문가들은 초인공지능이 인류에게 많은 혜택을 가져다주겠지만, 무기화되거나 의도하지 않은 위험 행동을 할 가능성이 존재하므로 항상 경계해야 한다고 강조하고 있다.
데이터 품질 향상뿐만 아니라, AI 모델 동작 방식에 대한 연구와 강화 학습 역시 함께 이뤄져야 한다. 대부분의 AI는 어떻게 동작하는지 내부를 들여다볼 수 없는 블랙박스 모델로 개발되기 때문에 AI 모델이 어떻게 동작하는지 분석하는 연구도 필요하다.
이기민 카이스트 교수는 "AI 모델이 잘못된 결과물을 냈을 때 그 결과물은 좋지 않다는 피드백을 주고, 강화 학습을 통해 AI 모델이 피드백을 학습하면 개선이 가능해진다"며 "이처럼 '인간의 피드백'을 통해 강화 학습을 시켜 AI 모델을 미세 조정하는 정렬 기법이 주로 사용된다"고 설명했다.