반응형 비전1 AI의 시각적 표현을 인간의 지식과 일치시키기: Google DeepMind의 연구 이 글은 시각적 인공지능(AI) 시스템이 세상을 인간과 다르게 "인식"하여 발생하는 문제점과 이를 해결하기 위한 Google DeepMind의 새로운 연구를 종합적으로 다룹니다. 핵심 문제는 AI가 시각적 정보를 인간의 개념적 계층 구조와 다르게 구성하여, 예측 불가능하고 신뢰도가 떨어지는 결과를 낳는다는 것입니다. 본 연구는 이러한 불일치를 해결하기 위해 3단계 정렬 방법론을 제시합니다. 첫째, 기존의 강력한 비전 모델을 기반으로 소규모 인간 판단 데이터셋(THINGS)을 활용하여 '교사 모델'을 훈련시킵니다. 둘째, 이 교사 모델을 사용하여 인간과 유사한 판단을 담은 대규모 합성 데이터셋(AligNet)을 생성합니다. 셋째, 이 새로운 데이터셋으로 다른 AI 모델('학생 모델')을 미세 조정하여 내부.. 2025. 11. 13. 이전 1 다음 반응형