인공지능(AI) 모델 '클로드 미토스'로 전 세계적인 보안 우려를 자아낸 앤트로픽이 새 모델에서 사이버 위협 능력 제한에 나섰습니다.
앤트로픽은 현재 일반에 공개된 최상위 모델인 '클로드 오퍼스4.6'의 개선판으로 전작보다 코딩과 금융 분석 능력을 크게 강화한 '오퍼스4.7'을 출시한다고 밝혔습니다.
코딩 능력을 재는 'SWE-벤치 프로', 'SWE-벤치 베리파이드' 성능 지표(벤치마크)에서 각각 64.3%와 87.6%를 기록해 공개된 AI 모델 가운데 최고 성능을 드러냈습니다.
금융 분석 능력을 측정하는 '파이낸스 에이전트 v1.1' 지표에서도 64.4%의 점수로 전작은 물론 주요 경쟁 AI 모델들보다 높은 평가를 받았습니다.
다만 거의 모든 지표에서 '미토스 미리 보기(프리뷰)' 판보다는 낮은 성능을 보였습니다.
앤트로픽도 이 모델에 대해 "가장 강력한 모델인 클로드 미토스 미리 보기에 비해 기능이 다소 제한적"이라고 설명했습니다.
특히 앤트로픽은 오퍼스4.7의 사이버 보안 기능이 미토스 미리 보기보다 부족하며, 훈련 과정에서 이와 같은 보안 기능만을 축소하는 실험도 진행했다고 덧붙였습니다.
오퍼스4.7은 해킹 등 사이버 보안과 관련해 금지되거나 위험성이 높은 요청을 자동으로 탐지하고 차단하는 안전장치도 적용했다고 앤트로픽은 부연했습니다.
다만, '사이버 검증 프로그램'에 참여하는 보안 전문가들은 취약점 연구 등 정당한 사이버 보안 목적으로 이 모델을 사용할 수 있습니다.
앤트로픽은 오퍼스4.7의 출시를 '시험'이라고 지칭하면서 "미토스급 모델을 일반에 출시한다는 궁극적인 목표를 달성하는 데 도움이 될 것"이라고 강조했습니다.
앞서 앤트로픽은 지난 7일 미토스 모델이 전문가 수준의 강력한 보안 취약점 탐지 능력을 갖추고 있다고 발표했습니다.
그러면서 이 모델을 곧바로 일반에 공개하지 않고 주요 기술·금융 기업에 선제공하겠다고 밝혔습니다.
이에 따라 미국을 비롯한 각국 정부와 금융 당국 등은 긴급회의를 여는 등 미토스와 같은 AI 모델에 대응할 방안을 모색해왔습니다.
트럼프 대통령의 지침에 따라 앤트로픽 사용 중단에 나선 미 재무부도 미토스에 대한 접속 권한을 얻기 위한 협의에 나섰을 정도입니다.
앤트로픽은 "정부는 AI 모델과 관련한 국가 안보 위협을 평가하고 완화해야 한다"며 "이를 지원하기 위해 지방·주·연방 정부와 협력할 준비가 돼 있다"고 설명했습니다.
※ '당신의 제보가 뉴스가 됩니다'
[카카오톡] YTN 검색해 채널 추가
[전화] 02-398-8585
[메일] social@ytn.co.kr
[저작권자(c) YTN 무단전재, 재배포 및 AI 데이터 활용 금지]