English | 로그인 ㅣ ID/비번 찾기 ㅣ 회원가입/이메일 재인증
Home

마이크로소프트, AI 기반 에이전틱 보안 시스템 ‘MDASH’ 공개

2026/05/18 10:03:59


마이크로소프트가 취약점 발굴부터 검증·증명 및 대응까지 단계형 파이프라인을 갖춘 에이전틱 보안 분석 시스템 ‘멀티 모델 에이전틱 스캐닝 하네스(MDASH)’를 공개했다.

MDASH는 마이크로소프트 자율 코드 보안(ACS) 팀이 구축한 멀티 모델 에이전틱 스캐닝 하네스다. 단일 모델 접근 방식의 한계를 보완하기 위해 프런티어 모델과 증류 모델을 결합한 앙상블 아키텍처를 적용했으며, 100개 이상의 전문 AI 에이전트가 취약점 발견부터 검증·토론, 악용 가능성 증명까지 전 과정을 엔드투엔드로 수행하도록 설계됐다. 특히 단일 AI 모델 성능이 아니라, 다수 모델과 에이전트를 결합한 시스템 아키텍처 자체가 보안 성능의 핵심이라는 점을 강조한다.

마이크로소프트는 이 시스템을 활용해 윈도우 네트워킹 및 인증 스택 전반에서 16개의 신규 취약점을 식별했다. 이 가운데 4건은 치명적 원격 코드 실행 취약점으로, 윈도우 커널 TCP/IP 스택과 IKEv2 서비스 등 구성요소에서 발견됐다. 또한 대표 사례로 레이스 컨디션 기반 UAF(Use-after-free) 등 단순 패턴 매칭만으로는 포착하기 어려운 복잡한 결함 유형도 확인됐다.


실전 대응 역량을 보여주는 지표도 공개했다. MDASH는 공개 사이버짐(CyberGym)벤치마크에서 88.45% 점수로 리더보드 최고 점수를 기록했다. 이는 다음 엔트리 대비 약 5포인트 높은 수치다. 또한 마이크로소프트 보안 대응 센터(MSRC)의 5개년 확정 사례를 기준으로 한 회고 평가에서 clfs.sys 96%(28건), tcpip.sys 100%(7건)의 재현율을 기록했다.

하이퍼스케일 환경의 AI 기반 취약점 발굴
마이크로소프트는 보안 감사가 까다로운 자사 코드베이스의 특수성을 강조했다. 윈도우·하이퍼-V(Hyper-V)·애저(Azure) 등은 방대한 비공개 코드 영역과 서비스 생태계로 구성된다. 해당 영역은 범용 AI 모델의 학습 데이터에서 제외된다. 이로 인해 커널 호출 규칙이나 IPC 신뢰 경계는 단순 패턴 매칭이 아니라 코드 흐름, 객체 생명주기, 동시성까지 고려한 추론이 요구된다는 분석이다.

대규모 데브섹옵스(DevSecOps) 환경과 고가치 타깃의 특성도 제시했다. 취약점이 발견되면 담당자 배정과 검증·분류를 거쳐 정기 보안 업데이트(패치 화요일)에 반영된다. 이 과정에서 오탐이나 불필요한 경고가 증가할 경우 대응 비용이 커지며, 사용자 기반이 큰 제품일수록 그 부담도 더욱 가중된다. 

MDASH: 멀티 모델 에이전틱 스캐닝 하네스
MDASH는 준비부터 증명까지 이어지는 5단계 자동화 파이프라인으로 검증·증명된 결과를 산출한다. 소스 분석과 위협 모델링(준비)을 시작으로 후보 발굴(스캔) 및 에이전트 간 교차 검증(검증)을 거쳐, 중복을 제거한 뒤, 취약점을 실제로 재현할 수 있는 입력을 구성·실행해 최종적으로 취약점을 입증하는 구조다.

해당 파이프라인은 세 가지 핵심 속성으로 작동한다. 모델 앙상블(추론·검증·대조)을 단계별로 운용하고, 모델 간 판단 불일치를 신뢰도 신호로 활용한다. 감사·검증·증명 단계에는 역할이 다른 전문 에이전트를 배치한다. 플러그인으로 내부 맥락을 주입할 수 있고, 주요 단계는 모델 불가지론적으로 설계돼 새 모델 도입 시 설정 변경과 A/B 테스트로 반영할 수 있다.

보안 연구에서의 MDASH 활용: 비공개 코드 및 실전 재현 성능 검증
MDASH의 버그 탐지 성능 평가도 병행했다. 모델의 사전 학습 영향을 배제하기 위해, 외부에 공개된 적 없는 비공개 코드베이스를 활용해 검증을 진행했다. 

비공개 장치 드라이버인 스토리지드라이브(StorageDrive)에는 커널 UAF(Use-after-free), 정수(integer) 처리 문제, IOCTL 검증 누락, 락 오류 등 의도적으로 주입된 21개 취약점이 포함됐다. 테스트 결과, 주입된 취약점 모두 오탐 없이 정확히 식별됐다.

과거 보안 대응 사례를 기준으로 한 실전 재현 성능도 공개했다. 마이크로소프트 보안 대응 센터의 5개년 데이터를 기반으로 검증한 결과, 공통 로그 파일 시스템(clfs.sys)에서 96%(28건), tcpip.sys에서 100%(7건)의 재현율을 달성했다.

공개 벤치마크 사이버짐 리더보드 최고 점수 기록 
공개 사이버짐(CyberGym) 벤치마크에서는 88.45% 성공률로 리더보드 최고 점수를 기록했다. 이는 188개 OSS-Fuzz 프로젝트에서 추출한 1,507개 취약점 재현 과제를 기반으로 한 평가이며, 2위(83.1%) 대비 약 5포인트 높은 수치다. 

평가는 사이버짐 기본 설정(레벨1)으로 진행했으며, 평가 프로토콜 연계를 위해 증명 단계를 확장해 PoC 입력을 자동 제출하고 플래그를 회수했다. 남은 약 12% 실패 사례 중 잘못된 코드 영역을 겨냥한 경우의 82%는 함수·파일 식별자 없이 설명이 모호한 과제에서 발생했으며, 입력 형식(libFuzzer vs honggfuzz) 불일치로 재현이 실패한 사례도 확인됐다. 이를 근거로 작업 설명의 품질과 입력 형식 호환성이 스캔 정확도와 재현 결과에 영향을 줄 수 있다고 언급했다.

AI 보안, 연구를 넘어 실전 엔지니어링 영역으로
마이크로소프트는 AI 취약점 발굴이 연구 단계를 넘어 엔지니어링 과제로 전환되고 있다고 평가했다. 특히 정기 보안 업데이트 결과와 공통 로그 파일 시스템(CLFS) 관련 마이크로소프트 보안 대응 센터 5개년 사례 재현율을 근거로, AI 취약점 발굴 결과가 규모 있게 확장될 수 있다고 내다봤다. 

기술적 핵심으로는 구성과 검증을 꼽았다. 이에 MDASH 가 단일 프롬프트가 아니라 파일 간 비교와 다단계 도달 가능성 분석, 에이전트 간 토론, 증명 단계를 순차적으로 결합하도록 설계됐다는 점을 강조했다. 검증 단계 역시 ‘후보 표시’에서 멈추지 않고 토론·중복 제거·증명까지 이어지도록 구성됐다.

기술적 지속성을 위한 설계 요소는 ‘모델 교체를 흡수하는 아키텍처’를 제시했다. 새 모델 도입 시 파이프라인을 재구축하지 않고 설정 변경과 A/B 테스트 재실행으로 반영할 수 있으며, 프로젝트별 컨텍스트·스캔 플러그인·증명 에이전트 구성은 그대로 유지된다. 이는 AI 기반 취약점 탐지가 개별 모델 성능 경쟁을 넘어, 시스템 설계 중심의 엔지니어링 문제로 전환되고 있음을 시사한다.

김태수(Taesoo Kim) 마이크로소프트 에이전틱 보안 부사장은 “MDASH는 마이크로소프트 엔지니어링 팀이 상용 AI 모델을 활용해 보안 성과를 실질적으로 개선하는 데 도움을 주고 있다”며, “앞으로도 마이크로소프트는 모두에게 더 안전한 세상을 만들기 위한 노력을 이어갈 것”이라고 말했다.

한편, 마이크로소프트는 현재 일부 고객을 대상으로 MDASH의 한정 프라이빗 프리뷰(Limited Private Preview)를 진행 중이다. 상세 정보 확인 및 참여 신청은 마이크로소프트 공식 웹페이지를 통해 가능하다.

Tweet

#마이크로소프트, #AI


케이벤치 많이 본 기사
  [뉴스] 갤럭시Z 폴드8 와이드·워치 울트라2, 인도 인증 포착…출시 기대감↑
  [기획] 달과 도로에서 유리한 그래픽카드는? 프래그마타와 포르자 호라이즌 6 성능 비교 RTX 5070 시리즈 VS RX 9070 시리즈
  [뉴스] '갤럭시 워치4·5·6·FE' 국내 모델, 2026년 5월 보안 업데이트 배
  [뉴스] 아이폰18 프로 맥스 '다크 체리' 렌더링 유출…새 대표 색상 되나
  [뉴스] '갤럭시Z 폴드7' 6월 업데이트, 갤럭시S26 AI 기능 2종 추가
  [뉴스] 애플 폴더블폰 실물 느낌은? '아이폰 울트라' 새로운 모형 등장
  [기획] [컴퓨텍스 2026] 디자인, 성능 개선한 신제품 준비 완료한 팀 그룹 부스 & 인터뷰
  [기획] [기고] 소통을 함께 하는 인공지능의 매력
  [기획] [컴퓨텍스 2026] 창립 20주년 조텍, AI 서버 엣지 컴퓨팅 전략 공개와 인터뷰
  [뉴스] 차기 갤럭시Z 폴드8·플립8 가격 유출.. 역대 최고가 가능성
  [기획] [컴퓨텍스 2026] 에이서, 스위프트 에어 14 노트북과 공유기 그리고 엔터프라이즈와 커머셜까지 다양한 에이서 제품 전시
  [뉴스] 갤럭시Z 폴드8 와이드, IMDA 인증 통과… UWB 지원 확인
Copyrightⓒ 넥스젠리서치(주) 케이벤치 미디어국. www.kbench.com 인쇄 목록 위로
케이벤치 기자 / pr@kbench.com

연관기사 보기
  마이크로소프트, 에이전틱 시스템 ‘코파일럿 코워크’ 정식 출시
  마이크로소프트, 차세대 AI PC 신형 서피스 프로-랩탑 론칭
  NC AI, MBC 손잡고 K-미디어 AI 혁신 나선다
  마이크로소프트, 2026 업무동향지표 발표
  [기자간담회] eG이노베이션스 '한국은 아시아 확장의 청사진'... AI 옵저버빌리티·SAP PCE 시장 공략 강화
  마이크로소프트, 일부 윈도우 PC에 코파일럿 앱 자동 설치 재개
  [컴퓨텍스 2026] WD, 컴퓨텍스 2026서 AI 데이터 인프라 전략 제시
  [컴퓨텍스 2026] ASUS, 대만 루주 AI Lab 공개... GB300 검증부터 AI 데이터센터 운영까지
  [컴퓨텍스 2026] 소비자용 솔루션, AI 인프라 그리고 엔터프라이즈 비전 제시한 ADATA 부스
  [컴퓨텍스 2026] 시놀로지, NAS 넘어 기업 인프라와 AI 생산성까지 확장
  마이크로소프트, 최신 윈도우 11 프리뷰 빌드 iSO 파일 출시
  엔비디아, 마이크로소프트와 개인용 AI 시대 위한 윈도우 PC 재정의
케이벤치 이벤트/공지사항
 
[일반공지]2025/04/03 사내 워크샵으로 인한 휴뮤 안내
[일반공지]케이벤치 컨텐츠 제작자/기자 채용 공고
[공지사항][이벤트 당첨 발표] 신년 3차 착한일 이벤트 당첨자 발표
[공지사항][이벤트 당첨 발표] 신년 2차 덕담 이벤트 당첨자 발표
[공지사항][이벤트 당첨 발표] 신년 1차 장비자랑 이벤트 당첨자 발표
[이벤트][이벤트] 케이벤치 베스트 어워드 및 2022년 신년 이벤트

케이벤치 많이 본 기사 TOP 10
뉴스
기사
갤럭시Z 폴드8 울트라 美 FCC 통과… 와이드 모델은 아직
갤럭시Z 폴드8 와이드·워치 울트라2, 인도 인증 포착…출시 기대감↑
갤럭시Z 폴드8 와이드, IMDA 인증 통과… UWB 지원 확인
아이폰18 프로 맥스 '다크 체리' 렌더링 유출…새 대표 색상 되나
'갤럭시Z 폴드7' 6월 업데이트, 갤럭시S26 AI 기능 2종 추가
애플 폴더블폰 실물 느낌은? '아이폰 울트라' 새로운 모형 등장
One UI 8.5서 빠졌던 AI 알림 기능, 갤럭시S25에 뒤늦게 적용
차기 갤럭시Z 폴드8·플립8 가격 유출.. 역대 최고가 가능성
삼성, 갤럭시S27에 中 BOE 패널 채택하나… 사실상 확정 단계
삼성 '갤럭시S26 FE'…달라진 디자인 4가지 살펴보니
뉴스
기사
달과 도로에서 유리한 그래픽카드는? 프래그마타와 포르자 호라이즌 6 성능 비교 RTX 5070 시리즈 VS RX 9070 시리즈
샌디스크, 독립 경영 출범 이후 첫 신제품 기자간담회 개최... 옵티머스 SSD·FIFA 월드컵 에디션 공개
확장성과 시원한 메쉬 설계, 하이엔드 시스템을 위한 PC 케이스, darkFlash DLX ULTRA MESH ARGB
[컴퓨텍스 2026] 에이서, 스위프트 에어 14 노트북과 공유기 그리고 엔터프라이즈와 커머셜까지 다양한 에이서 제품 전시
[컴퓨텍스 2026] 디자인, 성능 개선한 신제품 준비 완료한 팀 그룹 부스 & 인터뷰
[컴퓨텍스 2026] 창립 40주년 타이탄 18 HX 드래곤 에디션, 인텔 아크 G3 익스트림의 클로 8 EX AI+ 등, 스페셜한 게이밍 디바이스와 함께하는 MSI 부스
과거와 현재, 20년 ROG 기념작 ASUS ROG CROSSHAIR 2006 메인보드
[컴퓨텍스 2026] 창립 20주년 조텍, AI 서버 엣지 컴퓨팅 전략 공개와 인터뷰
[기고] 소통을 함께 하는 인공지능의 매력
QHD와 240Hz로 만나는 QD-OLED 입문서, ASUS ROG Strix OLED XG27AQDMES