English | 로그인 ㅣ ID/비번 찾기 ㅣ 회원가입/이메일 재인증
Home

OpenAI, 전문 업무용 프론티어 AI 모델 GPT-5.4 공개

2026/03/06 09:42:28

OpenAI가 전문적인 업무 수행을 위한 가장 뛰어나고 효율적인 프론티어 모델인 GPT-5.4를 공개했다.


GPT-5.4는 ChatGPT, API, 코덱스(Codex) 등 OpenAI의 주요 제품 전반에 적용되는 가장 뛰어나고 효율적인 프론티어 모델로, 추론 능력과 코딩 성능, 그리고 에이전트 기반 워크플로를 하나의 모델로 통합한 것이 특징이다.

GPT-5.4는 특히 GPT-5.3-코덱스의 업계 최고 수준 코딩 능력을 통합하면서 스프레드시트, 프레젠테이션, 문서와 같은 전문 업무 환경에서 다양한 도구와 소프트웨어를 활용하는 방식을 크게 개선했다. 이를 통해 복잡한 실제 업무를 보다 정확하고 효율적으로 수행할 수 있으며, 사용자가 원하는 결과를 얻기까지 필요한 반복 작업도 줄였다.

성능 측면에서도 GPT-5.4는 주요 벤치마크에서 의미 있는 개선을 보였다. AI 에이전트가 실제 지식 기반 업무를 수행하는 능력을 평가하는 GDPval 벤치마크에서 GPT-5.4는 전체 업무 과제 비교 중 83%에서 산업 전문가와 동등하거나 더 높은 수준의 결과를 보였다. 이는 GPT-5.2의 71.0%보다 크게 향상된 결과다. GDPval은 미국 GDP의 주요 산업을 대표하는 44개 직군의 업무 과제를 기반으로 모델의 실제 업무 수행 능력을 평가한다.

OpenAI는 GPT-5.4 개발 과정에서 특히 스프레드시트, 프레젠테이션, 문서 생성 및 편집 능력을 강화했다. 투자은행의 주니어 애널리스트가 수행할 수 있는 수준의 스프레드시트 모델링 작업을 평가한 내부 벤치마크에서 GPT-5.4는 평균 87.5%의 점수를 기록해 GPT-5.2의 68.4%를 크게 상회했다. 프레젠테이션 제작에서도 디자인 완성도와 시각적 다양성, 이미지 생성 활용도와 함께, 모델의 사실 정확성도 개선되었다.

또한 GPT-5.4는 OpenAI가 공개한 범용 모델 가운데 컴퓨터 사용(computer-use) 능력을 기본적으로 탑재한 최초의 범용 모델이다. 코덱스와 API 환경에서는 AI 에이전트가 실제 컴퓨터 환경에서 소프트웨어를 조작하고 여러 애플리케이션을 넘나들며 복잡한 작업 흐름을 수행할 수 있다. GPT-5.4는 최대 100만 토큰(1M tokens)의 컨텍스트를 지원해 장시간 작업을 계획하고 실행하며 검증하는 에이전트 시스템 구축에도 적합하다. 이러한 기능은 웹 브라우징, 데스크톱 환경 조작, 멀티모달 이해 등 다양한 벤치마크에서도 높은 성능으로 확인됐다.

ChatGPT에서 제공되는 GPT-5.4(ChatGPT에서 이용 가능한 모델 중 ‘GPT-5.4 Thinking’을 선택해 사용 가능)는 새로운 작업 방식도 도입했다. 모델이 답변을 생성하기 전에 작업 계획을 먼저 제시해 사용자가 응답 생성 중에도 방향을 조정할 수 있도록 한다. 이를 통해 추가 대화를 반복하지 않아도 원하는 결과에 보다 빠르게 도달할 수 있다. 또한 웹 기반 심층 조사 능력이 강화되어 여러 출처의 정보를 종합해야 하는 복잡한 질문에서도 더 정확하고 일관된 답변을 제공한다.

GPT-5.4는 대규모 도구 환경에서도 효율적으로 작동하도록 도구 검색(tool search) 기능을 도입했다. 이를 통해 에이전트는 다양한 도구와 커넥터가 연결된 환경에서 필요한 도구를 더 정확하게 찾아 사용할 수 있으며, 토큰 사용량과 응답 지연도 줄일 수 있다.

GPT-5.4는 GPT-5.2 대비 문제 해결에 필요한 토큰 수를 크게 줄인 가장 효율적인 추론 모델로, 동일한 작업을 더 빠르고 비용 효율적으로 수행할 수 있다.

OpenAI는 GPT-5.4를 통해 기업과 전문가들이 복잡한 업무를 더 빠르고 정확하게 수행하고, AI 에이전트를 활용한 새로운 업무 방식이 확산될 것으로 기대하고 있다.

Tweet

#OpenAI, #ChatGPT, #인공지능


케이벤치 많이 본 기사
  [뉴스] 갤럭시 워치, 최신 업데이트 이후 '배터리 광탈' 이슈.. 구글 플레이 서비스가 원인?
  [뉴스] 갤럭시 -> 아이폰 보낸 사진, EXIF 데이터 손실 오류 발견
  [기획] 마이크로닉스 2026 신제품 발표회 개최, AI 시대 전력·냉각 구조 반영한 신제품 라인업 발표
  [뉴스] 삼성, 여권 디자인 새로운 ‘갤럭시Z 트라이폴드 와이드’ 개발 중?
  [뉴스] 삼성, 2027년 보급형 스마트폰 ‘갤럭시 A18’ 개발 정황 포착
  [뉴스] 갤럭시 -> 아이폰 보낸 사진, EXIF 데이터 손실 오류 발견
  [뉴스] 차기 ‘갤럭시S27’ 탑재 스냅드래곤 8 엘리트 6세대 일반 버전 사양 유출
  [기획] 배틀그라운드 9주년 페스티벌 'Still Here, All Day'… 9년의 생존, 이제는 문화가 되다
  [뉴스] 삼성, 여권 디자인 새로운 ‘갤럭시Z 트라이폴드 와이드’ 개발 중?
  [뉴스] 삼성, ‘갤럭시S24 FE’ One UI 8.5 베타 테스터 2차 모집
  [기획] 완전체로 진화한 엔비디아 DLSS 4.5, 동적 프레임 생성 괜찮나?
  [뉴스] 애플, 아이폰 폴드 출시 앞두고 폴더블 패널 주문량 20% 늘려
Copyrightⓒ 넥스젠리서치(주) 케이벤치 미디어국. www.kbench.com 인쇄 목록 위로
케이벤치 기자 / pr@kbench.com

연관기사 보기
  오픈AI, 코덱스 ‘코딩 도구’ 넘어 컴퓨터에서 직접 동작하는 AI로 확장… 성능·사용성 강화
  NC AI, ADB 과기정통부 워크숍서 아시아 고위급 대상 AX 비전 발표
  AI스튜디오, 150개 언어 지원 ‘AI 더빙’ 고도화
  딥엘, 실시간 음성 간 번역 Voice-to-Voice 공개
  오라클 AI 데이터베이스 기능 강화 종합 업데이트 발표
  히타치 밴타라, 에이전틱 AI 도입 가속화하는 히타치 iQ 스튜디오 공개
  인텔과 구글, AI 인프라 발전을 위한 협력 강화
  엠클라우드브리지, AI 업무 자동화 통합 플랫폼 발표
  순천향대학교 산학협력단, AI기반 게임개발 멘토링 프로그램 런칭
  OpenAI, 신세계그룹과 함께 한국에서 AI 기반 커머스 협력 추진
  이엠텍, NVIDIA Jetson Orin Nano/NX 탑재 PANDORA AI PC 3종 구매 리뷰 이벤트 진행
  인텔, MLPerf 추론 v6.0 벤치마크에서 개방형 확장형 AI 성능 입증
케이벤치 이벤트/공지사항
 
[일반공지]2025/04/03 사내 워크샵으로 인한 휴뮤 안내
[일반공지]케이벤치 컨텐츠 제작자/기자 채용 공고
[공지사항][이벤트 당첨 발표] 신년 3차 착한일 이벤트 당첨자 발표
[공지사항][이벤트 당첨 발표] 신년 2차 덕담 이벤트 당첨자 발표
[공지사항][이벤트 당첨 발표] 신년 1차 장비자랑 이벤트 당첨자 발표
[이벤트][이벤트] 케이벤치 베스트 어워드 및 2022년 신년 이벤트

케이벤치 많이 본 기사 TOP 10
뉴스
기사
MS, 윈도우 11에서 마침내 FAT32 포맷 32GB 용량 제한 해제
갤럭시 워치, 최신 업데이트 이후 '배터리 광탈' 이슈.. 구글 플레이 서비스가 원인?
애플, 아이폰 폴드 출시 앞두고 폴더블 패널 주문량 20% 늘려
갤럭시 -> 아이폰 보낸 사진, EXIF 데이터 손실 오류 발견
퀄컴, 중국 CXMT와 '독자 커스텀 DRAM' 공동 개발 루머
삼성, 2027년 보급형 스마트폰 ‘갤럭시 A18’ 개발 정황 포착
갤럭시S25 FE, 전용 앱 통해 ‘듀얼 레코딩 모드’ 다시 지원
삼성 차세대 폴더블폰, AI 기반 사기 탐지 기능 기본 탑재
삼성, 갤럭시S23 FE 'One UI 8.5' 베타 버전 출시 준비
삼성, 여권 디자인 새로운 ‘갤럭시Z 트라이폴드 와이드’ 개발 중?
뉴스
기사
붉은사막 쾌적 플레이 조건은 GPU, 정답은 SAPPHIRE 라데온 RX 9070 XT NITRO+ OC D6 16G 이엠텍
배틀그라운드 9주년 페스티벌 'Still Here, All Day'… 9년의 생존, 이제는 문화가 되다
2026 상반기 최고의 기대작 붉은사막, 플레이에 더 적합한 플랫폼은?
가성비로 경험하는 8K 게이밍 마우스, 앱코 A102 PRO 8K 무선과 A102 3모드 스탠다드 그립
마이크로닉스 2026 신제품 발표회 개최, AI 시대 전력·냉각 구조 반영한 신제품 라인업 발표
에이수스(ASUS), ROG 20주년 맞아 신제품 게이밍 기어 공개 및 DRX 파트너쉽 발표
개방감과 소음 제어의 공존을 꾀하다, 샥즈 '오픈핏 프로' 신제품 발표회
완전체로 진화한 엔비디아 DLSS 4.5, 동적 프레임 생성 괜찮나?
경쟁 게임을 위한 고주사율 모니터 선택, 제이씨현 BattleG 마하 420 BG25FS
게이밍 감성과 쿨링 중심 설계, 미들타워의 기준을 노리다, 앱코 G31 오메가포스