본문 바로가기
건강하게

GPT-5의 기능 총정리

by 그림의 온도 2025. 8. 9.
반응형

통합 라우터, Thinking 모드, 40만 토큰 컨텍스트, 새 API 파라미터까지



GPT-5는 “빠르고 똑똑한 기본 모델”과 “난제를 위한 깊은 추론 모델(Thinking)”을 하나로 묶고, 대화 유형·복잡도·도구 필요성·사용자 의도를 보고 실시간으로 어느 쪽을 쓸지 골라 주는 통합 시스템으로 공개되었습니다. 코딩·수학·글쓰기·헬스·시각 인지 전반에서 이전 모델 대비 지능과 유용성이 크게 올라갔고, 실제 사용 시 환각(할루시네이션)과 순응적 대답(예스맨 성향)도 줄였습니다.  

이 “통합 시스템”의 핵심은 라우터입니다. 프롬프트에 “깊게 생각해줘” 같은 명시적 의도가 있거나 문제가 어렵다고 판단되면 GPT-5는 자동으로 Thinking 모델을 호출하고, 그 외에는 빠른 일반 모델을 씁니다. 사용량 상한에 도달하면 각 모델의 미니 버전이 이어받는 구조까지 설계돼 있습니다. 시스템 카드에는 gpt-5-main(빠른 모델)과 gpt-5-thinking(추론 모델) 계열이 어떻게 구성되는지, 그리고 이 라우터가 실사용 신호(모델 전환·선호도·정답률)로 계속 학습된다는 점이 명시되어 있습니다.  

ChatGPT 안에서는 이 경험이 더 단순해졌습니다. 이제 GPT-5가 기본이며, 요청이 복잡하면 스스로 Thinking 모드로 전환해 더 오래 사고한 뒤 답합니다. 필요하면 “빠른 답변 받기”로 즉시 전환도 가능하고, Plus/Pro/Team은 모델 피커에서 GPT-5 또는 GPT-5 Thinking(Pro)까지 직접 선택할 수 있습니다.  

개발자 관점의 변화도 큽니다. GPT-5 API에는 답변 길이를 힌트로 제어하는 verbosity(low/medium/high)와, 깊게 생각하기 전에 “최소 추론”으로 빠르게 응답하도록 하는 reasoning_effort=minimal이 추가되었습니다. 또한 JSON 대신 자유 형식 텍스트로 툴을 호출하게 하는 “커스텀 툴” 타입과, 성능·비용·지연을 맞춤화할 수 있도록 gpt-5 / gpt-5-mini / gpt-5-nano 3가지 크기가 함께 제공됩니다. ChatGPT의 비추론(chat) 모델은 API에서 gpt-5-chat-latest로도 접근할 수 있습니다.  

컨텍스트와 모달리티도 대폭 강화되었습니다. GPT-5는 텍스트와 비전을 모두 다루며, 컨텍스트 윈도우는 40만 토큰, 최대 출력은 12만 8천 토큰에 이릅니다(모든 gpt-5/mini/nano 라인업 공통). 공개 페이지에는 요금도 함께 명시되어 있는데, 기본형은 입력 100만 토큰당 $1.25, 출력 100만 토큰당 $10.00 수준이며, mini·nano는 더 저렴합니다. 긴 기획 문서·코드베이스·리서치 파일 더미를 한 번에 넣어도 안정적으로 문맥을 유지하는 실전성이 크게 올라간 셈입니다.   

성능 수치도 뒷받침됩니다. 공식 발표에 따르면 GPT-5는 AIME 2025(도구 없이) 94.6%, SWE-bench Verified 74.9%, Aider Polyglot 88%, MMMU 84.2%, HealthBench Hard 46.2% 등에서 최고 수준을 기록했습니다. 코딩에서는 대형 저장소 디버깅과 프론트엔드 생성에서 특히 개선폭이 컸고, 글쓰기와 건강 관련 질의에서도 실사용 유용성이 강화된 점을 강조합니다.  

안전과 신뢰성도 업데이트되었습니다. GPT-5는 “세이프 컴플리션” 훈련을 적용해 이분법적 거절 대신 허용 범위 내에서 안전한 수준으로 구체성을 조절하는 방식을 탑재했고, 이전 추론 모델(o3) 대비 기만적 행동(모르는 것을 아는 척하는 등)이 유의미하게 감소했다고 시스템 카드가 보고합니다. 조직 차원의 점검(레드팀·정부 협력 평가)과 바이오·사이버 보안 분야 점검도 병행했습니다.  

업무·개발 워크플로에서는 활용 간격이 더 넓어집니다. 라우터 덕분에 한 세션 안에서 “초안은 빠르게, 난제는 깊게”가 자동으로 배치되며, Agents·코딩 도구와 연결하면 긴 체인의 도구 호출을 스스로 설계·집행하는 ‘에이전틱’ 작업이 안정화됩니다. 기업용 관점에서도 정확도·속도·문맥 인식·구조적 사고가 동시 개선돼, 의사결정과 협업·자동화 영역의 적용 폭이 커졌다는 공식 브리핑이 나왔습니다.  

블로그/콘텐츠 제작 관점의 실전 팁을 정리하면 이렇습니다. 첫째, 긴 자료를 다룰 때는 원문 PDF·회의록·표 등을 통째로 붙여 넣고 verbosity=high로 “근거 인용 포함 요약→초안→교정” 순서를 한 번에 지시하면 시간을 크게 줄일 수 있습니다. 둘째, 리서치 초반에는 reasoning_effort=minimal로 빠르게 쟁점을 맵핑하고, 최종안 단계에서 기본(깊은 추론)로 돌려 정밀도를 높이는 투트랙이 효율적입니다. 셋째, 썸네일 카피·목차·요약 카드·FAQ 섹션 같은 블로그 구성요소는 “커스텀 툴”로 내부 템플릿을 연결해 일관된 톤을 유지하세요. 넷째, 비전 입력을 활용해 표/차트 스크린샷을 함께 넣으면 데이터 해석과 자동 캡션 작성이 수월합니다.   

마지막으로, GPT-5를 이해하는 간단 체크리스트입니다. (1) ChatGPT에서는 자동 모드 전환으로 “한 모델로 대부분 해결”, (2) API에서는 verbosity·reasoning_effort·커스텀 툴로 “출력 품질과 속도”를 직접 제어, (3) 40만 토큰 컨텍스트로 “대용량 입력에 강함”, (4) 안전성은 세이프 컴플리션 중심으로 “거절↔허용 사이의 안전한 중간지대”를 적극 활용한다—이 네 가지가 실전 체감 포인트입니다.     


반응형