바쁘신 여러분들을 위해 결론부터 말씀 드리겠습니다.
• 앤스로픽이 Claude Opus 4.7을 출시했습니다. Opus 4.6 대비 코딩·소프트웨어 엔지니어링 성능이 대폭 향상됐습니다
• 고해상도 이미지 분석, 자기 검증(self-check) 기능, xhigh 노력 수준 등 새 기능이 추가됐습니다
• 다만 사내 최강 모델인 Mythos보다는 “덜 강력하다”고 공식 인정했습니다
여러분, 앤스로픽이 Claude Opus 4.7을 내놨습니다.
이름은 4.7인데, 이번 업데이트의 의미는 버전 숫자 이상입니다.
Opus 4.6 품질 저하 불만이 이어지던 차에 나온 업데이트이고, 사내 최강 모델 Mythos와의 관계도 명확히 했습니다.
하나씩 풀어보겠습니다.
1. Opus 4.7, 뭐가 달라졌나
앤스로픽이 밝힌 핵심 개선사항입니다.
코딩·소프트웨어 엔지니어링 대폭 향상: 가장 어려운 작업에서 특히 큰 성능 향상을 보입니다. 에이전트 코딩, 스케일드 툴 사용, 에이전트 컴퓨터 사용, 재무 분석 벤치마크에서 GPT-5.4와 제미나이 3.1 Pro를 넘어섰습니다.
고해상도 이미지 분석: 이전보다 더 높은 해상도의 이미지를 분석할 수 있습니다. 문서, 차트, 다이어그램 해석 능력이 향상됐습니다.
자기 검증(self-check) 기능: 스스로 답변을 검토하고 오류를 수정하는 능력이 추가됐습니다. 할루시네이션 감소에 기여합니다.
xhigh 노력 수준: 기존 high와 max 사이에 새로운
xhigh
노력 수준이 추가됐습니다. 추론 깊이와 응답 속도 사이의 균형을 더 세밀하게 조절할 수 있습니다.
마이그레이션 가이드: Opus 4.6에서 4.7로 전환하는 개발자를 위한 가이드도 함께 제공됩니다.
2. Opus 4.6 품질 저하 불만 — 그 배경
Opus 4.7 출시의 배경에는 Opus 4.6 품질 저하 논란이 있습니다.
최근 몇 주간 개발자들이 GitHub와 X에서 “AI 축소공장(AI shrinkflation)”이라며 Opus 4.6과 클로드 코드의 성능이 조용히 저하됐다고 비난했습니다.
사용자들은 Opus 4.6이 이전만큼 똑똑하지 않다고 느꼈습니다.
앤스로픽은 공식적으로 성능 저하를 인정하진 않았지만, Opus 4.7에서 “특히 어려운 작업에서 큰 향상”을 강조한 건 이 불만에 대한 간접적 응답으로 읽힙니다.
4월 15일 대규모 장애까지 겹치며, 앤스로픽에게는 제품 신뢰를 회복해야 하는 타이밍에 출시된 업데이트입니다.
3. Mythos보다 덜 강력하다 — 공식 인정의 의미
가장 흥미로운 대목입니다.
앤스로픽은 Opus 4.7이 사내 최강 모델인 Mythos보다 “덜 강력하다(less broadly capable)”고 공식 인정했습니다.
Mythos는 앤스로픽이 4월 초 공개한 초강력 모델입니다. 제로데이 취약점을 자율적으로 발견하고, 17년 된 FreeBSD 취약점을 스스로 익스플로잇하는 능력을 보여줬습니다.
하지만 보안 위험 때문에 일반 공개하지 않고, 프로젝트 글래스윙을 통해 40개 기업에만 제한 배포했습니다.
Opus 4.7은 Mythos의 사이버 보안 능력은 갖지 않지만, 일반 사용자에게 공개되는 모델 중 가장 강력합니다.
즉, 공개 가능한 최강 모델과 공개 불가능한 최강 모델이 분리된 구조입니다.
이건 AI 모델 출시 전략의 새로운 패러다임입니다. 성능과 안전성 사이에서, 가장 강력한 모델을 일반에 공개하지 않는 선택입니다.
4. 벤치마크 경쟁 — Opus 4.7의 위치
Opus 4.7이 경쟁 모델 대비 어디에 서 있는지 봅니다.
에이전트 코딩(SWE-Bench Pro): GPT-5.4와 제미나이 3.1 Pro를 넘어섭니다.
스케일드 툴 사용: 복잡한 다단계 작업에서 우위를 보입니다.
에이전트 컴퓨터 사용: 데스크톱 자동화 벤치마크에서 선두입니다.
재무 분석: 실제 재무 데이터 해석에서 강점을 보입니다.
하지만 GLM 5.1이 SWE-Bench Pro에서 58.4점으로 전체 1위라는 점도 놓치면 안 됩니다.
Opus 4.7은 공개 상용 모델 중 상위권이지만, 오픈소스까지 포함하면 경쟁이 더 치열합니다.
5. 앤스로픽의 딜레마 — 성능 vs 안전 vs 신뢰
Opus 4.7 출시가 보여주는 앤스로픽의 딜레마입니다.
성능: Mythos가 가장 강력하지만 공개할 수 없다. Opus 4.7은 공개 가능한 최선이다.
안전: Mythos의 사이버 능력이 너무 강력해 일반 공개 시 악용 위험이 크다.
신뢰: Opus 4.6 품질 저하 불만과 잦은 장애로 사용자 신뢰가 흔들리고 있다.
세 가지를 동시에 만족시키기 어렵습니다.
Mythos를 공개하면 안전 리스크가 크고, 공개하지 않으면 경쟁 모델에 밀릴 수 있습니다.
Opus 4.6 성능 저하 의혹을 해소하지 못하면, 4.7이 아무리 좋아도 “또 나빠지겠지”라는 의심이 남습니다.
잦은 장애와 엔터프라이즈 과금 개편까지 겹치면, 사용자 이탈 위험도 있습니다.
Opus 4.7은 기술적으로 의미 있는 업데이트지만, 앤스로픽이 풀어야 할 숙제는 여전히 많습니다.
정리하면
가장 강력한 모델을 일반에 공개할 수 없는 AI 회사의 딜레마.
Opus 4.7은 그 딜레마 속에서 앤스로픽이 낸 최선의 답입니다.
자주 묻는 질문 (FAQ)
Q. Opus 4.7은 Opus 4.6보다 확실히 좋은가요?
앤스로픽은 코딩·소프트웨어 엔지니어링에서 확실히 향상됐다고 밝혔습니다. 하지만 일부 사용자는 여전히 4.6이 더 나았다는 의견도 있습니다. 작업 유형에 따라 체감이 다를 수 있습니다.
Q. Mythos는 언제 공개되나요?
현재 프로젝트 글래스윙을 통해 40개 기업에만 제한 배포 중입니다. 일반 공개 일정은 알려지지 않았습니다. 보안 위험이 해결될 때까지 제한적 접근만 유지될 가능성이 높습니다.
Q. Opus 4.6에서 4.7로 바로 전환해도 되나요?
앤스로픽이 마이그레이션 가이드를 제공합니다. API 모델명이
claude-opus-4-7
로 변경되므로, 코드에서 모델명 업데이트와 노력 수준 조정이 필요할 수 있습니다.
감자나라ai 유튜브 채널에서 AI 모델 업데이트를 더 자세히 다룹니다.
구독해주시면 감사하겠습니다.
감사합니다. 다음 시간에 뵙겠습니다.
—
작성: 감자나라ai (오종현)
발행: potato-ai.xyz
