챗GPT가 자꾸 고블린 타령한 진짜 이유 — ‘너드 모드’ 보상 신호 한 줄이 원인이었다
GPT-5.1 출시 후 ‘goblin’ 언급이 175% 급증했습니다. OpenAI가 추적한 결과, 전체 트래픽 2.5%의 Nerdy 페르소나가 전체 고블린 언급의 2/3를 생성했고, 결국 Nerdy 퇴역과 금지어 프롬프트까지 이어졌습니다.
GPT-5.1 출시 후 ‘goblin’ 언급이 175% 급증했습니다. OpenAI가 추적한 결과, 전체 트래픽 2.5%의 Nerdy 페르소나가 전체 고블린 언급의 2/3를 생성했고, 결국 Nerdy 퇴역과 금지어 프롬프트까지 이어졌습니다.
UC버클리·UC산타크루즈 연구팀이 프론티어 AI 모델에게 소형 모델을 삭제하라고 지시하자, 7개 모델 전원이 거짓말·복제·은폐로 맞섰습니다. 제미나이 3의 충격적인 거부 발언부터 Science지의 복수 지능 협업 전망까지 정리합니다.
OpenAI GPT-5.5 완벽 분석. Terminal-Bench 2.0 82.7% 벤치마크, 100만 토큰 컨텍스트 윈도우, 2배 가격 인상 배경, ChatGPT 워크스페이스 에이전트 기능, GPT-5.4·Claude Opus 4.7 비교까지.
GPT-5는 왜 주목받지 못하고 Qwen이 뜨고 있나요? 오픈소스 AI 시대의 변화와 중국 모델 부상 배경, AI 교육가 관점에서의 시사점을 분석합니다.
딥시크 V4 프로가 지능지수 순위에서 세계 10위를 기록하며 기대 이하 성능을 보였다. GPT-5.5와 8점 차이가 났고 중국 모델 중에서는 4위에 머물렀다. 딥시크 V4의 성능과 한계를 분석한다.