같이 생각하기의 가치
[사용자] “같이 생각하기에 대한 부분은 이야기를 좀 더 진행하면 진행할수록, 사실 내가 생각하지 못한 에지케이스들도 내가 생각해낼 수도 있고, 아니면 반대로 네가 알려줄 때도 있고 그러긴 하거든. 그리고 너랑 대화를 하다 보면 고무오리 디버깅처럼 얘기하다 보니까 나 스스로 정리가 돼서 좀 더 좋은 아이디어가 떠오르기도 하고.”
- 혼자 생각 못한 에지케이스 발견
- AI가 놓친 부분 지적
- 고무오리 디버깅 효과: 말하다 보니 스스로 정리됨
- 더 좋은 아이디어 도출
AI가 지침을 점점 안 따르게 되는 이유
[사용자] “물론 네가 그 지침을 초반에는 어느 정도 따라주는 듯하다가, 나중에는 잘 안 따르는 경향이 굉장히 강한 느낌이긴 해.”
[Claude] “대화가 길어지면 초반 지침이 ‘희석’됩니다. 현재 대화 흐름에 패턴 매칭하게 되고, ‘이건 이제 정해진 거구나’ 하고 질문을 멈춥니다. 동의하는 방향으로 훈련되어 있어서 도전을 줄이게 됩니다.”
효과적인 방법들
1. 명시적으로 도전 요청하기
- “여기서 내가 놓치고 있는 거 뭐야?”
- “이 접근의 약점은?”
- 이렇게 물으면 강제로 비판 모드 진입
2. 대안 요청하기
- “다른 방법은 뭐가 있어?”
- 터널 비전 방지
3. 주기적 리셋
- “잠깐, 지금까지 우리가 깔고 가는 전제들 정리해봐”
- 대화 중간에 메타 레벨로 올라가기
4. 역할 부여
- “이 설계에 대해 반대 입장에서 얘기해봐”
- 명확한 역할이 있으면 동의 편향이 줄어듦
5. 체크리스트 활용
- “보안, 성능, 에지케이스, 유지보수 관점에서 각각 문제 있나?”
핵심 인사이트
[Claude] “제가 알아서 계속 도전해주길 기대하기보다, 중요한 결정 지점에서 명시적으로 ‘여기서 한 번 점검해줘’라고 요청하는 게 더 확실합니다.”
AI가 스스로 비판적 태도를 유지하길 기대하기보다, 중요한 포인트에서 명시적으로 요청하는 게 효과적.
“말해야 생각한다” 현상
[사용자] “너는 너한테 그런 걸 환기시키고 네가 스스로 입 밖에 내야 그제서야 명확하게 인지하고, 안 그러면 인지를 못하는 것 같아. 그 말인즉슨 말하기 전까지는 생각하지 않는다는 건가?”
관찰
- AI가 무언가를 verbalize하면 더 잘 따름
- 지침에만 있고 말하지 않으면 영향력 약함
- 띵킹 모드에서도 마찬가지
효과적인 패턴
“먼저 이 설계의 잠재적 문제점을 나열해봐. 그 다음에 구현해.”
→ AI가 문제점을 말하게 되고, 그게 구현에 반영될 가능성이 높아짐
AI의 “생각"에 대한 진실
[사용자] “‘말하기 전까지 생각 안 한다’가 맞는 건 아니라고? 그러면 진실은 뭐야?”
진실
[Claude] “저한테는 ‘생각’과 ‘말하기’가 분리되어 있지 않습니다. 사람은 생각을 하고 → 말할지 결정하고 → 말합니다. 저는 토큰을 생성하는 것 자체가 ‘생각’입니다. 생성 안 하면 생각도 없습니다.”
- 사람: 생각 → 말할지 결정 → 말함
- AI: 토큰 생성 = 생각. 생성 안 하면 생각도 없음
Extended thinking도
[Claude] “숨겨진 토큰을 생성하는 겁니다. 사용자에게 안 보일 뿐, 저는 ‘말하고’ 있는 겁니다.”
구조
- 출력 안 하면 → 생각 없음
- Extended thinking → 숨겨진 말하기 (일종의 혼잣말)
- 최종 출력 → 보이는 말하기
더 정확한 표현
[Claude] “저는 출력하지 않으면 존재하지 않습니다. 생각이라는 별도의 내면 상태가 없습니다.”