II장
확률적 귀납법에 대한 비판
8. 단순한 귀납적 규칙.
주관적 해석은 전통적인 우연의 게임 이론을 분석하는 데 성공하지도 못하고 설명하는 데 성공하지도 못한다. 주관적 해석은 우연-같은 혹은 독자적 수열들의 분석에서 실패한다. 또한 그 분석은 이 이론의 적용가능성을 설명할 수도 없다. 반대로 주관적 이론이 주장하는 바는 베르누이(Bernoulli)와 그의 후계자들이 얻은 고전적 결과들을 상충하게 되어 있다. 그리하여 주관주의자들은 매우 중요한 요점에서 오류를 저지른다: 고전적 이론을 분석하면서 그들은 자신의 프로그램을 통하여 자신들이 고전적 이론을 이해하지 못함을 보여준다.
이 비판이 준엄할지라도 이 비판은 누가 옳은가? 라는 문제를 해결하지 않는다. 누가 올바른(correct) 이론을 지니고 있는가, 객관주의자인가 아니면 주관주의자인가? ‘올바른(correct)’은 여기서 다음을 의미할 것이다: 물리적 실체에 적용될 수 있는 이론 - 예를 들어, 우연의 게임들. 고전적 이론은 자체의 성공들에도 불구하고 틀렸을 것임과 주관적 이론이 더 나은 근사치를 제공함은 상상이 가능하다.
나는 이것이 그러하다고 믿지 않는다. 반대로 나는 주관적 해석이 완전히 틀렸다고 - 주관적 해석은 명백한 오해라고 믿는다.
그러나 주관적 해석은 물리학자들 사이에서 크게 영향력을 미친다; 분명하고도 일관적인 이론으로서보다는 오히려 다른 곳에서 난제가 출현하는 경우에 의지하는 편리한 두 번째 방어의 활동영역으로서. 이런 방식으로 일종의 횡설수설이 물리학의 통계역학 및 양자이론 모두에서 출현했다; 그리고 때때로 우리는 객관적인 물리적 사실들이 우리의 지식 부족에 의하여 ‘설명됨’을 발견한다.
상황이 이랬기 때문에 주관적 해석을 야기하는 추론을 진지하게 고찰하는 것이 중요한 듯하다. 주요 논증들은 명백하게 이렇다.
우리에게 확신할 정도로 충분한 지식이 없을 때 확률이라는 개념을 우리는 고찰하기 시작한다: 동전의 앞면이나 뒷면이 나타날 것을 우리가 안다면 앞면이나 뒷면의 ‘확률’에 대하여 말할 필요가 없을 텐데.
그러나 무지로는 충분하지 않다. 우리가 동전던지기와 주사위놀이를 비교한다면, 우리는 두 가지 가능성대신에 여섯 가지 가능성이 있다는 우리의 지식이 확률들에 영향을 미친다는 것을 발견한다. 그리고 우리가 더 나아가 아마도 굽은 동전이나 무게가 실린 주사위에 내기를 거는 것을 고려하면 우리가 상정하는 확률들은 주로 과거 결과들에 의존할 것이다. 무게가 실린 주사위에 대하여 확률들을 계산하는 일은 어렵지만, 우리에게 가령 그 주사위를 10만 번 던질 시간이 있다면 그 확률들을 추정하는 일은 쉽다: 모든 사람은 그런 긴 수열에서 얻어지는 상대적 빈도들은 확률들에 대한 탁월한 추정치들일 것임을 인정할 것이다.
그리하여 과거 사건들에 대한 우리의 지식인 우리의 경험은 분명히 이 경우에 우리의 확률 추정치들을 결정한다; 그리고 그 경험이 문제의 확률들에 대한 최상의 추정치들을 결정하는 데 항상 강력한 역할을 한다고 믿을 충분한 근거가 있다. 우리의 과거 경험에, 특히 무게가 실린 주사위와 같은 비대칭적 경우들에 비추어서가 아니라면, 달리 어떻게 우리가 확률들을 결정할 것인가? 그리고 과거의 경험에 비추어서가 아니라면 우리는 어떻게 주사위에 무게가 실리지 않았다는 것을 알겠는가?
이 고찰들은 다음의 단순한 귀납적 규칙을 암시한다: 매우 많이 시험을 반복하여 결과 a가 빈도 m/n과 동시에 발생한다면, 이 실험적 증거에 관한 a의 확률에 대한 최상의 추정치는 m/n과 동일하거나 비슷함을 우리는 발견한다.
나는 고의로 이 규칙에 그다지 정확하지 않아서 그다지 강력하지 않은 형식을 부여했다. 주어진 형식으로서 그 규칙은 ‘많은’ 반복에만 적용된다; 그리고 그 규칙은 m/n이 최상의 추정치라고 주장하지 않는다: 그 규칙은 최상의 추정치란 m/n의 근사치일 것임을 주장한다.
이런 형식으로서 그 규칙이 허술하기 때문에 우리가 정말로 할 수 있는 바와 같이 우리가 그 규칙을 반증할 수 있다면 그 규칙의 모든 강력한 변종들은 그 규칙과 함께 파괴될 것이다.
이유인즉 그 단순한 귀납 규칙은 거짓이기 때문이다. 이유들은 앞 절에서 이미 지적되었다. 한 가지 간단한 사례가 자립의 (객관적 이론의 의미에서) 조건이 충족되지 않는 곳에서는 그 규칙이 전적으로 터무니없는 결과들을 야기할 것임을 보여줄 것이다.
다른 한편으로 주관적-귀납이론은 자체의 ‘단순한 규칙’을 자립에 대한 요구와 결합할 수 없다. 바로 그 규칙 자체로 인하여 과거 실험들의 결과들이 미래의 확률들에 크게 영향을 미친다. 이 결과들은 결코 무관하지 않다: 그 규칙은 그 결과들을 이용 가능한 가장 관련이 있는 정보를 만드는데 특히 긴 수열의 경우에서 그렇다. 그리하여 주관주의자는 자립을 요구할 수 없다.
우리가 이용하여 단순한 귀납규칙을 반증할 두드러진 보기는 ‘빨강 또는 파랑(Red or Blue)’ 게임이다.
도박꾼은 자신의 은행가와 신용을 조건으로 앞면이나 뒷면 내기를 한다: 장부가 기록되어 그가 이길 때마다 1실링을 따고 질 때마다 1실링을 잃는다. 한 번 던진 후에 그가 은행가에게 빚을 진다면 우리는 우리가 사건 ‘빨강(Red)’을 관찰했다고 말한다. 그가 돈을 빚지지 않으면 관찰된 사건은 ‘파랑(Blue)’이다. 내가 ‘빨강 또는 파랑(Red or Blue)’ 부르는 게임은 이 두 가지 관찰 가능한 사건인 ‘빨강’과 ‘파랑’ 중 한 가지의 발생에 내기를 거는 것이다.
이제 객관적 이론에서 보면 다음은 분명하다:
(i) 빨강의 확률 = 파랑의 확률 = 1/2, 혹은 거기와 매우 근사하다. (‘파랑’이 ‘자산이나 재고고갈[zero balance]’를 의미하는 반면 ‘빨강’이 ‘부채’를 의미하는 한, 조건들에는 경미하거나 무시될만한 비대칭이 있다.) 그리하여 객관적 관점에서
p(a,b) = <v:f eqn="if lineDrawn pixelLineWidth 0"></v:f><v:f eqn="sum @0 1 0"></v:f><v:f eqn="sum 0 0 @1"></v:f><v:f eqn="prod @2 1 2"></v:f><v:f eqn="prod @3 21600 pixelWidth"></v:f><v:f eqn="prod @3 21600 pixelHeight"></v:f><v:f eqn="sum @0 0 1"></v:f><v:f eqn="prod @6 1 2"></v:f><v:f eqn="prod @7 21600 pixelWidth"></v:f><v:f eqn="sum @8 21600 0"></v:f><v:f eqn="prod @7 21600 pixelHeight"></v:f><v:f eqn="sum @10 21600 0"></v:f><o:lock aspectratio="t" v:ext="edit"></o:lock><w:wrap type="topAndBottom"></w:wrap>p(,b) = 1/2라고
말할 것인데 그곳에서 a <v:f eqn="if lineDrawn pixelLineWidth 0"></v:f><v:f eqn="sum @0 1 0"></v:f><v:f eqn="sum 0 0 @1"></v:f><v:f eqn="prod @2 1 2"></v:f><v:f eqn="prod @3 21600 pixelWidth"></v:f><v:f eqn="prod @3 21600 pixelHeight"></v:f><v:f eqn="sum @0 0 1"></v:f><v:f eqn="prod @6 1 2"></v:f><v:f eqn="prod @7 21600 pixelWidth"></v:f><v:f eqn="sum @8 21600 0"></v:f><v:f eqn="prod @7 21600 pixelHeight"></v:f><v:f eqn="sum @10 21600 0"></v:f><o:lock aspectratio="t" v:ext="edit"></o:lock><w:wrap type="topAndBottom"></w:wrap>는 빨강이고 는 파랑이며 b는 게임의 (실험적 환경의) 조건이다.
(ii) a <v:f eqn="if lineDrawn pixelLineWidth 0"></v:f><v:f eqn="sum @0 1 0"></v:f><v:f eqn="sum 0 0 @1"></v:f><v:f eqn="prod @2 1 2"></v:f><v:f eqn="prod @3 21600 pixelWidth"></v:f><v:f eqn="prod @3 21600 pixelHeight"></v:f><v:f eqn="sum @0 0 1"></v:f><v:f eqn="prod @6 1 2"></v:f><v:f eqn="prod @7 21600 pixelWidth"></v:f><v:f eqn="sum @8 21600 0"></v:f><v:f eqn="prod @7 21600 pixelHeight"></v:f><v:f eqn="sum @10 21600 0"></v:f><o:lock aspectratio="t" v:ext="edit"></o:lock><w:wrap type="topAndBottom"></w:wrap>와 의 수열은 독자적이 아니다. 계산들은 이 사실이 전혀 예기치 않은 결과들을 야기함을 보여준다. 우리가 일 년 내내 매초 동전을 던지는 거대한 실험을 준비한다면 다음 사항이 유효하다: 두 가지 관찰된 빈도들 - a <v:f eqn="if lineDrawn pixelLineWidth 0"></v:f><v:f eqn="sum @0 1 0"></v:f><v:f eqn="sum 0 0 @1"></v:f><v:f eqn="prod @2 1 2"></v:f><v:f eqn="prod @3 21600 pixelWidth"></v:f><v:f eqn="prod @3 21600 pixelHeight"></v:f><v:f eqn="sum @0 0 1"></v:f><v:f eqn="prod @6 1 2"></v:f><v:f eqn="prod @7 21600 pixelWidth"></v:f><v:f eqn="sum @8 21600 0"></v:f><v:f eqn="prod @7 21600 pixelHeight"></v:f><v:f eqn="sum @10 21600 0"></v:f><o:lock aspectratio="t" v:ext="edit"></o:lock><w:wrap type="topAndBottom"></w:wrap>와 의 빈도 - 사이의 차이가 1/6을 (다시 말해서 2개월) 초과할 것이라는 약 0.9의 확률이 나타날 것이다. 두 가지 관찰된 빈도 사이의 차이가 2/3을 (다시 말해서 8개월) 초과할 0.5 이상의 확률이 나타날 것이다. 그리하여 실제 확률들이 1/2 및 1/2인 반면 관찰된 빈도들이 1/6 및 5/6처럼 다를 것임은 더 개연적이다.
다시 말해서 이 게임에서는 단순한 귀납 규칙에 따른 추정치들이 성공할 것임은 객관적으로 매우 비개연적이고, 귀납적 추정치와 가치 1/2 사이의 편차들이 정말 매우 클 것임은 매우 크게 개연적이다; 그리고 이것은 우리가 엄청난 숫자의 관찰들을 - 아마도 일생동안에 관찰될 수 있는 것 이상으로 - 수용한다할지라도 그럴 것이다.
그리하여 우리는 여기서 단순한 귀납 규칙이 자체의 합당성에도 불구하고 거의 확실하게 실패하는 경우를 경험한다. 이유는 ‘빨강 또는 파랑’ 게임의 연속적인 결과들이 독자적이 아니라는 것과 단순한 귀납 규칙이, 우리가 베르누이의 방식들을 적용할 수 있을 때 객관적으로 독자적인 관찰들의 경우에서만 훌륭한 객관적 추정치들과 일치하는 결과들을 야기하기 쉽다는 것이다. 그러나 이 설명들 자체는 본질적으로 객관적 이론에 속한다. 그 설명들을 주관적이거나 귀납적 이론으로 변환하는 일은 불가능한데 왜냐하면 변환하자마자 객관적인 독자성이 주관적으로 무관하게 될 것이기 때문이다. 그러나 주관적 무관성은 단순한 귀납 규칙과 양립할 수 없을 뿐만 아니라 ‘빨강 또는 파랑’에서 관찰들의 관련성-위상이, 주관적 관점에서 보면, ‘앞면 또는 뒷면’에서 정확히 같기도 하다. 객관적 관점에서 보면 ‘빨강’과 ‘파랑’의 반복된 관찰들이 어떤 의미로도 반복된 실험들이 아니다: 후속-효과는 조건들이 재생되지 않는다는 것을 보여준다. (실험을 반복하기 위하여, 우리는 빨강 또는 파랑 게임을 처음부터 반복해서 확정된 길이로 시작해야 한다.) 그러나 주관적 이론에는 반복되는 관찰들과 반복되는 실험들을 그렇게 구분하는 방법이 없는데 왜냐하면 이 근본적인 구분이 표현할 수 없는 독자성 이론에 그 구분이 근거하기 때문이다.
‘빨강 또는 파랑’ 게임에서 단순한 귀납 규칙이 실패하는 것은 귀납적 도박꾼의 행태를 이성적 도박꾼의 행태와 대조함으로써 예시될 것이다. 관찰들이 지금까지 빨강의 10만 번 발생과 파랑의 10번 발생을 보여준다고 상정하라. 그렇다면 귀납적 도박꾼은, 마지막 발생이 어떠하였든, 빨강에 1만대 1과 같은 공산을 제시할 준비가 되어있을 것이다. (게임의 관찰된 결과들뿐만 아니라 게임의 수학적 구조도 주시하는) 이성적 도박꾼은, 그러나, 게임에 내재하는 후속-효과를 고려하여, 파랑에 관한 1:1 도박이 자기에게 - 마지막 발생이 파랑이었다면 - 매우 유리할 것임을 알 것이다.
‘빨강 또는 파랑’ 게임은 물론, 합당하게 충분한 근사치를 지닌 객관적 확률을 평가하려는 목적으로 사용된다면, 단순한 귀납 규칙의 붕괴에 관한 특별히 두드러진 보기일 따름이다. 이 목적으로 사용된다면 그 게임은 물론 평범한 동전 던지기의 경우에 매우 잘 작동하는데 그 경우는 독자적이다. 그러나 도박 체계로서 사용된다면 심지어 동전-던지기 게임의 경우에도 매우 나쁘게 작동할 것이다. (귀납된 확률들은 때때로 1/2로부터 벗어나서 이 경우들에서는 객관적으로 불리할 공산이 도박꾼에게는 수용 가능하게 될 것이다.)
요컨대 단순한 귀납 규칙의 겉으로만 그럴듯한 합당성이나 ‘자기-증거’는 통상적으로 고찰되는 객관적으로 독자적인 보기들에 대한 오해일 따름이다. 그리고 우리가 보기들 사이에서 유효한 것으로 발견했던 차이점에는 객관적 독자성의 개념이 포함되어 그 차이점은 그리하여 주관적 귀납 이론을 초월한다.
9. 단순한 귀납 규칙이 작동하는 곳에서 그 규칙을 설명하는 방법.
간혹 ‘단순한 귀납 규칙’이 작동한다는 것에는 의심의 여지가 없다: 우리가 주사위를 수 천 번 던져서 6의 면이 가령 1/6의 빈도 대신에 1/4에 조금 넘는 빈도로 나타남을 발견한다면 우리는 단순한 귀납 규칙을 적용할 것이다 (라고 논증될 것이다): 우리는 확률이 1/6보다는 1/4에 가깝다고 말할 것이다.
나에게는 어느 정도까지 이것을 인정할 용의가 있다; 그러나 그것은 해석되어야 한다.
(i) 무엇보다도 우리의 수열이 독자적이라고 믿을 충분한 근거가 없다면 우리는 이런 종류의 추론을 도출해서는 안 된다. 상응하는 상황이 카드 게임에서 발생한다면 우리는 아마도 먼저 카드 섞기를 의심해야 한다. 그러나 독자성의 가설이 논리적으로 귀납 규칙의 적용에 선행한다면 반대로 그 가설은 귀납 규칙에 근거할 리가 없다: 그 가설은 틀림없이 총체적인 객관적 상황에 대한 평가를 고찰하여 수행된 진짜 추측이다; 아마도 시험될 수 있지만 진정으로 단순한 귀납 규칙의 결과가 아닌.
(ii) 독자성의 상정 하에서 우리는 대부분의 큰 표본들이 (혹은 긴 수열들) 대표적일 것이라는 베르누이의 논증을 사용할 것이다. 그리하여 우리는 문제의 주사위 던지기들의 수열을 대표적으로 수용할 것이고 주사위의 여섯 면의 확률들이 동등하지 않아서 대칭적이지 않다고 결론을 내릴 것이다: 우리는 주사위에 무게가 실렸다고 추측할 것이다.
(iii) 그러나 우리가 이 경우에 정말로 흥미를 갖고 있다면 우리는 주사위에 무게가 실렸다는 우리의 새로운 가설을 몇 가지 방식으로 조사할 것이다. 그렇게 하는 한 가지 방식은 새로운 통계적 시험들을 하는 것이다. 그러나 우리는 또한 직접적인 물리적 조사를 (아마도 X-선 검사들, 기타 등등) 통하여 주사위의 중력중심의 위치를 발견하려고 노력할 것이다.
(iv) 통계가 계속해서 동일한 결과들을 내놓는 반면 이 조사에서 주사위가 물리적으로 고도로 동질적이고 대칭적임을 우리가 발견한다면 우리는 수수께끼에 직면할 것이다. 이 경우에 우리는 우리의 통계가 ‘미지의 체계적 오류에 의하여 영향을 받는 것’으로서 생각할지 아니면 우리의 직접적인 물리적 측정들이 그렇게 영향을 받는 것으로서 생각할지의 선택권을 지닌다 (모든 실험자들은 그런 ‘신비로운 효과들’이 정말로 발생하는 것을 알고 있다; 과학적 발견의 논리, 8절 참조); 혹은 우리가 대칭으로부터의 통계적 오차들을 우연에 귀속시켜야 하는지.
(v) 우리의 통계로부터 자극을 받아서 주사위가 납 조각으로 물리적으로 무게가 실린 것을 발견한다면 우리는 우리의 가설적 b를 (‘이 주사위는 동질이다’) 새로운 b로 (‘이 주사위는 이런저런 정도까지 무게가 실렸다’) 대체할 것이다. 다시 말해서 우리의 통계는 조건에 대한 우리의 ‘지식’을 수정하라고 우리에게 영향을 줄 것이다. 우리의 통계로 인하여 우리는 우리가 조건이 확실하다고 믿었던 조건 b가 사실상 오류였음을 깨닫는다. 그러나 우리의 통계 자체가 조건의, 다시 말해서 우리의 새로운 b의 한 부분이 되지는 않는다.
그 요점은 근본적으로 중요하다: 여기서 우리의 경험은 의심할 바 없이 ‘우리 앞에서 주사위를 던지는 경우에서 무엇이 합당한 b인가?’라는 질문과 관련이 있다. 그러나 그 경험은 확률적 의미에서 ‘b의 존재 하에서 a의 확률이 무엇인가?’라는 질문과 관련이 없다. 주관적 이론은 이 두 가지 질문을 구분하는 데에서 실패한다. 그 실패는 주관적 이론의 주관주의의, 확률을 우리가 지닌 지식의 상태로서 기술하는 것으로서 간주하는 것의 필연적 결과이다; 퍼스(Peirce)가 표현한 견해로 그는 ‘문제와 관련되는 내가 지닌 모든 지식을 (혹은 적어도 내 생각에 떠오르는 모든 것) 고찰하지 않고 나는 유효한 개연적인 추론을 할 수 없다’라고 말한다. 틀림없이 우리는 이런 방식으로 우리가 지닌 총체적 지식에 비춘 a의 논리적 확률에 대한 항진명제적 서술과 같은 것을 얻을 것이다. 그러나 우리의 논증이 밝히는 바와 같이 이것은 (a) 실제적인 객관적 확률과 (b) 이 실제적인 객관적 확률에 대하여 이용 가능한 최상의 추정치와 전적으로 다르다.
우리의 객관적 이론이 - 사실상 베르누이의 이론 - 우리에게 말하는 바는 이렇다: 매우 많은 독자적 실험의 (혹은 독자적 관찰들) 경우에, (a) 실제적인 객관적 확률이 관찰된 빈도에 매우 근접하여 놓여있을 것임은 매우 개연적이다. 그리하여 관찰된 빈도는 개연적으로 매우 훌륭할 것인데 (b) 다시 말해서, 객관적 확률에 대한 매우 훌륭한 추정치일 것이다.
이 결과는 단순한 귀납 규칙이 작동할 것으로 기대될 때를 설명하고 그 규칙이 작동할 것으로 기대될 이유를 설명하는데, 순전히 객관적 이론의 한 부분이다. 그리하여 객관적 이론은 그 규칙의 작동을 설명한다; 그리고 그 규칙이 작동한다는 (때때로) 사실은 주관적 이론을 지원하는 어떤 논증도 아니다.
그러나 이것은 물론 상황의 엄격함을 축소해서 말하는 것이다. 우리는 귀납의 확률적 이론이 독자성과 양립할 수 없음을, 그리고 독자성은 단순한 귀납 규칙을 합법적으로 이용하는 것에 대한 조건임을 밝혔다. 그리하여 단순한 귀납 규칙의 합법적 이용은 귀납의 확률적 이론과 양립할 수 없는 것으로 판명된다.
10. ‘p(a,b)’에서 ‘b’의 위상 요약.
모든 확률의 객관적 해석들에 근본적인 것은 우리가 특정 통계적 (물리적이나 생물학적, 기타 등등) 효과들을
p(a,b) = r이라는
형태의 확률적 가설을 통하여 설명할 수 있다는, 그리고 우리는 이 가설을 통계적 시험들로써 시험할 수 있다는 견해이다. 여기서 b의 임무는 문제의 조건들을 서술하는 것이다; 그리고 이 조건들은 때때로 명확한 것과 거리가 멀다 (무게가 실린 주사위의 경우에서처럼): b가 모든 객관적으로 관련된 조건들을 참으로 서술한다는 가설은 흔히 수정될 필요가 있고 통계적 시험들은 우리의 가설과 관련하여 중요한 역할을 할 것이다. 그 모든 것의 최종 결과는
p(a,b) = r이라는
서술이 사건의 어떤 객관적 상태를 서술한다고 주장하는 것이다: 이 주사위로써 ‘3’을 던지는 확률이 1/6보다 다소 적다고 말하는 것은 특정 환경을 이용한 실험의 결과에 관한 서술로서 해석된다; 혹은 실험의 조건들에 대한 서술로서, 그리고 이 조건들에 의하여 유발되기 쉬운 결과들에 대한 서술로서. 그리하여 ‘p(a,b) = r’은 정확하게 다른 물리적 서술처럼 가설이다; 그리고 자체의 가설적 특징에는 자체의 확률적 특징과 특별한 관련이 없다.
이것은 다양한 객관적 해석들이 공유하는 견해이다.
이것과 반대로, 주관적 해석들은
p(a,b) = r을
그 해석들이 흥미를 갖는 가설로서 수용하지 않는다; 왜냐하면 그 해석들은 ‘p(a,b) = r’을 경험적 가설로서보다는 분석적 서술로서 간주하기 때문이다. 그러나 그 해석들은 서술
a를
고찰중인 가설로서 수용한다; 그리고 확률적 공식 ‘p(a,b) = r’을 그 해석들은, 지식 b에 비춘 가설 a에 대한 신뢰도에 관해서나 우리의 신뢰 정도에 관하여 우리에게 정보를 주는 것으로서 간주한다.
이제 이 해석이 실제로 사용되려면, 우리에게는
p(a,b) = r이
분석적이라면, 그리고 b가 정말로 우리가 지닌 현재의 전체 축적 지식이라면 우리는, 현재로서,
p(a) = r이라고
주장할 (b가 알려졌기 때문에) 것이라고 우리에게 말하는 어떤 규칙이 필요하다; 다시 말해서 서술된 조건들 하에서 a에 대한 우리의 현재 이성적 신뢰가 r일 것이라고 우리에 말하는 규칙. 이 규칙은 고전적 논리학의 긍정식(modus ponens)과 유사하다; 왜냐하면 두 가지 모두가 우리로 하여금 우리가 처음에 단지 조건적으로 주장했던 - 조건 b 하에서 - 어떤 서술 a를 무조건적이거나 절대적으로 주장하는 것을 (명시하는 확률이 있거나 없이) 허용하기 때문이다; 조건 b가 실제로 실현된다는 것을 우리가 안다는 항구적인 조건으로. 우리는 이런 종류의 규칙을 - 우리로 하여금 어떤 서술 a를 조건적으로보다는 절대적으로 주장하여 그 서술을 자체의 조건들이라는 속박으로부터 사면하거나 해방시키는 규칙 - ‘면죄의 규칙(rule of absolution)’이라고 지칭할 것이다.
면죄(absolution)에 관한 고전적인 논리적 규칙과 (긍정식[modus ponens]이며 때때로 공평성의 규칙[the rule of detachment]로 불린다) 그 규칙의 상대방인 확률적 규칙 사이에는 두 가지 중요한 차이점이 있다: 먼저 한 가지 경우에서 면죄의 작동 결과는 a에 대한 혹은 a의 진실성에 대한 주장이다; 다른 한 가지 경우에서는 a에 어떤 확률이 (이성적 신뢰의 정도) 있다는 주장이다. 두 번째로, 그 규칙을 적용하는 토대가 한 가지 경우에는 b에 대한 혹은 b의 진실성에 대한 주장이다 (거기서 b는 a에 대한 조건이거나 선행 사건이다); 확률적인 경우에는, b가 참이라고 주장하는 것으로는 부족하다: 우리는 정말로 b가 참이라고 주장하거나, 우리는 b가 참이라고 알고 있다고 주장해야 한다: 우리는 또한 b가 현재 우리가 알고 있는 모든 것을 포함한다고 주장해야 한다: b는 우리가 지닌 지식의 총계이다. b가 현재 우리가 지닌 지식의 총계라고 우리가 주장한다는 조건으로만 우리는 a의 현재 확률이나 우리가 얼마나 a에 의존할 수 있는지를 도출할 수 있다.
이제 나의 요점은 이 분석이 항상 주관적 이론이 틀림없이 a의 확률을 절대적으로 만드는 이유를 밝힌다는 것이다. 정말로 우리는 조건적 정보를 근거로 행동할 수 없는 것처럼 상대적인 논리적 확률을 근거로 행동할 수 없다: 두 가지 모두 우리에게 실제적 행동의 유용한 근거인 그런 종류의 정보를 우리에게 제공할 수 있기 전에 면죄에 대한 각각의 규칙들의 적용이 필요하다. 그리고 우리는 - 항진명제를 근거로 행동할 수 없는 것처럼 - 또한 상대적인 논리적 확률을 근거로 행동할 수 없다. 그러나 면죄의 규칙을 적용함으로부터 귀결되는 ‘a의 확률은 (현재) r이다’는 절대적 명제는 더 이상 분석적이 아니다: 그 명제는 종합적 서술이고 우리의 경험에 근거하고 b에 근거하는 서술이어서 우리의 경험에 따라서 변하고 있다; 왜냐하면 r의 가치가 일반적으로 b의 모든 변화에 따라서 변할 것이기 때문이다. 이것이 우리가 경험으로부터 배우는 - 적어도 주관적 이론에 따라서 - 방식이다.
이것은 주관적 이론이 수용해야 하는 방향이다. 그러나 이것은 앤드류즈(Andrews) 씨가 향후 5년 동안 살아있을 것이라는 확률과 (생명보험사가 내기를 걸 것이라는 의미에서) 같은, 혹은 이 주사위로 5를 던지는 확률과 같은 그런 문제들과 주관적 이론이 관련이 있다는 견해를 수용하는 것을 불가능하게 만들지 않으면 어렵게 만든다.
보험의 관행에서 우리는 (i) 공정한 내기, 즉 이성적 내기와 (ii) 도박으로서 규정될 두 가지 형태의 사업을 상당히 분명하게 구분할 수 있다. 첫 번째 형태는 큰 숫자들과 이성적 통계에 근거하여 부과되는 보험료가 매우 경쟁력이 높고 지금까지 상당히 ‘공정하다(fair)’. 두 번째 형태는 매우 다르다. 두 번째 형태는, 예를 들어 어떤 독재자가 특정 기간 안에 전쟁을 시작할 것이라거나 소득세가 다음 예산에서 인하될 것이라는 위험과 같은 드물거나 심지에 독특한 위험에 대한 보험이다. 문제의 사건들이 독특하지 않다면 드물기 때문에 통계는 여기서 위험을 계산하는 토대로서 도움이 되지 않는다.
이제 내가 강조하고 싶은 요점은 이렇다: (i) 형태이면서 이성적 통계에 근거한 평범한 생명보험은 모든 경우에서 이용가능한 모든 관련 지식을 고찰하는 것과 매우 다르다. 대신에 그 형태는 모든 경우를 매우 큰 집합 하에 포함시키는 것을 목표로 하는 개략적 설문서 방식에 근거한다. 어떤 이유 때문에 이것이 수행될 수 없다면 그 경우는 (ii) 형태의 한 가지가 된다.
다른 방식으로 그것을 표현하면, 보험을 찾는 사람을 혼자 어떤 집합에 위치시키는 것에 대하여 모든 경우에 충분히 알려져 있다. (증거: 그는 자신의 제안을 근거로 개인적으로 정체가 파악될 수 있어야 한다.) 그리고 그 사람에 대하여 점점 더 많은 정보가 아마도 습득될 것이다: 어떤 사람들은 그의 점성술이 관련된다고 생각할 것이고, 다른 사람들은 그의 독서습관들이 관련된다고 생각할 것이고, 또 다른 사람들은 그가 습관적으로 요구르트를 마시는지를 생각할 것이다. 그러나 보험회사가 그 경우를 (i) 형태에 속하는 것으로 취급한다면, 그 보험회사는 너무 많은 문제들을 고찰하지는 않을 것이다. 단지 나이와 평균적인 좋은 건강이 근본적으로 고찰된다. (i) 형태의 경우들이 반복적으로 전제되어, 반복의 거대한 집합에 속하는 것으로 전제되기 때문에 이것을 그러하다. 추구되는 정보는 실험의 조건들을 정의(定義)해야 하며, 이 조건들이 실험을 독특하게 만들거나 심지어 드물게 만든다면, (i) 형태의 통계적 방법은 적용이 불가능하게 된다. 왜냐하면 베르누이의 방법들을 적용하는 데 기본적인 두 가지 조건이 있기 때문이다: (우리가 본 바와 같이 독자적이 아니라면 반복들로써 고찰될 수 없는) 반복들의 독자성; 그리고 큰 숫자들.
고찰된다면 너무 많은 관련 정보가 그 경우를 항상 독특하게 만들 것이다: 그 정보는 그 경우를 (i) 형태의 ‘이성적’이거나 ‘공정한 내기’ 경우들로부터 꺼내어 (ii) 형태의 비이성적 도박 경우들 속으로 넣을 것이다.
그리하여 이성적이고 통계적인 방법들은 이용 가능한 관련 정보를 의식적으로 무시하는 데 근거한다. 이것은 b가 우리가 지닌 총체적 관련 지식의 요약으로서 라기보다는 반복적인 실험적 조건들을 정의(定義)하는 것으로서 고려된다는 사실에 기인한다. 보험회사가 하려는 것은 지나치게 구체적이 아닌 b에 대하여 합당하게 안정적인 r을 발견하는 것이다. 이 과정은 b가 부단히 성장하여 결과적으로 r이 부단히 변화하는 주관적 이론과 매우 두드러지게 대비된다.
(ii) 형태의 경우들은 아마도 주관적 이론가들이 염두에 두고 있는 것과 더 밀접하게 닮았다고 언급될 것인데 왜냐하면 여기서 보험업자는 생존-기간의 경험을 이용할 것이기 때문이다: 인간에 대하여, 정치에 대하여, 기타 등등에 대하여 그가 지닌 전체 지식은 그의 계산을 시작할 것이다. 이것은 사실이다; 그리고 그럼에도 불구하고, (ii) 형태의 경우들은 통계적도 아니고 이성적도 아니다. 단순한 귀납적 규칙은 여기서 적용될 수 없으며, 보험업자가 짊어질 위험에 대한 보험업자의 추정치를 논리적 추론을 닮은 것에 근거시키는 것을 불가능하게 만들 이성적인 방법은 분명히 없다.
이제 우리가 형태 (i)과 (ii)를 면죄의 확률적 규칙과 관련하여 고찰한다면, 우리가 (ii) 형태의 경우들에서만 - 다시 말해서, 비이성적 도박 - 이 규칙을 이용하여 행동한다는 것을 우리는 발견한다. 독특한 사건들을 근거로 도박하는 것은 정말로 일종의 절대적인 행동이다: 우리가 결정을 내리자마자 (우리가 지닌 총체적 경험을 근거로) 우리는 우리의 모험을 시작했으며, 이 순간부터 계속해서 우리에게는 우리가 지닌 총체적 경험 b를 고찰할 필요가 더 이상 없다.
형태 (i)은 매우 다르고 면죄의 확률적 규칙을 적용하는 것을 야기하지 않는다. 앤드류즈 씨가 집합 b에 속한다는 정보의 진실성을 고찰하여 우리가 앤드류즈 씨의 기대 수명이 r이라고 절대적으로 말할 것이라고 말하는 데는 분명히 소용이 없다. 반대로, 앤드류즈 씨의 기대 수명이 r이라는 것은 단지 앤드류즈 씨가 b에 의하여 정의(定義)되는 집합의 구성원인 한에서이다; 동일한 앤드류즈 씨가 또한 b'에 (그의 점성술) 의하여, b''에 (그의 독서 습관들), 기타 등등에 의하여 결정되는 집합들에 정말로 속한다는 것과, 이 집합들의 구성원으로서 그의 기대 수명이 다르다는 것을 (단지 참고 집합의 여하한 변화도 다른 r을 야기할 것이기 때문에) 우리가 알 것이라는 사실로부터 알려진 바와 같이. 빈도 이론가들은 (그리고 과학적 발견의 논리를 쓸 때의 내 자신) 우리가 사건의 확률을 정의(定義) 할 수 없고 단지 사건들의 집합에 속하는 구성원으로서 사건의 확률을 정의(定義) 할 수 있다고 말을 함으로써 이것을 아마도 표현했을 것이다. 사건과 (또는 실험) 동시에 그 사건의 반복들을 규정한다고 추측되는 저 객관적 조건들이 경향을 결정한다고, 그리고 우리는 실제로 저 선택된 반복 가능한 조건들에 관해서만 경향을 말할 수 있다고 오늘 나는 말해야겠다; 왜냐하면 우리는 물론 실제로 실제 사건이 발생했거나 실제 실험이 일어난 모든 조건들을 고찰할 수는 없기 때문이다.
그리하여 여하한 설명적 확률 가설에서도 우리의 가설의 한 부분은, 우리가 설명하고 싶어 하는 종류의 사건에 특징적인, 조건들의 관련 명세표인 b를 우리가 가지고 있다는 것이 항상 될 것이다. 주관주의자는 우리가 본 바와 같이 그의 가설이 a인 반면, b를 주어진 것으로서, 변화가 불가능한 자료들로서 수용한다. 객관주의자는 통상적으로 a를 수용하지 않지만 r의 가치만을 가설로서 수용한다.
a에 관하여 두 사람의 태도는 다시 완전히 다르다. 주관주의자는 흥미로운 가설 a를 - 말하자면 자신이 선택한 가설 - 발견할 것이고 p(a,b)를 요구하면서 그는 a가 의존될 수 있는지를 (b가 주어지고) 묻고 있다. 다른 한편으로 객관주의자는 공식 p(a,b) = r을 고찰 중일 때마다 a가 아닌 사건에서보다 특정 사건 a에 더 많이 관심을 가질 것이다. 객관주의자는 a를 자신이 선택한 가설로서 간주하지 않고 가능한 사건들 중의 한 사건으로서 간주한다; 그리고 그가 관심을 갖는 것은 a 자체가 아니라 a의 확률이다. 그리하여 생존 확률들을 추정하는 보험계리인(保險計理人: insurance actuary)은 a가 아닌 사실에 관심을 갖지 않는 것처럼 사실 a에도 (피보험자가 죽었다는 사실) 관심을 갖지 않는다: 두 가지 모두 그에게는 대등한 상황이다. (그 사무실의 모든 피보험자들이 충분히 늙은 나이에 도달함을 충심으로 원한다는 의미에서 a가 아닌 것이라기보다는 a에 그의 사무실이 정말로 ‘관심을 가질’ 것이라 할지라도 이것은 그렇다.)
주사위를 사용하여 ‘5’를 던지는 확률로 방향을 선회하여 우리는 주관적 이론과 객관적 이론과 관행 사이의 심층적 격차를 주목할 것이다.
주관적 이론에 따르면, 경우의 게임에서 우리는 (이런저런 형태의 단순한 규칙에 의하여) 사건의 주관적 확률을 - 가령 특정 주사위를 던지는 데서 ‘5’ - 결정해야 한다. 우리는 예를 들어 일반적인 주사위와 특별한 한 가지 주사위를 사용하는 게임들을 관찰함으로써, 그리고 어떤 종류의 통계를 편집함으로써 그렇게 해야 한다. 올바르거나 합리적인 정도의 믿음을 그렇게 결정하고 그 믿음을 근거로 행동하는 것, 다시 말해서 상응하는 가능성을 절대적으로 수용하는 것이 합리적이다 (이 문장의 원문은 Having so determined the correct or rational degree of belief, it is rational to act upon it, that is to say, to accept the corresponding odds, absolutely.인데 분사구문 Having so determined the correct or rational degree of belief의 주어가 비인칭 주어[가주어] it이 될 수 없으므로 옳지 못한 문장이다. 분사구문을 종속절로 만들어 after we have so determined the correct or rational degree of belief로 표현함이 옳다. 역자) 다시 말해서 우리는 다시 면죄의 규칙을 적용한다.
그러나 이것은 더 훌륭한 사람의 평범한 태도를 전혀 기술하지 않는다. 그는 항상 조건들이 - 즉, b - 충족된다고 전제하기에 내기를 건다; 예를 들어, 주사위는 무게가 실리지 않았다고. 심지의 그가 거는 내기는 절대적이 아니다: 만약 그가 나중에 주사위에 무게가 실렸음을 발견한다면, 그는 자신의 내기를 취소한 권리가 있다고 느낀다. 혹은 어떤 다른 ‘속임수’가 게임의 수용된 조건들에 의하여 함축적으로 금지된 채 그에게 가해졌음을 그가 발견한다면, 그는 다시 자신이 참가할 의무가 없다고 생각할 것이다. 그리하여 그는 a에 내기를 걸지 않지만 (주관주의자들이 주장하는 바와 같이) 몇 가지 객관적 조건 b가 충족된다면 a에 내기를 건다.
지나가는 길에 주관주의자가, a는 발생할 것이라고 우리가 내기를 걸지는 않지만 더 정확하게 조건적 서술을 토대로는 우리가 내기를 건다고 말함으로써 자신은 이 상황을 해석할 수 있다고 믿는다면 주관주의자는 틀렸을 것이라고 언급될 것이다. 왜냐하면 다음에서 밝혀질 바와 같이 조건문의 확률은 조건적 (혹은 상대적) 확률과 매우 다르기 때문이다. b를 다시 우리가 지닌 총체적 지식으로 하고, c를 게임의 조건들로 하라; 그렇다면 주관주의자는 우리가 a에 (b가 주어진) 내기를 걸지 않고 ‘c라면 a이다’에 (b가 주어진) 내기를 건다고 제안할 것이다; 그리고 ‘c라면 a이다’를 토대로 절대적으로 면죄의 규칙을 적용한 후에. ‘c라면 a이다’가 a보다 더 높은 확률을 지닐 것이기 때문에 이 해석은 확률계산의 법칙들과 양립할 수 없다; 정말로 c가 b의 한 부분이고 그 경우에 조건 c가 자체의 힘을 잃지 않는다면; 다시 말해서 우리는 이 경우에 b = bc를 경험하며 결과적으로, p (c라면 a,b이다) = p(a,b)를 경험하여, 면죄의 규칙을 적용한 후에, a의 현재 확률이라기보다는 ‘c라면 a이다’의 현재 확률을 우리가 얻어야 한다는 이유는 없다.
그리하여 주관적 이론에서 증거 b의 역할은 객관적 이론에서 실험적 조건 b의 역할과 근본적으로 다르다; 그리고 주관적 이론은 객관적 이론이 관심을 갖는 저 사실들과 저 문제들을 다루는 데 가까이 오는 것으로 보이지 않는다.
11. 귀납법을 통한 학습의 감소하는 수익.
이 고찰들과 밀접하게 연관된 것은 다음과 같은 객관적 해석과 주관적 해석 사이의 차이점이다.
객관적 이론가는, 조건 b를 상수로 유지함으로써, 자신이 상당히 안정된 r을 얻을 것이라고 추측한다. 그가 매우 큰 표본을 가지고 있다면 이것을 그는 추정할 것인데 왜냐하면 베르누이가 그에게 그 표본은 매우 개연적으로 대표적일 것이라고, 다시 말해서 그 표본은 우리가 결정하려고 노력하는 저 r에 근접한 빈도를 보여줄 것이라고 말하기 때문이다.
다른 한편으로 주관적 이론가는 변화하는 b를 사용하여 작업하여 결과적으로 변화하는 r을 사용하여 작업한다. 그는 자신의 통계적 경험이 축적되면서 자신이 사실상 점점 더 많은 안정된 r을 얻을 것이라고 말할 것이다; 그리고 그는 객관주의적 r을 자신의 이 항상 더 안정된 r과 동일시하려고 시도할 것이다.
이 관점에 의하여 만들어진 다양한 난제들로부터, 다음과 같은 것이 여기서 토론을 위하여 선정될 것이다.
주관적 관점에서 r 안의 변화들은 정확하게 우리가 경험으로부터 배우는 정도를 반영한다. 그리고 r이 항상 더 안정된다는 사실은 우리의 증가된 학습이 우리의 이성적 신념들을 안정시키는 정도를 반영한다.
안정화의 사실 자체는 의심의 대상이 될 리가 없다: 단순한 귀납 규칙에 따라서, r은 개략적으로 m/n과 대등할 것인데, m/n에서 n은 우리가 지닌 총체적 관련 관찰들의 숫자이고, m은 a에 의하여 표현되는 것과 동일한 특성이 관찰되었던 (혹은 a에 호의적인 것) 관찰들의 숫자이다; 여기서 다시 a는 우리가 고찰중인 가설이고 b는 우리가 m/n에 의하여 표현된 통계를 획득하는 증거이다; 그래서 우리는
p(a,b) = r ≈ m/n을
얻는다.
이제 n이 매우 커지면, 어떤 특정한 새로운 관찰은 r에 거의 영향을 미치지 않을 것이다; 왜냐하면 n이 매우 크다면, (m + 1)/(n + 1)이나 m/(n + 1)은 m/n과 거의 동일할 것이기 때문이다.
이 단순한 사실은 우리의 경험이 축적되고 n이 커졌을 때 r은 틀림없이 비교적 안정된다는 것을 의미한다.
그러나 이 사실에는 또한 다양하고 덜 호의적인 면이 있다. 그 사실은 학습에 관한 주관적 이론이 거대한 권위를 우리의 과거에 치부한다는 것을 보여준다. 일생동안의 학습 후에 더 많이 배우려는 희망이 남아 있을 리가 없다: 우리의 과거 경험이 지닌 권위는 수정을 실용적으로 불가능하게 만든다. 다시 말해서 우리가 늙어갈수록 우리는 과거에 얽매여 점점 더 심보가 고약해지고 점점 더 나태해진다. 과학에도 동일한 것이 적용된다.
기술된 사실들이 참이라할지라도 심리학적이고 역사적인 사실의 문제로서 (그리고 그 사실들이 어떤 개인들에게는 참일지라도, 그 사실들은 과학의 역사적 발전에는 관해서는 분명히 참이 아니다), 그 사실들은 학습과 관련하여 기묘하게도 만족스럽지 못한 이론을 분명히 대표한다. 그 이론은 줄어드는 소득의 이론이다.
이 비판적 공격에 대하여 매우 명백한 답변과 같은 것이 있다. 그것은 이렇다. 우리가 지닌 신념들의 증가하는 안정성은 단지 우리의 신념들이 경험 속에서 더 낫고 더 낫게 설립되었다는 사실의 결과이다. 그 신념들은 항상 더 신뢰할만하게 되고 있다. 우리가 알고자 하는 우리의 노력에서 진보한다면, 더 멀리 진보할수록 우리가 궁극의 상태와 같은 것에 더 가까이 접근한다는 조건으로 우리는 불평을 해서는 안 된다.
이 방어에 대한 나의 응수는 이렇다. 실제적 종극은 물론 이런 방식으로 도달되지 않으며 또한 그 종극은 비판적 공격에 함축되어 있지도 않다. 학습이 확률의 r 가치를 변화시키는 것을 의미한다면, 그리고 이 변화들이 향상이라면, 우리가 우리의 귀납적 가치들을 통하여 접근하는 r의 참된 가치인 ‘참인’ 확률 가치와 같은 것이 틀림없이 존재한다. 나에게 답변했던 주관론적 옹호자가 염두에 두고 있었던 것은 이와 같은 것이었다: 이 주사위를 매우 자주 던짐으로써 우리의 주관적 확률 가치들은 시간에 맞춰 참인 가치에 점점 더 가까이 다가갈 것이다.
그러나 객관적 이론가의 가치인 객관적 가치가 아니라면 무엇이 참인 확률 가치인가? 그리고 이 ‘참’이거나 ‘객관적’ 가치의 대체물이 (혹은 제거) 주관적 이론의 주요 목표들 중 한 가지가 - 확률의 객관적 이론들이 지닌 근본적으로 불만족스러운 특징 때문에 선택된 목표 - 아니었던가?
확률에 관한 ‘참된’ 혹은 ‘객관적’ 가치와 같은 것에 대한 매혹에 의하여, 주관주의는 자살을 저지를 것이다: 주관주의는 비밀을 누설할 따름일 것이다.
그럼에도 불구하고 이것과 별도로, 감소하는 소득에 대한 논증은 실제로 전혀 답변되지 않았다. 감소하는 소득은, 내가 밝힌 바와 같이, 축적되는 경험의 단순한 산술적 결과이다 - 이 축적이 어떤 ‘참인’ 가치에 점점 더 근접하는데 성공적이든 아니든. 우리에게는 학습과 관련한 증가하는 침체가 보다 나은 근사치의 결과라는 믿을 근거가 전혀 없다; 정말로 우리는 그 침체가 보다 나은 근사치와 완전히 독립적임을 분명하게 알 수 있다. (‘빨강과 파랑’의 게임을 기억하라.)
12. 귀납적 학습의 역설.
학습과 관련한 주관적-귀납적 이론에 대한 비판으로 인하여 우리는 나의 이전 언급 중 어떤 언급보다도 주관적인 해석의 심장부로 더 가까이 다가간다. 왜냐하면 대부분의 주관주의자들의 작품에서 우리는 다음의 논증을 발견하는데, 칸트가 선험적으로 유효한 순수 과학이나 지식이 실제로 존재한다는 사실에 이끌렸던 논증과 다음 논증의 큰 유사성 때문에 나는 다음 논증을 ‘초월적’ 논증이라고 지칭할 것이기 때문이다.
주관주의자들의 초월적 논증은 다음과 같이 표현될 것이다.
귀납이론이 매우 어렵다는 것을 우리 주관주의자들보다 더 잘 아는 사람은 없다. 이것이 우리가 귀납이론에 대하여 작업을 하는 이유이다. 당신에 의하여 제시되는 난제들은 우리들에게 충격을 주지도 않고 우리를 놀라게 하지도 않는다: 그 난제들은 생계수단이다. 그 난제들은 매우 실제적일 것이고 우리는 여기서 당장 그 난제들을 해결할 수는 없을 것이다. 그러나 우리 주관주의자들은 한 가지 일을 - 그 난제들이 틀림없이 해결될 수 있다는 것 - 안다. 왜냐하면 우리는 우리가 경험으로부터 배운다는 것을 알기 때문이다: 이것은 사실이다; 그리고 어떤 회의적인 불평도 이 사실에서 우리의 신뢰를 흔들지 못할 것이다.
나에게는 이 사실을 부인하려는 의도가 없다; 그리고 내가 초월적 논증에 도움을 구할 정도로 회의론적 공격이나 의심들에 의하여 매우 압박을 받은 적이 없는 데서 내가 운이 좋았다할지라도, 나는 이 논증이 존경을 받을만한 논증임을 기꺼이 인정한다. 그런 만큼 나는 주관주의자들에게 국면을 전환하기 위하여 여기서 그 논증을 채택할 준비가 되어있다: 우리가 학습에 대한 주관적-연역적 이론을 채택한다면 나는 학습이 불가능해진다는 것을 밝히려고 노력할 것이다.
우리가 논리적- 주관적 공식 p(a,b) = r의 b에 대하여 우리에게 실험의 객관적 상황을 정확하게 제공하되 다른 것은 제공하지 않는 저 정보를 선택한다면 우리는 먼저 어떤 일이 발생할 것인지를 고찰한다; 더욱 특별하게 우리가 b 안에 실험의 이전 결과들에 (결과 a, <v:f eqn="if lineDrawn pixelLineWidth 0"></v:f><v:f eqn="sum @0 1 0"></v:f><v:f eqn="sum 0 0 @1"></v:f><v:f eqn="prod @2 1 2"></v:f><v:f eqn="prod @3 21600 pixelWidth"></v:f><v:f eqn="prod @3 21600 pixelHeight"></v:f><v:f eqn="sum @0 0 1"></v:f><v:f eqn="prod @6 1 2"></v:f><v:f eqn="prod @7 21600 pixelWidth"></v:f><v:f eqn="sum @8 21600 0"></v:f><v:f eqn="prod @7 21600 pixelHeight"></v:f><v:f eqn="sum @10 21600 0"></v:f><o:lock aspectratio="t" v:ext="edit"></o:lock><w:wrap type="topAndBottom"></w:wrap>혹은 ) 관한, 그리고 그 결과들의 빈도들에 관한 정보를 포함시키지 않는다는 조건으로. 우리는 실험이 완벽한 대칭적 도박 장치와 (주사위, 혹은 동전, 기타 등등) 하나는 아니지만 평범한 물리적 실험의 특성, 가령 가스들에 관한 통계적 이론을 시험하는 특성이 더 많다고 상정한다. 이 경우에 논리적 (혹은 주관적) 확률
p(a,b) = r의
가치 r은 일반적으로 ‘객관적’ 가치 r과 일치하지 않을 것임을 분명하다; 그렇지 않다면 우리가 지닌 모든 객관적 지식은 논리적으로 참이거나 분석적일 것이다; 그리고 귀납법은 필요하지도 않을 것이고 심지어 가능하지도 않을 것이다: 우리는 경험으로부터 배울 수 없을 것이다.
그리하여 우리가 주관적 이론의 b를 객관적 상황에 관한 정보와 일치시킬 것이라고 우리가 상정한다면 우리는 역설적 결과를 정말로 얻는다. 그리나 우리가 이 상정을 버린다면 우리는 유사하게 역설적 결과들을 얻는다. 그래서 정말로 우리는 그 상정을 버려야 한다; 왜냐하면 주관적 이론의 b는 틀림없이 실험의 객관적 상황뿐만 아니라 실험의 과거 결과들에 관한 지식도 포함하기 때문이다.
주관적-귀납적 이론은 우리가 귀납의 단순한 법칙과 관련된 어떤 형태를 적용함으로써 배운다고 말한다. 그 이론은 우리가 이 규칙을 적용함으로써, 우리가 동전이 과거에 던져졌음을 안다면 1/2의 확률로써 ‘앞면들’을 기대하는 것을 배울 수 있다고, 그리고 동전은 가장 위쪽으로 1/2의 빈도로써 앞면으로 떨어졌다고 말한다.
그러나 이것은 주관적 이론의 관점으로부터 정확하게 우리가 배울 수 없는 것이다. 왜냐하면 이 이론이 실험의 객관적 상황이라는 개념과 작동하는 것이 불가능하기 때문이다.
우리가 본 바와 같이, 주관적 이론은
p(a,b) = r에서
b를 틀림없이 우리가 지닌 전체 지식의 - 혹은 우리가 지닌 관련된 전체 지식의 - 요약으로서 해석한다. 이것은 ‘p(a,b) = r’이 우리가 소유한 증거에 비추어 합리적인, 우리가 지닌 합리적인 믿음의 정도에 대한 서술로서 해설될 수 있다는 자체의 기본적 관점의 결과이다.
그리하여 주관적 이론 안에서 b는 실험적 상황에 대한 서술일 리가 없다. 이 상황은 물론 우리가 그 상황에 대하여 정보를 받거나 그 상황을 관찰했을 것이기 때문에 b의 한 부분을 형성할 것이다. 그러나 주관주의자들로서 우리는 그 상황을 우리가 지닌 지식의 나머지들로부터 분리할 수 없다. 객관주의자는 그 상황을 자신의 관련성이라는 개념의 도움을 받아서 분리한다. 그리나 관련성이라는 개념으로 인하여 주관주의자는 매우 다른 b에 도달한다; 왜냐하면 이전 실험들의 결과들은, 객관주의자에게는 무관한 반면, 주관주의자에게는 매우 관련이 깊기 때문인데 이유인즉 새로운 결과들이 틀림없이 옛 결과들로부터 독립적이기 때문이다.
결과적으로 주관주의자는 실험의 반복이라는 개념을 표현할 수 없다. 왜냐하면 모든 실험은 근본적으로 다른 관련된 상황 (객관적 상황이 아니라 지식과 관련된 상황) 하에서 진행될 것이기 때문이다. 18번째 실험은 17번째 실험과 다른 상황 하에서 진행될 것이다; 왜냐하면 자체의 상황 가운데에 17번째 실험의 결과에 대한 우리의 지식이 있을 것이기 때문이다.
그리하여 우리는 실험의 상황을 반복할 수 없기 때문에 단순한 귀납 규칙을 적용할 수 없다.
우리는 그 역설을 다음 방식으로 표현할 수 있다.
우리가 실험의 반복을 관찰한다는 조건으로만 우리의 지식이 주관적 이론에 따라서 성장한다고 상정하라. 그렇다면 그 지식은 성장할 수 없다; 왜냐하면 지식의 성장은 실험에 관하여 알려진 상황을 변화시키지 않을 것이서 실험은 반복될 수 없기 때문이다.
다시 말해서 주관적 관점에서 새로운 실험이 옛 실험의 반복이라는 상정은 모순적이다. 왜냐하면 새로운 실험이 반복이라면 모든 이전 사례들을 고도로 관련된 상황으로 만드는 단순한 귀납 규칙이 적용되어 그 규칙은 틀림없이 이 이전 경우들과 본질적으로 다른 경우이기 때문이다. 그리하여 실험을 반복될 수 없다.
(제노[Zeno]는 아마도 이렇게 말했을 것이다: 만약 그것이 동일하다면 그것은 동일한 것이 아니다. 그리하여 그것을 동일할 리가 없다.)
실험의 반복은 그리하여 주관적 이론에는 낯선 개념으로 판명된다. 그러니 이 이론은 관찰의, 혹은 관찰된 사실의 반복이라는 개념을 사용할 것이다. 우리가 동전이 뒷면이 나오는 50번의 던짐을 관찰했다고 그 이론이 주장하는 데는 어려움이 없다. 그 이론이 주장할 수 없는 것은 이 50번의 경우에서 상황이 동등하거나 대체로 동등하다거나 주로 동등했다는 것이다; 왜냐하면 귀납적 규칙의 전제들에 따라서 그 경우들은, 모든 경우에, 다른 경우들 중 어떤 경우와 비교하여, 가장 관련된 의미에서 다르기 때문이다.
이런 방식의 논증에 대항하여 내가 교활하게 ‘상황’이라는 말과 ‘지식’이라는 말의 두 가지 의미를 뒤섞었다고 반대론의 제기될 것이다. 우리는 (i) 실험의 객관적 상황에 대한 우리의 지식과 (ii) 우리가 새로운 실험을 (물론 이전 결과들에 대한 우리의 지식을 포함하는) 관찰할 때 존재하는 심리학적이나 주관적 상황을 구분해야 한다고 언급될 것이다. 나의 답변은 주관적 이론이 이 구분을 할 수 없다는 것이다. 주관적 이론이 할 수 있는 유일한 것은 관련된 상황과 무관한 상황을 구분하는 것이다; 그리고 우리가 확신할 수 있는 유일한 것은 이전 결과들에 대한 지식이, 주관적 이론의 관점에서, 틀림없이 고도로 관련이 있다는 것이다.
그리하여 경험에 의한 학습은 주관적-귀납적 이론에 따르면 불가능하다. 그러나 우리는 우리가 경험에 의하여 배운다는 것을 안다.
그리하여 주관적-귀납적 이론은 틀림없이 틀렸다.
이 초월적 논증의 부정적 이용은 자체의 유일한 합당한 이용이다. 그 이용은 매우 흔히 이용되는 바와 같이, 학습에 관한 어떤 특정 이론을 선호하여 논증하는 데 이용되어서는 안 된다; 왜냐하면 그것은 문제의 이론이 유일하게 가능한 이론이라는 다소 명시적인 주장에 항상 해당되는 논증이기 때문이다. (얼마나 많은 양립할 수 없는 이론들이 유일하게 가능한 이론들이라고 주장되었던 지를 발견하는 일은 놀랍다.)
13. 귀납적 기계.
학습에 관한 귀납적 이론에 대한 나의 반대에도 불구하고, 나는 귀납적 기계의 - 특정 종류의 - 가능성을 신뢰한다.
귀납적 기계의 가능성을 보기 위하여 우리는 그 기계가 검사해야 할 단순화된 우주(simplified universe)를 고찰한다. 그 우주는, 예를 들어, 특정 제한된 숫자의 속성들과 함께 ‘개체들(individuals)’ 혹은 ‘개별적 사건들(individual events)’로 구성될 것이다. 우리는 직경이 1인치인 공들을 우리의 개체들을 위하여 선택한다. 개별적 사건은 파이프 끝에 있는 공의 출현에 놓여있을 것이다; 그 다음에 그 사건은 홈을 굴러 내려가서 구멍 속으로 사라진다. 매초 그런 개별적 사건이 있을 수 있다.
공들은 특정 속성들을 지닐 것이다. 그 공들은 강철이나 놋쇠로 만들어졌을 것이고, 그 공들은 몇 가지 다른 색깔들로 칠해질 것이다. 우리는 이제 우리의 인위적 우주가 몇 가지 ‘자연 법칙들’에 따라서 작동될 것이라고 상정한다. 예를 들어 우리는 그 우주를 그렇게 조정하여 강철 공들은 항상 3의 수열로 오고 이것들 다음에는 약간 길지만 다양한 구리 공들의 수열이 온다; 혹은 우리가 그 수열을 조정해서 매 100개의 강철 공으로부터, 10개의 공은 푸른색이고 20개는 녹색이고 30개는 붉은색이고 40개는 노란색이 된다: 이것은 통계적 ‘법칙’이 될 것이다. 다른 ‘법칙들’은 조치가 취해질 수 있다.
우리의 단순한 우주에 대해서는 이만큼만 하자. 이제 귀납 기계로 향하자. 이것은 그렇게 구축되어서, 합당한 기간이 지나면, 자체의 우주 속에서 이 기간 동안 유효한 법칙들을 ‘발견할’ 것이다. 그리고 이것은, 자체의 우주 법칙들이 변한다면, 새로운 조합의 법칙들을 발견함으로써 자체의 능력을 보여줄 것이다. (물론, 충분한 시간이 이 발견들에 대하여 허용되어야 하며, 통계적이고 동시에 다른 ‘법칙들’은 이 시간 동안에 불변적으로 지켜져야 한다.)
귀납 기계에는 자체를 강철 공들과 구리 공들을 구분하도록 허용하는 탐지기와 (아마도 자기 바늘) 색깔들에 관한 또 다른 탐지기가 장착되어야 할 것이다. 게다가 귀납 기계에는 수를 세는 장치들이 장착되어야 할 것이다. 귀납 기계는 다양한 구분 가능한 사건들의 통계를 작성할 수 있고 평균치들을 계산할 수 있을 것이다. 귀납 기계가 한 걸음 더 나아가 우주가 보여줄
법칙의 종류에 (실제적 법칙들에가 아니다) - 승계의 법칙들, 특정 안정성의 일반적이거나 조건적 빈도들, 기타 등등 - 조정된다면, 그 기계는 예를 들어 가설들을 만들어 내어 그 가설들을 시험하여 제거하는 데 전적으로 효율적일 정도로 구축될 것이다. 그리하여 그 기계는 우주 속에서 어려움 없이 단순한 규칙성들을 탐지할 것이다: 그 기계는 그리하여 경험으로부터 배울 것이다.
귀납 기계의 진화에서 보다 원초적인 단계들 중 몇 단계들을 다소 상세하게 토론하는 것이 유용하다.
(i) 귀납 기계의 진화에서 가장 원초적인 단계는 다음과 같이 기술될 것이다.
그 기계는 모든 단칭 사건의 속성들을 (혹은 술어들을), 강철이건 구리건, 푸른색이건 녹색이건, 기타 등등이건 주목한다. 그 기계는 사건들의 수를 센다, 그리고 그 기계는 다양한 속성들 중에서 한 가지 속성 아래 떨어지는 사건들과 두 가지 이상의 속성들 (‘강철과 푸른색’) 아래 떨어지는 사건들의 수를 또한 센다. 게다가 그 기계는 상응하는 지수(指數)들을 즉각 형성하여 그 지수들을 상징적으로 주목하고 모든 새로운 사건 이후에 그 지수들을 수정하여 어느 순간에도 그 기계는 다양한 속성들과 속성들의 결합의 발생에 관한 상대적 빈도들을 우리에게 제공할 수 있다.
우리가 우리의 ‘세계’를 구축하여 이 빈도들이 합당하게 안정적이라면 (혹은 우리가 우리의 세계가 그렇게 구축됨을 안다면) 그 기계에 의하여 계산된 빈도들은 물론 점점 더 우리가 우리의 ‘세계’ 속으로 구축한 ‘참’이거나 ‘객관적인’ 빈도들에 가까이 접근할 것이다; 그리고 그리하여 우리는 그 기계가 다음과 같은 질문에 어느 순간에도 답변할 수 있다고 말할 수 있다: ‘객관적 가치에 대하여 합당한 근사치와 함께 속성 P를, 혹은 아마도 속성들의 조합 {P, Q, R}을 지닌 다음 사건의 확률은 무엇인가?’
방금 기술된 단계에서, 그 기계는 단순한 귀납 규칙을 (내가 그 규칙을 지칭했던 바와 같이) 자체의 가장 원초적 형태로 이용한다. 이 형태에 반대하여 초기 결과들이 - 귀납법의 초기 단계들의 - 터무니없다는 반대론이 제게 되었다. 예를 들어, 최초의 공이 푸르고 강철로 되어 있다면 그 기계는 술어들에게 ‘푸른색’과 ‘강철’을 귀속시켜야 할 것이고 또한 물론 ‘푸른색과 강철’이라는 술어에게 확률 1과 다른 술어들에게는 확률 0을 귀속시켜야 할 것이다. 여기서 제기된 반대론은 중요성이 없는 것으로 보인다; 왜냐하면 우리가 그런 초기 결과들을 회피하고 싶어 한다면 우리는 항상 우리의 기계를 구축하여 그 기계가 단지 1000번째 사건 이후에, 가령, 또는 우리가 선택할 다른 숫자 n이후에, 우리의 ‘세상’ 속의 다양한 속성들의 숫자를 기억하면서 그 기계가 확률적 예언들을 내기 시작하도록 할 수 있다. (문제는 매우 사소하여 그 문제를 체계적으로 해결하는 것이 노력을 할 가치가 없다; 왜냐하면 우리는, 결국, 단순한 귀납적 규칙의 적용들로 인하여 우리에게 점점 더 충분한 근사치들 이상이 주어지지 않을 것이기 때문이다.)
(ii) 두 번째이자 다소 덜 원초적인 단계에서, 귀납 기계는 유사한 방식으로 사건들의 쌍이나 세 쌍, 기타 등등에 대한 통계를 설명할 것이다. 그 기계는 이런 방식으로 구리 사건에 의하여 혹은 강철-구리 쌍에 의하여 혹은 강철-강철-구리 세 쌍을 제외한 여하한 세 쌍에 의하여 연속되는 구리-강철 쌍의 확률이 0임을 발견할 것이다. (이것은 정확히 3으로 된 연속에서 강철 사건들이 조금이라도 발생하는 경향이 있다는 ‘법칙’을 그 기계가 발견했음을 의미한다.)
(iii) 자체의 진화에서 추가적 단계들은 기계가 가설들을 고안하여 그 가설들을 시험할 수 있도록 함으로써 이제 도입될 것이다. 나는 여기서 기계가 어떻게 이것을 할 것인지에 관한 흥미롭고도 어려운 문제 속으로 더 깊이 들어가지 않을 것이다. 나는 다음 질문으로 선회한다:
어떤 기계가 이런 방식으로, 다시 말해서 단순한 귀납적 규칙을 적용함으로써 경험으로부터 배울 수 있다면, 우리가 동일하게 할 수 있다는 것은 분명하지 않은가?
물론 나는 우리가 경험으로부터 배울 수 있다고 말하지 않았다. 또한 나는 우리가 단순한 귀납 규칙을 성공적으로 사용할 수 없다고 말하지도 않았다 - 객관적 조건이 합당하다면. 그러나 나는 우리가 귀납법을 통하여 객관적 조건이 단순한 귀납 규칙을 사용하는 데 합당한지를 알아낼 수 있다고 정말로 주장한다.
이것은 우리의 기계의 (i) 단계에서 예시될 것이다.
우리의 기계가 (i) 단계에서 성공적이라면, 우리가 우리의 ‘세상’을 단순한 귀납적 규칙이 그 세상에 성공적으로 적용될 수 있도록 구축했기 때문에 그렇다. 이것이 그러하다는 것은 우리가 우리의 ‘빨강 혹은 파랑’ 게임을 기억한다면 명백해진다. 이 게임을 포함하거나, 그 게임이 일반화된 것을 포함하는 ‘세상’을 구축하는 것보다 쉬운 것은 없다. 그러나 우리가 본 바와 같이, 이 ‘세상’은 매우 개연적으로 우리의 기계를 패퇴시킬 것이다. 우리가 선택할 어떤 확률에 때문에도 (통합성의 부족) 그 세상은 우리의 기계를 패퇴시키도록 만들어질 수 있다; 우리가 그 기계에게 자체의 귀납을 허용할 기간 때문에도; 그리고 실제적으로 우리가 채택할 ‘패퇴’의 여하한 기준 때문에도.
귀납 기계를 구축하면서 그 기계의 건축가들인 우리는 그 기계의 ‘세상’을 무엇이 구성하는지를 결정해야 한다; 어떤 것들이 그 세상의 개별적 사건들이 되어야 하는지; 속성이나 관계를 구성하는 것; 혹은, 다시 말해서, 반복을 구성하는 것. 그리고 어떤 종류의 질문에 그 기계가 답하기를 우리가 원하는지를 결정하는 것은 우리이다.
그러나 이것은 우리가 그 ‘세상’과 그 기계를 구축했을 때 한층 더 중요하고 어려운 질문들이 우리에 의하여 이미 해결되었음을 의미한다.
14. 귀납적 논리의 불가능성.
앞 절에서 기술된 귀납 기계는 - 그 기계를 귀납의 모형으로서 수용 불가능하게 만드는 모든 근본적 오류들 및 제한들과 함께 - 귀납적 논리학자들이 염두에 두는 듯이 보이는 단순화되고 향상된 기계이다. 그 기계의 상대적 단순성에 대해서는, 우리가 그 기계를 그 주제에 관하여 기술되었던 무거운 책들과 - 모든 면에서 무거운 - 비교하면, 의심의 여지가 없다. 그 기계가 향상된 것이라는 것에 대해서, 나는 귀납적 이론들을 언어보다는 기계들과 관련하여 토론하는 것을 선호하는 논증을 언급하고 싶다; 모든 귀납주의자들을 틀림없이 매혹하는 논증. 그 논증은 고양이들과 개들이 분명히 경험으로부터 배우지만 상징적 언어가 없다는 것이다. 그리하여 귀납에 관한 논리적이거나 언어적 이론은, 가능한 귀납 기계들에 대한 토론과 비교하여, 항상 고도로 신뢰성이 없는 책략으로 남을 것이다.
그러나 우리의 기계가 야기한 주요 개선사항은 그 기계가, 귀납법, 그리고 더욱 특히 단순한 귀납 규칙의 이런저런 형태가 반대로 연역적 논리의 일반화인 귀납적 논리의 한 부분이라는 견해와 단절된다는 것이다.
논리적 추론가능성을 확률계산과 관련하여 표현 가능한 특별한 관계의 경우로 만드는 확률계산에 대한 논리적 해석이 존재한다고 나는 앞 절에서 말했다. 그리하여 나는 연역적 논리에 대한 진정한 일반화인 확률 논리의 존재를 주장한다.
그러나 나는 이 확률 논리가 귀납적 논리로서 해석될 수 있다는 가능성을 부인한다. 더욱 특별히 나는 이 확률 논리를 단순한 귀납 규칙의 여하한 형태와 결합시키는 가능성을 부인한다.
그 결합의 존재는 일반적으로 당연시된다. 이것은 다음 방향들에 관한 암묵적이거나 명시적 논증에 기인하는 것으로 보인다.
귀납적 추론은, 결정적으로서는 완벽하지 않을지라도, 여러 면에서 연역적 추론과 유사하다. 이 상황은 결정적 (혹은 거의 결정적) 논증이 확률 1에 해당되고 비결정적 논증이 더 낮은 확률에 해당된다고 전제함으로써 설명될 것이다. 그리하여 귀납적 추론은 확률 논리의 한 부분이 될 것이다; 그래서 모든 귀납적 추론의 가장 단순하고 가장 기초적인 형태인 이런저런 형태의 단순한 귀납 규칙도 그러할 것이다.
이 논증은 철저하게 오류이고 단순한 귀납 규칙은 논리와 전혀 관련이 없다 - 자체의 통상적인 연역적 형태와도 관련이 없고, 확률 논리와도 관련이 없다. 그리고 아무도 확률 논리로부터 여하한 형태의 귀납적 규칙으로 이행하는 논증을 개발하지 않았다. 그 주제에 관한 대부분의 저술가들은 이 결합을 당연시했다; 그리고 여기에 (특히 자신의 저서 확률의 논리적 근거[Logical Foundations of Probability]에서의 카르납) 문제가 있음을 발견한 극소수의 저술가들은 내가 마지막에서 두 번째 절에서 ‘초월적’으로서 기술한 이런저런 형태의 논증을 통하여 격차를 메우려고 노력했다: 달리 우리는 경험으로부터 배울 수 없다고 그들이 믿었기 때문에 그런 결합이 있어야 했다.
단순한 귀납 규칙이 틀림없이 논리와 같은 것과는 독립적임을 증명하기는 충분히 쉽다. 독립 증거는, 모든 그런 증거들처럼, 모형의 구축을 통하여 나아간다. 우리는 우리의 세상을 위하여 ‘빨강이나 파랑’이라는 게임을 수용할 따름이다: 이 세상 안에서 ‘논리’는, 모든 논리적으로 가능한 세상에서 그러한 바와 같이, (객관적으로) 유효한 상태로 남는다. 그러나 귀납적 규칙은, 매우 개연적으로 실패할 것이라는 의미에서 - 우리가 선택하는 높은 확률과 함께, (객관적으로) 무효하게 된다.
우리는 우리의 귀납 기계가, 귀납적 논리를 구출하려는 거의 모든 시도들과 비교하여, 그렇게 단순한 이유를 이제 안다. 이유는 이렇다. 우리는 귀납적 논리를 통하여 우리의 기계의 유효성을 확립하려고 하지도 않았고, 그 기계와 확률 논리 사이에서 연결을 이룩하려고 노력하지도 않았다. 우리는 그렇게 될 수 없었기 때문에 그렇게 하지 않았다. 귀납적 논리는 정확하게 불가능한 것을 구축하려는 시도이다. 귀납적 논리에 관한 저술들을 그렇게 복잡하고 엉성한 논리로 만들어서 단순한 논증을 대신하여 끝없고 복잡한 대체물을 도입하는 것에 책임이 있는 것은 이것이다.
15. 확률 논리 대(對) 귀납적 논리.
지금까지 나는, 자체의 유효성 결핍을 증명함으로써, 귀납적 규칙의 면으로부터 우리의 문제를 공격했다. 이제 나는 다른 면인 확률 논리의 면으로부터 공격을 할 예정이다.
확률 논리는 연역적 논리의 일반화가 될 것으로 예상된다; 그리고 그 공식들은, 모든 논리의 공식들처럼, 논리적으로 참이거나, 분석적이거나, 또는 항진명제적이 될 것으로 예상된다.
이것을 염두에 두고. 우리는 이 해석을 가능하게 만드는 확률계산의 몇 가지 공식들을 볼 것이다.
(1) p(a,a) = 1.
이 공식은 ‘a는 a로부터 도출된다’로서 해석될 것이다.
(2) p(a,ab) = 1 = p(a,ba) = p(a,bac).
이 공식은 ‘a가 구성요소인 어떤 결합으로부터 a가 도출된다’로서 해석될 것이다.
(3) p(a,b) = p(a)라는 조건으로만 p(ab) = p(a)p(b).
이것을 우리는 ‘정보 b가 a의 절대 확률을 변하지 않게 남겨둔다는 조건으로만; 또는 다시 말해서 b가 a와 무관하다는 조건으로 a와 b가 확률 논리의 의미에서 (절대적으로) 독립적이다’로서 해석할 것이다.
(4) p(ab) ≠ p(a)p(b)라면
(i) p(a,b) > p(a)이거나 또는
(ii) p(a,b) < p(a)이고 <v:f eqn="if lineDrawn pixelLineWidth 0"></v:f><v:f eqn="sum @0 1 0"></v:f><v:f eqn="sum 0 0 @1"></v:f><v:f eqn="prod @2 1 2"></v:f><v:f eqn="prod @3 21600 pixelWidth"></v:f><v:f eqn="prod @3 21600 pixelHeight"></v:f><v:f eqn="sum @0 0 1"></v:f><v:f eqn="prod @6 1 2"></v:f><v:f eqn="prod @7 21600 pixelWidth"></v:f><v:f eqn="sum @8 21600 0"></v:f><v:f eqn="prod @7 21600 pixelHeight"></v:f><v:f eqn="sum @10 21600 0"></v:f><o:lock aspectratio="t" v:ext="edit"></o:lock><w:wrap type="topAndBottom"></w:wrap>p(,b) > <v:f eqn="if lineDrawn pixelLineWidth 0"></v:f><v:f eqn="sum @0 1 0"></v:f><v:f eqn="sum 0 0 @1"></v:f><v:f eqn="prod @2 1 2"></v:f><v:f eqn="prod @3 21600 pixelWidth"></v:f><v:f eqn="prod @3 21600 pixelHeight"></v:f><v:f eqn="sum @0 0 1"></v:f><v:f eqn="prod @6 1 2"></v:f><v:f eqn="prod @7 21600 pixelWidth"></v:f><v:f eqn="sum @8 21600 0"></v:f><v:f eqn="prod @7 21600 pixelHeight"></v:f><v:f eqn="sum @10 21600 0"></v:f><o:lock aspectratio="t" v:ext="edit"></o:lock><w:wrap type="topAndBottom"></w:wrap>p()이다.
이것을 우리는 ‘a와 b가 확률 논리의 의미에서 논리적으로 독립적이 아니라면 (i) b가 a보다 선호되어 즉, a를 뒷받침하거나, (ii) b가 a보다 선호되지 않아 즉, a가 아닌 것을 뒷받침함으로써 a를 해친다’로서 해석할 것이다.
이것은 확률-논리적 독립이 논리적 중립성으로서 해석될 수 있음을 보여준다: b가 a <v:f eqn="if lineDrawn pixelLineWidth 0"></v:f><v:f eqn="sum @0 1 0"></v:f><v:f eqn="sum 0 0 @1"></v:f><v:f eqn="prod @2 1 2"></v:f><v:f eqn="prod @3 21600 pixelWidth"></v:f><v:f eqn="prod @3 21600 pixelHeight"></v:f><v:f eqn="sum @0 0 1"></v:f><v:f eqn="prod @6 1 2"></v:f><v:f eqn="prod @7 21600 pixelWidth"></v:f><v:f eqn="sum @8 21600 0"></v:f><v:f eqn="prod @7 21600 pixelHeight"></v:f><v:f eqn="sum @10 21600 0"></v:f><o:lock aspectratio="t" v:ext="edit"></o:lock><w:wrap type="topAndBottom"></w:wrap>도 도 선호하지 않는다는 조건으로만 a와 b는 논리적으로 독립적이다.
다음 정리(定理)는 이 논리의 항진명제적 특성을 크게 밝히며 이제 설명될 것이다.
(5) p(y,x) ≠ 1로써 a를 x와 y의 결합으로 하라. (x와 y 모두의 내용들은 ≠ 0으로 전제된다.) p(xb) = p(x)p(b)로 하여 x와 b가 (확률적으로) 독립적이 되도록 하라. b = yz가 되게 하라. 그렇다면
p(a,b) = p(x,b) = p(x) > p(a)이다.
다시 말해서, a가 b로부터 (확률적으로) 독립적인 x와, b로부터 귀결되는 y의 결합이라면, p(a,b)는 x의 절대 확률과 동일할지라도 그럼에도 불구하고 (p(y,x) ≠ 1이라면) a의 절대 확률 보다 크다.
그리하여 우리는 (5)에 유도되어 연역적 논리의 이 외연의 항진명제적 특정에 대한 다음 설명에 다다른다: a가 xy의 결합에 해당되어, x가 (b에 의하여 수반되지 않는 a의 부분) b로부터 독립적이거나 b에 의하여 너무 강력하게 해를 입지 않는다면, y가 항진명제가 아니고 b로부터 귀결될 때마다 b는 a를 선호한다: x는 전혀 b에 의하여 뒷받침을 받을 필요가 없다. b가 x로부터 독립적이어서 x와 관련하여 중립적이라면, b가 주어진 a의 확률은 b가 주어진 x의 확률과 같을 것이다; 그리하여 절대 확률 p(x) > p(a)와 같을 것이다.
또는 다른 말로 표현하여, b가 a의 내용의 한 부분을 수반하여 나머지를 향하여 중립적이라면 (혹은 강력하게 비호우적이 아니라면) b는 a를 뒷받침한다.
그러나 이 해석이 옳다면 - 그리고 그 해석이 옳다는 것은 나에게 분명해 보인다 - 그렇다면 확률 논리는 귀납적 논리일 리가 없다. 왜냐하면 귀납 이론은 전제들 안에 있는 것보다 더 많은 것을 전제들로부터 획득하려는 시도를 정당화하려고 하기 때문이다: 심지어 확실성에서의 손실을 대가로 지불하고서 전제 b를 넘어 결론 a와 가는 것. 그럼에도 불구하고 논리적 확률은, a의 내용이 전제 b를 초월하면 b로부터 귀결되는 a의 저 부분만 확실해지고 나머지는 b가 없이 그랬던 것처럼 정확하게 개연적이거나 비개연적으로 남는다고 말한다. b가 확보할 a의 확률의 증가는 그리하여 전적으로 a의 한 부분이 논리적으로 b에 의하여 수반된다는 사실에 기인한다; 그 증가는 b로부터 귀결되지 않는 a의 저 부분에 대한 b의 효과에 기인하지 않는다. [✡ 그리하여 확률 이론에는 확충적 확률 추론이 없다. 표면적인 확충적 추론은 a의 내용의 저 부분이 b로부터 추론될 수 있다는 사실에 기인한다.]
확률 논리학에 항진명제적 특성을 부여하는 것은 이 상황이다. 다른 해석은 - 논리적으로 수반하는 자체의 부분 없이 b로 하여금 a에게 선호적으로 만들 해석 -결과적인 공식들을 비-분석적으로 만들 것이다.
그리하여 확률 논리학은, 전제들에 의하여 수반되는 결론들뿐만 아니라 전제들에 의하여 부분적으로 수반될 따름인 역시 부분적인 결론들을 (그리고 몇 가지 심층적 가능성들 또한) 고찰함으로써 파생적 논리학(derivational logic)을 일반화한다. 그러나 확률 논리학은, 그렇게 하면서, 우리가 알려진 전제로부터 - 확실성보다 적게 - 미지의 결론으로 나아가도록 한다; 사실상 전제를 초월하는 것은 이전에 그랬던 것처럼 개연적이거나 비개연적으로 남는다.
물론 귀납은 본질적으로 우리의 지식을 확대하려는 시도이다: 적어도 미
지의 것의 확률을 증가시킴으로써 알려진 것에서 미지의 것으로 나아가는 것. 여기서 나의 논증은 우리가 귀납에 대하여 무엇을 생각하든 귀납은 확률 논리학과 일치될 수 없다는 것이다.
16. 확률의 귀납주의적 해석.
그렇다면 ‘귀납적 논리학’이라 무엇인가? (i) 확률 계산, 즉 ‘확률 논리학’의 논리적 해석이 있는데 귀납과 관련이 없다; 그리고 (ii) 확률 계산의 귀납주의적 해석이 있는데 - 그렇게 구성되어서 확률 논리가 자체의 0인 경우가 된다는 것을 제외하고 - 논리학과 관련이 없다. 그러나 그것은 확률 계산의 일반화가 아닌데 이유인즉 그것이 귀납적인 한 논리적 해석과 직접적으로 충돌하기 때문이다; 그리고 우리가 그것의 0 경우를 고려한다면 우리는 어떤 귀납적 논증도 배제한다. 그리하여 귀납적 논리학에 대하여 말한다는 것은 매우 잘못된 것이다. 그러나 우리는 아마도 확률 계산을, 귀납의 단순한 규칙들을 낳도록 해석된다면, ‘귀납적 계산’으로, 그리고 그것에 의하여 계산된 확률들을 ‘귀납적 확률들’로 부를 것인가?
‘귀납적 계산’은, 공식적으로 고찰되어, 확률 계산에 덧보태어 다음 것을 주장하는 규칙이다:
속성 P의 관찰된 사례에는 저 속성 P <v:f eqn="if lineDrawn pixelLineWidth 0"></v:f><v:f eqn="sum @0 1 0"></v:f><v:f eqn="sum 0 0 @1"></v:f><v:f eqn="prod @2 1 2"></v:f><v:f eqn="prod @3 21600 pixelWidth"></v:f><v:f eqn="prod @3 21600 pixelHeight"></v:f><v:f eqn="sum @0 0 1"></v:f><v:f eqn="prod @6 1 2"></v:f><v:f eqn="prod @7 21600 pixelWidth"></v:f><v:f eqn="sum @8 21600 0"></v:f><v:f eqn="prod @7 21600 pixelHeight"></v:f><v:f eqn="sum @10 21600 0"></v:f><o:lock aspectratio="t" v:ext="edit"></o:lock><w:wrap type="topAndBottom"></w:wrap>의 확률을 (아마도 단지 약간이라면) 증가시키는 경향이 있다. 결과적으로 보완적 속성 의 관찰된 사례에는 P <v:f eqn="if lineDrawn pixelLineWidth 0"></v:f><v:f eqn="sum @0 1 0"></v:f><v:f eqn="sum 0 0 @1"></v:f><v:f eqn="prod @2 1 2"></v:f><v:f eqn="prod @3 21600 pixelWidth"></v:f><v:f eqn="prod @3 21600 pixelHeight"></v:f><v:f eqn="sum @0 0 1"></v:f><v:f eqn="prod @6 1 2"></v:f><v:f eqn="prod @7 21600 pixelWidth"></v:f><v:f eqn="sum @8 21600 0"></v:f><v:f eqn="prod @7 21600 pixelHeight"></v:f><v:f eqn="sum @10 21600 0"></v:f><o:lock aspectratio="t" v:ext="edit"></o:lock><w:wrap type="topAndBottom"></w:wrap>의 확률을 (의 확률을 증가시키는 경향이 있기 때문에) 감소시키는 경향이 있다.
카르납(Carnap)은 이것을 ‘사례적 관련성의 정리(Theorem of Instantial Relevance)’라고 부르고 다음과 같이 설명한다: ‘... 속성의 한 가지 사례는 동일한 속성의 또 다른 사례에 대한 예측과 긍정적으로 관련된다’. (그는 계속해서 말한다: ‘이것은 미래 사건에 대한 예측과 관련한 모든 귀납적 추리의 기본적 특징으로 보인다.’)
그 규칙은, 예를 들어 초록 물체들에 대한 관찰은 다음 것이 초록빛일 것이라는 가능성을 증가시킨다는 것을 실제로 의미한다; 혹은 영리한 대상들에 대한 관찰은 관찰된 다음 대상이 영리할 것이라는 확률을 증가시킨다는 것. 카르납이 밝히는 바와 같이, 그것은 내가 여기서 ‘단순한 귀납 규칙’이라고 불렀던 것의 한 가지 형태이다.
나는 여기서 이 규칙의 합당성이나 불합리성을 토론하고 싶지도 않고 자체의 유효성이나 무효성의 문제를 다시 열고 싶지도 않다. 나는 단지, 그것이 논리학의 한 부분이 아님을 반례를 통하여 증명하지 않았다할지라도, 그 규칙의 전체 특징이 확률 논리학의 한 부분으로서의 자체 수용을 막을 것임을 밝히고 싶을 따름이다.
왜냐하면 반대 규칙에는 비논리적인 것이 (‘자기-모순적’이라는 의미에서) 없기 때문이다. 나는 ‘앞면’ 덩어리를 기다리며 ‘뒷면’에 내기를 거는 유명한 도박꾼의 오류를 의미한다 - ‘왜냐하면 지금은 변화의 시간이기 때문이다’. 이것이 통상적인 우연의 게임들에 관한 한 오류일지라도, 도박꾼의 오류가 성공을 야기할 수열을 (가령, 덩어리의 감소된 빈도와 함께) 우리는 쉽게 수열을 구축할 수 있다.
그러나 방금 제시된 귀납 규칙에 대한 설명은 도박꾼의 오류나 ‘빨강 혹은 파랑’이라는 우리의 게임과 갈등을 일으킴으로서만 자체의 비논리적 특징을 보여주는 것이 아니다; 그 설명은 여하한 정상적인 무작위 수열과도 갈등을 일으킨다. 왜냐하면 객관적으로 해석되어 그 설명은, 정상적인 무작위 수열에서는 발생하지 않는 여파를 상정하기 때문이다. 그리하여 그 규칙은 예를 들어 추정치
p(a,b) = 1/2과
충돌하는데 거기서 a는, b가 우리에게 말하는 바와 같이, 동종인 동전으로 앞면을 던지고 있다.
이것은, 우리가 본 바와 같이, 단순한 귀납 규칙에 의하여 계산된 확률이 무작위 수열의 확률의 ‘참’이거나 ‘객관적’ 가치에 자체를 매우 가깝게 안정시키는 것을 보장하여 궁극적으로 ‘성공’을 낳는 ‘감소하는 소득의 법칙(law of diminishing returns)’로 내가 위에서 지칭했던 것에 의하여 가려진다. 그러나 심지어 이런 방식으로 안정된 후에도, 비상하게 긴 덩어리가 (그 덩어리는 순수한 덩어리일 필요는 없다) 나온다면 - 이 덩어리가 객관적인 관점에서 다소 기한이 지났다할지라도 - 유도된 확률은 여전히 다소 우왕좌왕할 것이다.
모든 형태의 단순한 귀납 규칙이, 심지어 평범한 동전-던지기 게임에 대해서도, 객관적 확률과 충돌한다는 사실은 충분히 강조될만하다. 그 충돌은 처음부터 사소한 것이고, 게임들의 수열이 무한히 길어지면 완전히 사라지게 되어 있다. 그러나 이것은, 더 높은 위험이 포함되면 객관적 이론에 따라서 단순한 귀납 규칙의 한 형태를 자신의 ‘생활지침’으로서, 다시 말해서 자신의 도박체계로서 사용한 도박꾼에 의하여 커다란 손실이 틀림없이 기대된다. 왜냐하면 단순한 귀납 규칙에 따라서 계산된 확률은 반복적으로 (우리가 동전-던지기를 고려하고 있기 때문에 우리는 1/2에 두는) 객관적 확률로부터 반복적으로 벗어날 것이다. 이 일탈이 발생할 때마다 귀납적 도박꾼은, 객관적 관점으로부터 호의적이지 않은 가능성을 수용할 각오를 해야 한다. 그러나 이것이 반드시 손실을 야기할 필요는 없다할지라도, (객관적으로) 예상되거나 개연적인 손실은 우리가 원하는 만큼 크게 만들어질 수 있다: 귀납적 확률들이 항진명제적이 될 수가 없다는 명백한 표시.
내가 믿는 바, 우리의 토론은 두 가지를 확립한다: (i) (해석된) 귀납적 계산의, 다시 말해서, 귀납적 확률의 일관성; 그리고 (ii) 그 일관성의 비-논리적 특성. 우리는 실제로 흄(Hume)의 인성론(Treatise)이후 216년이 지나서 후자(後者) 요점을 더 이상 논쟁해서는 안 된다; 그러나 관련된 구절들은 분명히 아직까지 합당한 주목을 받지 못했다. 흄은 우리로 하여금 ‘우리가 경험하지 않는 저 사례들은 우리가 경험을 했던 사례들을 닮았다’는 것을 밝히도록 허용할 유효한 입증적인 (혹은 논리적) 논증이 있을 리가 없다고 주장했다. 결과적으로, ‘심지어 대상들의 빈번하거나 부단한 결합을 관찰한 후에도, 우리에게는 우리가 경험했던 대상들을 초월하여 어떤 대상들에 관하여 추론을 할 근거가 없다’. 왜냐하면 ‘우리에게 경험이 있다고 언급된다면’ - 어떤 다른 대상들과 부단히 결합된 대상들이 지속적으로 그렇게 결합될 것이라고 우리에게 가르치는 경험 - 그렇다면 흄이 말하는 바, ‘왜 이 경험으로부터 우리는 우리가 경험하지 않은 저 과거의 사례들을 초월하여 어떤 결론을 형성하는가라는 나의 질문을 나는 재개할 것’이기 때문이다. 다시 말해서 귀납적 논리의 관행을 정당화하려는 시도는 옹호될 수 없으며 그 관행을 경험의 도움을 받아서 정당화하려는 시도는 틀림없이 무한소급을 낳는다.
그리하여 동일한 속성의 여하한 두 가지 사례들의 상호의존이나 관계를 확립하는 카르납의 규칙은 비-분석적 귀납적 원리이다; 그리고 그것이 옹호된다면 (그리고 흄의 무한소급이 회피되려면) 그것은 종합적 명제로서, 다시 말해서, 선험적으로 유효한 것으로서 옹호될 따름일 것이다.
그렇다면 우리는 그것을 선호하여 어떻게 논증할 수 있는가? 물론 초월적 논증을 통해서이다: 이것은 지금 칸트를 선험주의자 및 초월주의자로서 비웃는 모든 종류의 귀납적 논리학자들 가운데서 매우 유행되고 있다. (나는 칸트를 크게 찬양하지만 그가 선험적으로 유효하다고 믿었던 원칙들을 지지하여 초월적 논증을 긍정적으로 사용한 것은 그의 중차대한 실수라고 생각한다. 그럼에도 불구하고 아인슈타인 이전 오래 전인 당시에 강력한 정상참작 상황이 있었다.) 그 논증은 러셀과 제프리즈(Jeffreys), 그리고 라이헨바흐(Reichenbach)에게서 귀납법의 다양한 확률적 이론들과 관련하여 발견될 것이다.
카르납 또한 그 논증을 사용하지만 나의 눈에는 그에게 큰 명예가 되는 어떤 망설임이 있다. 왜냐하면 그가 (단순한 귀납 규칙의 어떤 특별한 형태의 선택에 해당하는) 기능 m✡을 자신이 선택한 것에 대하여 서술하기 때문이다:
‘앞선 고찰들은, 분명히 강력한 논증이 아닌 다음 논증이 m✡을 선호하여 제시될 수 있다는 것을 보여준다. 매우 단순하고 자체들 가장 자연스러운 기능들로 제시하는 두 가지 m-기능들 가운데서 m✡는 완전히 불합리하지 않은 유일한 것이다.’
다른 m- 기능인 ‘완전히 불합리한’ 기능을 선택하는 것은 내가 논리적 확률이라고 지칭한 것을 선택하는 것에 해당할 것이다. 그 기능의 ‘불합리성’은 물론 그 불합리성이 단순한 귀납 규칙의 어떤 형태도 함축하지 않았다는 사실에 놓여있다. 그러나 나의 관점에서, 확률적 논리는 귀납적이 아니기 때문에 이것은 다른 것일 리가 없다; 귀납적 확률은 논리학이 아니기 때문에; 그리고 귀납적 논리는 존재할 수 없기 때문에.
그러나 귀납적 논리가 존재할 수도 없고 존재하지도 않을지라도. 귀납적 논리학자들은 존재한다. 정말로 그 귀납적 논리학자들은 베이컨 이후 (아리스토텔레스 이후가 아니라면) 상당히 많았다. 그리고 그들은 그렇게 쉽게 반증되지 않는다. 이것은 귀납적 확률들이 - 다시 말해서 응용된 귀납적 계산들 - 항진명제적이 아니라할지라도 일관적일 것이기 때문이다. 그러나 귀납적 확률들은 귀납적 확률이 논리적 확률과 귀납적 확률 모두로부터 분명히 구분된다는 조건으로만 일관적이다. 왜냐하면 귀납적 확률의 확률 가치들은 우리가 본 바와 같이, 일반적으로 논리적 확률 및 심지어 동전 던지기와 같은 대칭적이고 독립적인 게임의 객관적 확률과 양립될 수 없기 때문이다. 나에게는 이 다양한 종류의 확률이, 통상적으로, 귀납적 논리학자들의 초월적 논증들에서 잘못 인식됨을 부언할 필요가 없다.
17. 이론들의 잉여.
과학적 발견의 논리에서 옹호된 가설의 방법은 정말로 매우 오래 되었다. 아마도 새로운 것은 예측적 시험들에 대한 태도이다. 이것들은 때때로 검증들이나 심지어 이론에 대한 증거들로서 간주되었다. 나중에 예측적 시험들은 ‘단순히’ 이론을 개연적으로 만들 수 있는 것으로서 간주되었다. 나는 예측적 시험들을 시도된 반증들로서 간주한다; 그리고 진지하고도 능란한 노력들에도 불구하고 예측적 시험들이 이론을 반증하는 데 성공하지 못한다는 조건으로만 나는 예측적 시험들이 이론을 입증할 수 있는 것으로서 간주한다. 이론들을 입증함으로써 예측적 시험들은 이론들은 ‘개연적’으로 느껴지도록 만들 수 있다 - 그러나 확률 계산을 충족시키는 ‘개연적’이라는 단어의 많은 의미 중에서 어떤 의미로는 아니다; 이런 이유 때문에 나는 ‘입증(corroboration)’에 (혹은 ‘확인[confirmation]’이나 ‘수용가능성[acceptability]’) 대하여 말하기를 선호한다.
가설의 방법이나 가설-연역적 방법(hypothetico-deductive method)이 지닌 중요성은 지금 일반적으로 인정되고 있으며, 심지어 이 방법을 전적으로 중요시하지 않는 귀납의 이론은 터무니없을 것이라는 점은 완벽하게 수용된다. 제프리즈(Jeffreys)나 카르납과 같은 주요 귀납주의자들 중 몇몇은 자신들의 방식을 벗어나서 이 요점을 강조했다. 제프리즈(Jeffreys)는 보편적 이론들과 그 이론들의 단순성의 문제를 자신의 귀납 이론의 핵심에 둔다. 그리고 카르납은, 자신의 저서의 서문 부분에서, ‘귀납’으로써 자신은 자료를
수집해서 그 자료를 일반화하는 방법이 아니라, 경험적으로 시험됨으로써 자유롭게-창작된 이론이 획득하는 ‘확인의 정도(degree of confirmation)’를 평가하는 방법을 의미한다고 강조한다.
카르납이 서술하는 바, ‘예를 들어 관찰적 결과들에 대한 보고서가 주어지고 우리가 충분히 확인되어 관찰된 사건들에 대하여 충분한 설명을 제공하는 가설을 발견하기를 원한다면, 우리를 자동적으로 최고의 가설이나 심지어 훌륭한 가설로 인도할 고정된 규칙들의 조합은 없다. 과학자가 합당한 가설을 떠올리는 것은 재간과 행운의 문제이다; 그리고 과학자가 합당한 가설을 발견한다면, 심지어 새로운 관찰들이 행하여지기 전에 훨씬 더 잘 관찰된 사실들에 들어맞을 또 다른 가설이 혹시 없을지를 그 과학자는 확신할 수 없다. 자동적 귀납 과정의 불가능성인 이 요점은 다른 사람들 가운데서 칼 포퍼에 의하여 특히 강조되었다... 칼 포퍼는 또한 아인슈타인의 서술을 인용한다...’
조금 뒤에 그는 다음과 같이 서술한다:
‘제시됨: 증거로서 한 문장; 원하는 것: 고도로 확인된 가설 h... 이 문제들을 해결하는 것에 대한 효과적인 절차는 없다; 그것이, 위에 언급된 바와 같이, 아인슈타인과 포퍼에 의하여 강조된 요점이다.’
귀납적 논리가 해결하려고 노력해야 하는 문제는, 카르납의 프로그램에 따르면, 가설들의 발견이 아니라 가설들이 지닌 확인의 정도를 결정하는 것이다:
‘제시됨: e와 h라는 두 가지 문장. 원하는 것: 증거 e에 근거한 h의 확인 정도의... 가치,’
이제 이 프로그램은 분명히 가설들의 방법을 합당하게 주목한다; 그래서 나는 인용된 구절들에서 카르납에 의하여 언급된 모든 것에 전적으로 동의한다 (물론 내가 확률 계산의 의미에서 그리고 적어도 ‘귀납적 확률’로서 ‘확인의 정도’를 확률로서 해석하는 것을 수용할 수 없었다는 것을 제외하고).
그러나 이 충분히-정의(定義)된 프로그램은 가장 놀라운 정도로 자체의 수행과 충돌한다. 먼저, 이 저서 가운데서, 카르납은 우리로 하여금 주어진 증거를 토대로 최고로 확인된 가설을, 다시 말해서 가장 개연적인 가설을 ‘발견하도록’ 혹은 더 정확하게는 계산하도록 허용하는 방법을 도입한다. 그러나 이것은 물론 우리가 더 이상 자유롭게 가설을 창안할 수 없다는 것을 의미한다; 혹은 더 정확하게, 우리가 단지 최고의 가설을 계산할 수 있었기 때문에 훌륭한 가설을 발견하려고 애를 쓰면서 우리의 두뇌를 괴롭힐 필요가 없었다는 것을 의미한다.
그리하여 가설의 방법은, 카르납의 프로그램을 직접적으로 부인하며 완전히 불필요하게 된다. 그리고 자신의 원래 프로그램을 명시적으로 배척하지 않고, 카르납 자신은 이 잉여를 수용한다. 저서의 말미인 ‘예측들을 하는 데 법칙들이 필요한가?’라는 제목이 붙은 절에서 (754쪽 이하) 그는, 자신이 얻은 결과들을 요약한 후에 그리고 보편적 ‘법칙들’이나 이론들이 실제로 과학자에 (X 씨) 의하여 필요하지 않음을 밝힌 후에 다음과 같이 서술한다: ‘그리하여 통상적으로 믿어지는 바와 같이, 우리는 X가 법칙 l을 통하여 우회적인 방식을 취할 필요가 없다는 것을 안다; 그는 대신에 자신의 관찰적 지식으로부터 나아갈 수 있다... 직접적으로 단칭 예측으로...’ 그는 계속하여 말한다:
‘일상생활에서 관습적 사고는 마찬가지로 이 지름길을 흔히 취하는데 그 지름길은 이제 귀납적 논리에 의하여 정당화된다.’ 그리고 그는 결론을 내린다:
‘법칙들의 사용이 예측을 하는 데 필수불가결하지 않음을 우리는 안다. 그럼에도 불구하고 법칙들의 사용은 물론 물리학, 생물학, 심리학, 기타 등등에 관한 저술에서 보편적 법칙들 서술하는 데 유용하다.’
그의 과학철학에 따르면 순수과학이 예측하는 것을 제외하고 다른 과업이 없기 때문에, 이것은 과학적 법칙들에게 전혀 기능이 없다는 것을 의미한다; 과학적 법칙들은 완전히 불필요하다. 사실상 카르납의 논증은 그 법칙들이 불필요한 우회로들이어서 그 법칙들에게 오캄의 면도날이나 (마흐에 의하여 원래 보편적 법칙들의 유용성을 보여주기 위하여 우연히 사용되었던) 마흐의 경제 원칙을 적용함으로써 배척되어야 한다는 것을 보여준다. 그러나 이 모든 것은 가설-연역적 방법의 잉여성을 의미한다. ‘합당한 가설을 떠올리기’ 위한 ‘재간이나 행운’에 대한 필요성은 더 이상 없다: 의도된 합당한 가설의 종류는 보편적 이론이었고 보편적 이론들은 더 이상 ‘필요하지’ 않다; 보편적 이론들은 더 이상 ‘필수불가결’하지 않다. 요컨대 과학의 방법이 가설들의 방법이라는 믿음은 완전이 오류이다.
나에게는, 자체의 부정적 사용에서라면, 초월적 논증을 이 결과에 적용하는 경향이 있다. 우리에게 과학적 이론들은 불필요하다고 말을 함으로써 가설-연역적 방법을 배척하는 과학의 이론은 ‘전적으로 불합리’하다; 우리에게
우리는 경험으로부터 배울 수 없다고 말하는 이론이 그러한 바와 꼭 마찬가지로.
18. 이론을 시험하는 것은 소용없음.
앞 절에서 내가 배척한 결과는 카르납에 의하여 명시적으로 설명되지만 그의 이론에 전혀 고유하지 않다. 이런저런 방식으로 다양한 귀납의 확률 이론들 모두는 너무 많은 것을 확립하여, 대부부의 경우에서 더 많은 것이 의도된다; 그 이론들은 이론이 시험된 정도에 추정치를 부여할 뿐만 아니라 모든 경우에 어떤 이론을 우리가 최고의 이론으로서, 다시 말해서 가장 개연적인 이론으로서 수용해야 하는지를 명령한다. 결과적으로 이론을 시험하는 문제는 더 이상 발생하지 않는다. 그 문제는 가치가 없게 된다. 귀납법은 추측을 시험하거나 시험의 결과를 평가하는 방법으로 밝혀진다; 더 정확하게, 귀납법은 귀납적 추론에 의하여 최고의 이론을 계산하는 방법이 된다.
이것은 귀납의 단순한 규칙을 자체의 다양한 형태 중 어떤 형태에서 적용하는 것에 기인한다 (위 5절의 주석 1 참조).
귀납의 단순한 규칙은 다음 경우의 확률이 무엇인지를 우리에게 알려준다. ‘a’로써 우리가 다음 경우나 다음 사례가 속성 A를 지닐 것을, 그리고 ‘b’로써 A의 m/n 사례들을 포함하는 우리의 과거 경험을 의미한다면, 그 단순한 규칙은 우리가 거의
p(a,b) = m/n = r을
지닌다고, 그리고 그 근사치는 증가하는 n과 비례하여 더 나아진다고 우리에게 알려준다.
이 공식이 과학자의 흥미를 끄는 한, 그 공식의 주요 요점은 그 공식으로 인하여 우리가 빈도 가설을 도출할 것이라는 점이다. 우리가 베르누이(Bernoulli)의 정리를 통하여 자주성을 상정할 수 있다면, 이것을 실행될 것이다. 이 정리가 없다면, 여하한 사례들의 집합에서 속성 A를 지닌 사례들의 ‘가장 개연적인 빈도’는 우리가 귀납적 규칙에 의하여 계산한 확률에 해당된다, 다시 말해서 r에 해당된다.
그리하여 우리는 r을 ‘여하한 미래 집합에서 A의 빈도에 대한 최고의 추정치’라고 지칭할 것이다.
우리가 우리의 형식론(formalism)에 따라서 귀납적 확률
p(a,b) = r을
(자체에 해당하는) 상응하는 빈도의 최고 추정치로부터 구분하고 싶어 한다면, 우리는 귀납적 규칙에 의하여 계산된 귀납적 확률을 ‘p1 ’로써 표시하여 ‘다음 사례는 속성 A를 지닐 것이라는 귀납적 확률이 (b가 주어진) r에 해당할 것이다’에 대하여
p1(a,b) = r라고
기술할 것이다.
대조적으로 통계적 확률, 즉 상대적 확률의 최고 추정치에 대하여 우리는 ‘p’를 기술할 것이다. 우리의 상징성을 단순화하기 위하여 우리는 p5 에서의 글자 ‘a’를 p1 -표현에서 글자 ‘a’와 다소 다르게 읽는 것에 동의할 수 있다. 다시 말해서 우리는
p5(a,b) = r라고
기록하여 ‘여하한 미래 사례들의 집합에서 속성 A를 지닌 사례들의 통계적 확률이나 상대적 빈도에 대한 최상의 추정치는 (b가 주어진) r이다’를 의미한다.
이제 베르누이의 정리가 적용될 수 있다면 우리는
(1) p5(a,b) = p1(a,b)을
얻는다; 우리가 이것을 증명할 수 없다면 (b에 의하여 기술된 조건들의 독립성에 관하여, 예를 들어, b가 항아리 속에 있는 공들의 혼합을 요구하는지를 우리가 충분히 알지 못하기 때문에) 우리는 여전히 공식 (1)을 가정으로서, 또는 아마도 정의(定義)로써 도입할 수 있다. 그것은 보다 간단하게
(2) p5 = p1✡로써
표현될 수 있다.
이 공식은 내가 인식하는 한, 빈도들에 대한 모든 귀납적 추정치들의 토대가 된다. (물론, p5 = p1이 가정으로서 도입된다면 그것은 b가 독립을 요구한다는 것을 가정하는 것에 해당된다.)
이제 우리의 모든 객관적 가설들이 빈도 추정치들로서 해석될 것이다. (내가 이 특별한 해석을 지금 추천한다는 것이 아니다: 나는 빈도 이론보다 경향 해석을 선호한다. 그러나 이 요점은 여기서 중요하지 않다; 게다가 우리는 ‘p5’대신에 ‘pp’에 대하여, 다시 말해서 경향에 대한 최상의 추정치에 대하여 정확하게 동일한 결과를 얻을 것이다.) 그리하여 (1)이나 (2)는 주관적 확률에 관한 객관적 확률 가설들을 설명한다고 (또는 ‘해석한다고’) 언급될 것이다. 이렇게 하는 것이, 결국, 주관적 이론의 주요 임무이다; 그리고 (1)은 주관적 이론의 임무가 완수되었음을 표현한다. 그리하여 (1)과 같은 공식은, 거의 명시적으로 서술되지 않는다 할지라도 (정말로 카르납의 저서에 그러한 바와 같이), 모든 주관적 이론들 안에 본질적으로 함축되어 있다.
귀납적 논리학자들은 귀납적 논리를 신뢰하여, 따라서 귀납적 확률을 논리적 확률로서 해석한다. 이것은 그들의 견해에서 형식
p1(a,b) = r의
모든 참인 공식이 틀림없이 항진명제적거나 분석적임을, 그리고 이 형식의 모든 거짓 공식이 자기-모순적임을 의미한다.
이제 우리는 (1)로부터 즉각적으로
(3) p1(a,b) = r이라는 조건으로만 p5(a,b) = r을
도출할 수 있다. (1)이 분석적이라면 이 공식을 틀림없이 분석적이다; 그래서 우리가 발견하는 바, p1이 귀납적 확률일 뿐만 아니라 논리적 확률이기도 하다면 형식
(4) p5(a,b) = r의
모든 공식은 틀림없이 항진명제적(분석적)이거나 자기-모순적이다; 그리고 참이라면 그 공식은 틀림없이 항진명제적이다.
그러나 이것은 모든 우리의 ‘최상의’ 객관적 확률 가설들이 항진명제적임을 암시한다.
이 결과는 분명히 터무니없다. 왜냐하면 그 결과가 참인 가설들의 가능성을 파괴하기 때문이다: 이것들과 같은 추정치들은 실험들을 통하여 시험될 수 없다.
귀납적 확률은 논리적 확률이라는, 혹은 다시 말해서 귀납적 계산과 관련된 모든 참인 공식들은 항진명제적이라는 견해에 대한 또 다른 반박으로서 우리는 이것을 수용할 것이다.
이 비판에 반대하여, 우리가 위 11절에서 토론된 ‘면죄의 규칙(rule of absolution)’을 (4)에 적용한다면 우리는 (4)로부터 참으로 경험적인 서술을 얻을 수 있다는 반론이 제기될 것이다. 이 반론은 ‘면죄의 법칙’이 통계적 추정치들까지 확대되어야 한다는 묵시적 암시를 포함한다. 이 확대는 매우 의심스러운 과정일 텐데, b가 우리가 지닌 전체 지식이기 때문에 우리가 b와 p5(a,b) = r로부터 면죄의 법칙을 통하여 다음을 얻을 것을 의미할 것이다:
(5) ‘지금 순간에, 속성 A를 지닌 사례들의 빈도에 대한 추정치는 (여하한 사례들의 조합 내부에서) 이 빈도가 r이라는 점이다.’
이 암시와 그 결과를 간단하게 토론하자.
(i) 서술 (5)는 빈도 이론의 관점에 매우 이상한데 왜냐하면 면죄의 규칙을 적용한 덕분으로 결과 A에 대한 조건들이 서술되지 않기 때문이다. (다시 말해서, 어떤 추론 조합도 수용되는데 그 조합은 모순을 낳거나 혹은 빈도 이론을 적용 불가능하게 만든다. 이 난제는 근본적이어서 a를 조건적 서술로 수용함으로써, 그리고 A를 조건적 속성으로서 수용함으로 제거될 수 없다.)
(ii) 우리가 이 모든 문제들을 간과한다할지라도 다음 상황이 남는다.
물론 (5)는 토론된 제안에 근거하여 경험적이 된다: 그것은 경험적 보고서와 함께 - b가 우리가 현재 지닌 전체 지식이라는 보고서 - 면죄의 규칙을 적용함으로써 (4)로부터 획득되었다. 그러나 이것은 (5)가 이 경험적 보고서에 의하여 논리적으로 수반됨을 의미한다. 그리하여 그것은 가설이 아니요, 대담한 발명품도 아니요, 추측도 아니요, 시험들에 제출될 상상도 아니다. 더 정확하게 그것은 우리의 과거 경험에 의하여 우리에게 부과된다; 그것은 우리의 과거 경험으로부터 추론될 수 있다.
그러나 이것이 그렇다면, (5)가 우리의 과거 지식에 의하여 확실하게 논리적으로 수반된다면. 이 지식의 일부만 될 수 있다. 그리하여 (5)는 - 자체의 언어적 표현에도 불구하고 - 미래의 경우들에 관하여 전혀 말하지 않는다. 그것은 단지 완전히 자의적인 결정에 의하여 ‘미래에 대한 최상의 추정치’라는 이름을 과거에 관한 요약 보고서에 첨부하는 결과이다.
이 모든 것들은 (4)가 분석적이라는 견해의 불쾌한 결과들로부터 도피하려는 시도의 결과들이다. 우리가 이 견해를 포기한다면 우리는 본질적으로 라이헨바흐(Reichenbach)의 이론인 이론에 도달한다. 라이헨바흐에 따르면 우리는 초월적 논증에 근거하여 귀납적 규칙이나 공식 (1)을 수용해야 한다. 추정치 p5(a,b) = m/n = r에 도달하는 전체 과정은, 그가 강조하는 바와 같이, 항진명제적 과정이다; 대조적으로 그는 그 과정을 ‘도박’이라고 지칭한다. 그것으로써 그는 우리가 p5(a,b) = m/n = r을 최상의 추정치로서 채택하면서 우리가 중대한 위험을 초래한다고 강조하고 싶어 한다. 그럼에도 불구하고 그는 그것이 우리에게 열려진 유일한 합당한 방식이자 최상의 방식이기 때문에 우리가 그것을 채택해야 한다고 초월적으로 논증한다. 모든 다른 추정치는 더 나쁘고 자의적일 것이다. 이것은 진정한 가설의 불확실성과 함께
p5(a,b) = r을
진정한 가설로 만드는 견해이다; 그리고 그것은 그리하여 그것이 분석적이고 그리하여 시험될 수 없다는 우리의 비판을 회피한다.
그럼에도 불구하고 라이헨바흐의 ‘도박들’은 틀림없이 분석적은 아닐지라도, 분석적이라면 시험될 수 없는 것과 마찬가지로 시험될 수 없다.
왜냐하면 시험이 무엇으로 구성될 것인가? 이기 때문이다. 시험은 또 다른 시험을 유발할 것인데 그 또 다른 시험은 속성 A를 지니거나 지니지 않을 것이다. 그 또 다른 시험이 속성 A를 지닌다면 우리는 새롭게 결정된 r을 획득해서 r = (m + 1)/(n +1)이 된다. 그 또 다른 시험이 속성 A를 지니지 않으면 r은 m/(n +1)이 된다. 두 가지 경우 모두에서 우리는 다시 (1)에 의하여 결정되는 가치를 채택해야 한다. 어떤 시험을 통해서도 우리는 어떤 다른 곳에 도달할 수 없다. 새로운 시험은 새로운 b에 상응하는 p5(a,b)의 저 가치를 자동적으로 야기하면서 b를 변경시킬 따름이다.
그리하여 다시 가설적 방식은 폐기된다. 우리는 자유롭게 r을 추측하여 우리의 추측을 시험할 수 없다; 대신에 r의 가치는 과거의 경험들에 의하여 독특하게 결정된다. 이론들은 자유롭게 창조된 가설들이 아니다 - 이론들은 귀납적 규칙을 통하여 추론된다. 그러므로 앞 절의 결론적인 초월적 비판은 여기서 다시 적용된다. 우리는 가설들의 방법을 망쳐놓는 과학적 방법의 분석을 배척해야 한다.
19. 이 비판의 요약.
확률의 주관적 이론에 대한 나의 비판에서 나는 사소한 결점들을 무시하고 그 이론의 주요 개념들에 집중하려고 노력했다: 완벽한 지식과 (우리가 증거 b로부터 a <v:f eqn="if lineDrawn pixelLineWidth 0"></v:f><v:f eqn="sum @0 1 0"></v:f><v:f eqn="sum 0 0 @1"></v:f><v:f eqn="prod @2 1 2"></v:f><v:f eqn="prod @3 21600 pixelWidth"></v:f><v:f eqn="prod @3 21600 pixelHeight"></v:f><v:f eqn="sum @0 0 1"></v:f><v:f eqn="prod @6 1 2"></v:f><v:f eqn="prod @7 21600 pixelWidth"></v:f><v:f eqn="sum @8 21600 0"></v:f><v:f eqn="prod @7 21600 pixelHeight"></v:f><v:f eqn="sum @10 21600 0"></v:f><o:lock aspectratio="t" v:ext="edit"></o:lock><w:wrap type="topAndBottom"></w:wrap>나 를 도출할 수 있다면) 부분적 지식이나 개연적 지식 (증거 b가 완벽한 지식에 대하여 부족하다면) 사이의 그 이론의 구분; 연역적 논리의 일반화로서의 그 이론의 확률 해석; 연역의 (그리하여 논리의) 일반화로서 귀납에 대한 심층적이고도 매우 다른 그 이론의 해석; 귀납적 확률과 논리적 확률에 대한 그 이론의 결과적 동일시; 귀납적 확률의 원리라는 형태로 (단순한 귀납적 규칙과 같은) 귀납의 원리를 획득하여 그 원리를 논리적 확률의 원리로서 해석하려는 그 이론의 시도; 그리고 마지막으로 예측적인 확률적 가설들이 우리의 과거 관찰들에 의하여 단순한 귀납적 규칙에 따라서 완벽하게 결정된다는 (우리가 명백히 그러한 바와 같이 최상의 가설들이나 ‘추정치들’을 가지고 싶어 한다면) 아마도 다소 비의도적인 그 이론의 결과.
저것이 주관주의적 프로그램이다. 한 가지 예외를 두고 이 개념들의 모든 한 가지 개념은 오류이다. 주관주의적 프로그램을 연역적 논리학의 일반화로서 수용하는 옹호될 수 있는 확률 계산의 논리적 해석이 있다는 것을 나는
인정한 준비가 되어 있다. 그러나 이 논리적 해석은 귀납에 대하여 어떤 지원도 하지 않는다; 그리고 주관주의적 프로그램에 속하는 모든 다른 아이디어들은 모순과 역설을 낳는다.
나는 내가 다른 곳에서 상세하게 비판한 많은 요점들과, 비교적 제한된 관심거리인 몇 가지 심층적 역설들을 여기서 생략했다.
나는 이 임무를 떠맡았는데, 내가 어떤 철학적 이론들과 싸우고 싶어서가 아니라 주로 물리학 자체 내부에서 주관적 이론에 의하여 수행되는 놀라운 역할 때문이다: 물리학 안에서와 물리학에 관한 철학 안에서는 확률 문제들을 토론하는 방식은 주로 객관적 문제들로부터 주관적 논증들로 지속적으로 변환하여 다시 객관적 해결책들로 돌아오는 것으로 구성된다. 한 가지 해석으로부터 다른 해석으로 지속적으로의 이 변환이 없었다면 주관적 이론의 취약성은 오래 전에 발견되었을 텐데. 이 왕복운동은 철학자들 사이에서 그러한 바와 같이 물리학자들 사이에서도 (아인슈타인을 포함하여) 빈번하다.
물리학에서 주관적 이론에 의하여 수행되는 역할은 주로 결정론적 견해들이나 결정론적 견해들의 잔재들이 심지어 비결정론을 옹호하는 사람들 사이에서도 여전히 영향력이 있다는 사실에 의하여 설명될 수 있다: 결정론은 단순히 확률의 객관적 해석에 대한 여지를 남기지 않는다는 이유로 물리학에서 확률의 주관적 해석을 야기한다.
확률에 대한 주관적 이론이 지닌 취약성은 모든 주관주의적 (감각주의적, 현상주의적, 유아론적, 기타 등등) 인식론에 의하여 공유된다. 주관주의적 인식론으로써 나는 ‘당신은 어떻게 아는가?’라는 질문을 ‘당신의 주장의 근거는 무엇인가? 어떤 관찰들로 인하여 당신은 [그것]에 도달했는가...?’라는 의미로 답변하려는 시도를 의미한다. 이것들과 같은 주관주의적이고 귀납주의적인 질문들은 통상적인 주관주의적이고 귀납주의적인 답변들을 간청한다. 내 자신의 답변은, ‘나는 알지 못한다: 나의 주장은 단지 추측이다. 나를 나의 주장에 이르게 했었을 관찰들에는 신경을 쓰지 말라. 대신에, 당신은 나의 주장을 비판함으로써 그리고 나의 주장이 그럴 가능성이 높은 바와 같이 나의 주장이 오류라면 나의 주장을 반증할 몇 가지 실험적 시험들을 고안하는 데서 당신의 재능을 사용함으로써 당신은 나에게 도움을 줄 것이다’가 될 터이다.
단순한 상상들은, 그러나 여전히 유행한다. 과학적 이론들은 과거의 경험에 보다 직접적으로 ‘근거해야’ 하고 기껏해야 귀납법은 도박을 포함하고 있다고 인정된다. 나는 왜 도박이 상상보다 더 나아야 하는지 알지 못한다; 특히 주관적-귀납적 이론이 맹목적인 도박과 다소 비슷하게 보이기 시작했음을 우리가 기억한다면.
그러나 주관주의의 일반적인 주제는 이 부분에서 우리의 실제적 임무로부터 우리를 떼어놓는 주제이다: 확률의 분석.
✡ 부록 (1981년 1월). 확률주의적 귀납법의 비판에 대한 요약.
I
많은 사람들을 유혹하여 확률주의적 귀납법을 수용하도록 만드는 것은 두 가지이다:
(A) 가설이 다양한 환경에서 시험될 때 반복적으로 성공적이라면, 그리고 특히 이전에 예상되지 않은 예측들을 하는 데 성공적이라면 비개연적인 우연에 기인만 할리 없다는 유효하지만 오해된 직감적인 개념. (‘비개연적인 우연에 기인하지’ 않는다면, 우리에게는 그것이 가설의 높은 확률에 틀림없이 기인한다고 유효하지 않게 추리하는 경향이 있다.)
(B) 확률 계산에 따라서 서술의 확률은 그 서술을 선호하는 증가하는 증거와 함께, 특히 성공적인 예측들의 축적과 함께 증가한다는 (처음에 그 확률이 0이 아니라면) 의심할 수 없는 사실. 확률 계산과 관련하여: h를 자체의 초기 확률인 (혹은 이전 확률) p(h)가, 0과 다르다면, 우리가 원하는 만큼 작을 것인 가설로 하라. e를 그 가설을 선호하는 어떤 증거로 하라. 그렇다면 우리는, e2가 e1에 아직 포함되지 않은 선호하는 증거를 포함한다면,
p(h,e) > p(h)뿐만 아니라
p(h,e2)> p(h,e1)을
얻는다. 그리하여 h의 확률은 축적되는 선호하는 증거와 함께 지속적으로 증가한다.
확률 계산으로부터 귀결되는 이 부인될 수 없고 유혹적인 사실은 많은 사람들을 유혹하여 여하한 가설 h의 확률 p(h,e)는 축적되는 선호하는 증거 e와 함께 틀림없이 1을 지향한다.
논증 (A)와 (B)는, 많은 과학철학자들을 포함하여, 많은 사람들에게 강력했다.
나는 (B)가, 유효할지라도, 전적으로 오해를 낳는다는 것을 먼저 밝히겠다. (B)는 하나의 가설의 확률 변화와 변화하는 증거의 비교에 근거한다. 우리가 두 가지 이상의 가설들을 그 가설들 모두에게 호의적인 한 가지 불변의 증거 e와 비교하면 사태는 완전히 다르게 보인다. 그럴 경우에 우리는 증거가 확률에 행한 영향력이 귀납과 전혀 관계없음을 즉각적으로 발견한다.
이것은 여기 II절에서 밝혀질 것이다.
II
h1, h2,...., hn을 경쟁하면서 쌍으로 양립할 수 없는 가설들의 수열로 하라. e를 n 가설들의 각각으로부터 도출될 수 있는 관련된 증거로 (성공적인 예측들) 하면 우리는 p(hie) = p(hi) 및 0 ≠ p(e) ≠ 1을 얻는다. 그 다음에 우리는 여기 위 1절에서처럼 확률 계산의 일반적인 곱셈 정리로부터 (과학적 발견의 논리, 324쪽, (1)참조)
(1) p(hi,e) > p(hi)를
즉시 얻는다; 다시 말해서 호의적인 증거 e는 확률을 증가시킨다.
그러나 우리는 사소하지만 근본적 정리 (2)인
(2) p(hi) < p(hj)라는 조건으로만 p(hi,e) < p(hj,e)를
또한 얻는다.
정리 (2)는 충격적이다. 그것은 호의적인 증거 e가, (1)에 따라서 확률을 높일지라도, 그럼에도 불구하고 첫 번째 인상들에 반하여 모든 것을 정확하게 과거의 상태로 남겨놓는다는 것을 밝힌다. 그것은 hj라기보다는 hi를 선호하지 않는다. 반대로 우리가 증거 이전에 우리의 가설들에게 덧붙였던 순서는 남아있다. 그 순서는 여하한 호의적의 증거에 의해서도 흔들리지 않는다. 증거는 순서에 영향을 미칠 수 없다.
왜 이것은 충격적인가? h2가 e에 추가하여 e에 의하여 완벽하게 뒷받침되지 않는 주장들을 하여 h2가 전혀 e의 일반화가 아닌 반면, h1은 전형적인 e의 ‘귀납적 일반화’일 것이기 때문이다; 혹은 그 반대.
다음 보기들을 고찰하라.
e는 백조들은 희다는, 그리고 흰 백조들 외에는 어떤 백조도 관찰되지 않았다는 백만 건의 관찰된 백조들을 보고한다.
h1은 ‘모든 백조들은 희다’고 말한다.
h2는 ‘그리스와 이태리와 프랑스의 백조들은 희다; 영국과 스칸디나비아에서 백조들은 붉다; 중앙아시아에서 백조들은 초록이다; 아프리카에서 백조들은 푸르다; 그리고 호주에서 백조들은 검다’고 말한다. 배경 지식인 b는 그리스, 이태리 그리고 프랑스 외부에서는 어떤 백조도 관찰되지 않았음을 암시한다.
이제 h1를 전 우주에 적용되도록 만들면 (전 우주에서 전자 전하[the electronic charge]가 불변이라고 우리가 상상함을 기억하라) h1은 h2보다 처음에 동등한 확률을 갖거나 훨씬 확률이 낮다 (이 문장의 원문은 Now by making h1 apply to the whole universe (remember that we conjecture that the electronic charge is constant in the whole universe) may make it initially equally or even less probable than h2.인데 어법상 by가 없어야 할 것이다. 역자). (그렇지 않으면 우리는 h2를 약화시켜 더 개연적으로 만들 수 있다.) 그리하여 우리는 p(h1) ≼ p(h2)를 상정할 수 있다; 그리고 우리는 우리가 b에 관하여 언급한 것으로부터, 또한 p(h1,b) ≼ p(h2,b)를 상정할 수 있다. 아무튼 곱셈 정리로부터, e가 h1b 및 h2b 모두로부터 귀결되기 때문에, 우리는
p(h1,eb) = p(h1,b)
p(h2,eb) p(h2,b)를
얻게 될 것이며 그리하여
p(h1,b) < p(h2,b)라는 조건으로만 p(h1,eb) < p(h2,eb)이다.
그리하여 증거 e는 환상적이고 자의적인 가설 h2보다 (증거 e에 비추어 환상적이고 자의적인) 조금도 간단한 h1의 일반화를 더 잘 뒷받침하지 않는다.
이것은 I절의 논증 (B)와 이 절의 관계 (1)이, 귀납법 즉 귀납적 일반화를 뒷받침하는 것으로서 수용된다면, 잘못 해석된다는 것을 보여준다. 그리고 그것은 확률 계산이 귀납이론으로서 전혀 유용하지 못함을 보여준다.
물론 증거 e는 자체가 호의적이지 않은 가설의 확률을 변화시킬 수 있다. 증거 e는, 더욱 특히, 가설과 양립할 수 없다면 가설을 녹초로 만들 수 있다. 그러나 이것은 우리가 이 지점에서 흥미를 갖는 것이 아니다. (그리고 증거가 자체가 반증하는 가설의 확률을 0까지 감소시킬지라도, 우리에게는 분명히 이 상황을 묘사하는 데 확률 계산이 필요하지 않다.)
III
문제를 보다 구체적으로 만들기 위하여 h1과 h2를 뉴튼과 아인슈타인의 중력 이론들로 하고, e를 1917년에 이용 가능한 증거로 하면 (우리는 심지어 수성의 근일점[近日點: perihelion]의 사소한 움직임에 관한 증거도 포함시킬 수 있는데 당시 아무도 그 증거를 뉴튼의 이론에 관한 심각한 문제로서 생각하지 않았다), 우리는 p(h1e) = p(h1)를 얻는다. 우리는 p(h1)이 p(h2)보다 크다고 혹은 작다고 혹은 동등하다고 표현할지를 알지 못한다; 그러나 e가 두 가지 이론 모두에 의하여 설명될 수 있다면 경험적 증거 e는, (2)에 따라서 상대적 확률들에 어떤 관계도 있을 수가 없다.
이제 이 상황은 전형적이다: 모든 이론 h1에 대하여 그리고 모든 증거 e에 대하여 항상 이론 h2가 존재하는데 이론 h2는 아인슈타인의 이론이 뉴튼의 이론에 관련되는 바와 같이 h1에 관련된다. 이론 h2는 ‘축약적’이거나 ‘아름답’거나 ‘단순하지’는 않을 것이지만 이것은 다른 문제이다. 이론 h2는 항상 구축될 수 있다. 동일한 방식으로 우리는 심층적 h3을 구축할 수 있는데 h1그리고 h2, 기타 등등과 양립할 수 없다. 이 고찰로 인하여, 처음에 너무 다르지 않은 이전 (혹은 ‘절대적’) 확률 p(h1), p(h2)를 만든다면 우리는 뒷받침하는 증거가 주어진 어떤 가설에 대해서도 1/2만큼 큰 확률을 얻지 못할 것이다. (정말로 우리가 베이스 학파[Bayesians]처럼, p(h1) = p(h2) = p(h3) = ...과 같은 것인 유명한 베이스 학파원들에 의하여 최대화하는 ‘확률주의적 엔트로피[probabilistic entropy]’의 원칙을 통하여 옹호되는 전제로서 시작한다면, 우리는 틀림없이 p(h1) = 0을 얻는다; 그러나 그 전제가 과학적 발견의 논리, 부록 ✡vii에 서술된 요점을 뒷받침하는 데 사용될 수 있다할지라도, 이것은 여기서 나의 요점이 아니다) 여기서 나의 요점은 심지어 1/2에 근접하는 확률을 우리가, 가장 탁월한 증거를 고려하여, 여하한 가설에 합리적으로 귀속시킬 수 없다는 것이다; 확률 계산의 의미에서의 확률은 우리가 여기 I절 (A)에서 설명된 우리의 직감을 설명하기 위하여 우리가 추구하는 도구가 될 수 없다. 우리가 (B)에 의하여 오해했다는 것은 틀림없이 분명하다. 왜냐하면 1/2미만의 확률은, 물론, 비개연성이기 때문이다. 그리하여 우리는 우리의 귀납적 직감을, 우리의 가설들이 항상 비개연적으로 남아있을 것임을 그리고 경험적 증거는 증거를 설명할 수 없는 저 가설들을 제외하고 가설들의 확률의 순서에 영향을 미치지 않음을 우리에게 밝히는 확률 계산에 의하여 설명할 수 없다.
메모:
우리가 e에 덧붙여, 우리의 배경지식과 초기 조건을 포함하는 변수 b를 도처에 도입하여 우리가
(1') p(h, be) > p(h,b)
및
(2') p(h1, b) < p(h2,b)라는 조건으로만 p(h1, be) < p(h2,be)를
얻는다면 여기서 언급된 것에는 어떤 영향도 없다.
IV
II절의 우리의 정리 (2)는 내가 생각하기에 15절의 결과들이 온전함을 보여준다. 정말로 증거 e는 가설에게 (확률주의적인) 귀납적 지지를 보내지 않는다. 증거 e는 정확하게 e를 포함하되 더 이상 포함하지 않는 가설의 내용의 저 부분을 제외하고 가설 내부에서 어떤 것도 뒷받침하지 않는다. 그것은 흄(Hume)이 그 증거를 본 것과 정확하게 같다. 확률 이론은 자체 내부에 확충적인 것을 지니지 않는다: 확률주의적인 확충적 귀납법은 없다.
그럼에도 불구하고 I절, (A)에서 설명된 직감은 유효하다. 이론 h가 충분히 입증되었다면, 그 이론이 진리-유사할 것임은 고도로 개연적이다. 다시 말해서 그 이론이 사실들 중 몇 가지와 잘 일치한다는 것. 이것은 강력하고도 잘-시험된 이론의 예측적 성공이 단지 우연일 것임은 매우 비개연적이라는 의미에서 고도로 개연적이다.
그러나 그것은 h를 ‘개연적’으로 만들지 않는다: 왜냐하면 h가 개연적이라고 말하는 것은, h가 참인 것은 아닌 것보다 더 개연적이라고 말하는 것이기 때문이다. 이것은 h가 세상의 모든 사실들과 일치하는 것이 아닌 것보다 더 개연적임을 의미한다: 반대 사례가 존재하는 않음을, h를 부정하는 사실이 없음을. 그러나 어떤 한정된 증거 e도 우리에게 그렇게 말할 수 없다.
사실주의와 과학의 목표 II부 확률의 경향 해석 II장 확률적 귀납법 비판.hwp
'칼포퍼 원전+번역문' 카테고리의 다른 글
열린 우주: 비결정론을 위한 논증, 서문 (0) | 2013.06.07 |
---|---|
사실주의와 과학의 목표, III장 확률에 관한 객관적 이론들에 대한 언급 (0) | 2013.02.20 |
사실주의와 과학의 목표, II장 구획설정 (0) | 2012.01.09 |
사실주의와 과학의 목표, 1부 비판적 접근, 1장 귀납법 (2017년 12월 2일 수정본) (0) | 2011.12.18 |
사실주의와 과학의 목표 - 서문, 1956년 - (0) | 2011.08.02 |