10
입증, 즉 이론이 시험을 견디는 정도
이론들은 검증될 수 없지만 ‘입증’될 수는 있다.
이론들을 참도 아니고 거짓도 아닌 것으로서 그러나 대신에 더 개연적이거나 덜 개연적인 것으로서 기술하는 시도가 흔히 실행되었다. 귀납적 논리는, 더욱 특히, ‘참’과 ‘거짓’이라는 두 가지 가치들 뿐만 아니라 확률의 등급들 또한 서술들에 귀속시킬 것인 논리로서 발전되었다; 여기서 ‘확률 논리학’으로 지칭될 논리학의 유형. 확률 논리학을 신봉하는 사람들에 따르면, 귀납이 서술의 확률 등급을 결정해야 한다. 그래서 귀납의 원리가 귀납된 서술이 ‘개연적으로 타당하다’는 것을 확인해야 하거나 반대로 그 서술을 개연적으로 만들어야 ㅡ 왜냐하면 귀납의 원리 자체가 아마도 유일하게 ‘개연적으로 타당할’ 것이 때문에 ㅡ 한다. 그럼에도 불구하고 내 생각에, 가설들이 지닌 확률에 대한 전체 문제는 잘못 이해된다. 가설이 지닌 확률을 토론하는 대신에 우리는 가설이 무슨 시험들, 무슨 시련들을 견디어냈는지를 평가하려고 노력해야 한다; 다시 말해서, 가설이 시험들을 막아냄에 의하여 자체의 생존 적합성을 어디까지 증명할 수 있었는지를 우리는 평가하려고 노력해야 한다. 요컨대, 가설이 어디까지 ‘입증’되었는지를 평가하려고 노력해야 한다.*
79 소위 가설들에 대한 검증에 관하여
이론들이 검증될 수 없다는 사실은 흔히 간과되었다. 사람들은 흔히 이론에 대하여, 이론으로부터 도출된 예측들 중 몇 가지 예측들이 검증되었을 때 그 이론은 검증된다고 말한다. 사람들은, 검증이 논리적 관점에서 완벽하게 무오류가 아니라는 것을 혹은 서술은 자체가 내리는 결론들 중 몇 가지 결론들을 증명함에 의하여 결코 최종적으로 증명될 수 없다는 것을 아마도 인정할 것이다. 그러나 사람들은 그런 반론들을 다소 불필요한 양심에 기인하는 것으로서 간주하기 쉽다. 태양이 내일 뜰지를 우리는 확신적으로 알지 못한다는 것은 전적으로 참이고 심지어 사소한 일이라고 그들은 말한다. 그러나 다음 불확실성은 무시될지도 모른다: 이론들은 개선될 뿐만 아니라, 새로운 실험들에 의하여 오류로 판정될 수도 있다는 사실은 어느 때고 현실화될 엄연한 가능성을 과학자에게 제시한다; 그러나 충분히-확인된 법칙의 갑작스런 붕괴로 인하여 이론이 오류로 판정된 것으로 간주되어야 했던 적은 없었다. 옛 실험들이 어느 날 새로운 결과들을 낳는 일은 결코 생기지 않는다. 발생하는 일은, 새로운 실험들이 옛 이론과 어긋나게 판정을 내리는 것뿐이다. 옛 이론은 심지어 대체되는 때에도 흔히 새로운 이론에 대하여 일종의 제한하는 경우로서 자체의 타당성을 유지한다; 옛 이론은 적어도 높은 근사치로써 이전에 성공적이었던 저 경우들에서 여전히 적용된다. 요컨대, 실험에 의하여 직접적으로 시험될 수 있는 규칙성들은 변하지 않는다. 인정되는 바와 같이 그 규칙성들이 혹시 변한다는 것은 상상될 수 있거나 논리적으로 가능하다; 그러나 이 가능성은 경험 과학에 의하여 무시되어 경험 과학의 방법들에 영향을 미치지 않는다. 반대로, 과학적 방법은 자연적 과정들의 불변성, 즉 ‘자연의 균일성 원리’을 전제한다.
위 논증에 대하여 언급될 것이 있지만 그것은 나의 주장에 영향을 미치지 않는다. 위 논증은 우리가 사는 세상 안에 있는 규칙성들의 존재에 대한 형이상학적 신념을 (나도 공유하는 신념이고 그 신념이 없으면 실제적 행동이 상상
가능하지 않은) 표현한다.* 그럼에도 불구하고 우리 앞에 놓인 문제는 ㅡ 현재의 문맥에서 이론들의 비-검증가능성을 유의미하게 만드는 문제 ㅡ 전혀 다른 차원 위에 있다. 다른 형이상학적 문제들에 대한 나의 태도와 일관되게, 나는 우리가 사는 세상 안에서 있는 규칙성들의 존재에 대한 신념을 찬성하거나 반대하여 논증하기를 삼간다. 그러나 나는 이론들에 대한 비-검증가능성이 방법론적으로 중요하다는 것을 밝히려고 노력하겠다. 내가 방금 개진된 논증에 반대하는 것은 이런 차원에서이다.
그리하여 나는 이 논증의 요점들 중 한 가지 요점만을 ㅡ 소위 ‘자연의 균일성 원리’에 대한 언급 ㅡ 유관한 것으로서 수용하겠다. 이 원리는, 내가 보기에, 정확하게 이론들에 대한 비-검증가능성의 고찰로부터 유리하게 아마도 도출될 규칙인 중요한 방법론적 규칙을 매우 피상적인 방식으로 표현한다.*
태양이 내일 뜨지 않을 것이라고 (그럼에도 불구하고 우리는 생존을 지속하고 또한 우리의 과학적 관심사들을 추구할 것이라고) 가정하자. 그런 일이 발생할 터이라면, 과학은 그런 일을 설명하려고, 다시 말해서 법칙들로부터 그런 일을 도출하려고 노력해야 할 터이다. 현존하는 이론들은 상상컨대 대폭 수정되어야 할 터이다. 그러나 수정된 이론들은 새로운 사태를 설명해야 하지만은 않을 터이다: 우리가 지닌 더 오래 된 경험들 또한 그 수정된 이론들로부터 도출될 수 있어야 할 터이다. 방법론적 관점에서 우리는, 자연의 균일성 원리가 여기서 시공 모두와 관련하여 자연법칙들의 불변성이라는 공준에 의하여 대체됨을 안다. 그러므로 나는, 자연적 규칙성들이 변하지 않는다고 주장하는 것은 오류일 터이라고 생각한다. (이것은 반대하거나 찬성하여 논증될 수 없는 종류의 서술일 터이다.) 우리가 말해야 하는 것은, 더 정확하게, 자연법칙들이 시공과 관련하여 불변할 것이라고 우리가 공준을 세운다면 그것은 자연법칙들에 대한 우리의 정의(定義)의 한 부분이라는 것이다; 그리고 또한 자연법칙들에는 예외들이 없을 것이라고 우리가 공준을 세운다면. 그리하여 방법론적 관점에서, 입증된 법칙을 오류로 판정하는 가능성은 전혀 무의미하지 않다. 그 가능성으로 인하여 우리는 우리가 자연법칙들로부터 요구하여 기대하는 것을 발견하는 데 도움을 받는다. 그리고 ‘자연의 균일성 원리’는 다시 방법론적 규칙에 대한 형이상학적 해석으로서 간주될 수 있다 ㅡ 자체의 근친인 ‘인과율’처럼.
이런 종류의 형이상학적 서술들을 방법의 원리들에 의하여 대체하려는 한 가지 시도는 귀납의 방법을 통제하기로 예상되는 ‘귀납의 원리’를 낳고 그리하여 이론들을 검증하는 원리를 낳는다. 그러나 이 시도는 실패하는데, 왜냐하면 귀납의 원리 자체가 특징에서 형이상학적이기 때문이다. 1절에서 내가 지적한 바와 같이, 귀납의 원리가 경험적이라는 가정은 무한회귀(無限回歸: infinite regress)를 낳는다. 그리하여 그 원리는 원초명제(primitive proposition)로 (혹은 공준이나 공리) 도입될 수 있을 터일 따름이다. 이것은 아마도, 귀납의 원리가 여하한 경우에도 오류판정이 불가능한 서술로서 취급되어야 할 터가 아니라면, 그렇게 크게 문제가 되지 않을 터이다. 왜냐하면 이 원리 자체가 ㅡ 이론들의 추론을 인증하기로 예상되는 ㅡ 오류로 판정될 수 있을 터이라면, 그 원리는 첫 번째 오류로 판정된 이론에 의하여 오류로 판정될 터인데 이유인즉 이 이론은 당시 귀납의 원리의 도움을 받아서 도출된 결론일 터이기 때문이다; 그리고 이 원리는, 전제로서, 물론 전제로부터 도출된 이론이 오류로 판정될 때마다 후건부정식(modus tollens)에 의하여 오류로 판정될 것이다.* 그러나 이것은, 오류로 판정될 수 있는 귀납의 원리가 과학에 의하여 이룩된 모든 발전에 따라서 새롭게 오류로 판정될 터임을 의미한다. 그리하여 오류로 판정될 수 없는 것으로 가정되는 귀납의 원리를 도입하는 것이 필요할 터이다. 그러나 이것은, 선험적으로 타당한 종합 서술이라는, 다시 말해서 실제에 관한 반박 불가능한 서술이라는 잘못 이해된 개념에 해당할 터이다.
그리하여 우리가, 자연의 균일성에 대한 그리고 이론들의 검증가능성에 대한 우리의 형이상학적 신념을 귀납적 논리에 근거한 지식론으로 변환시키려고 한다면, 우리에게는 단지 무한회귀(無限回歸: infinite regress)와 선험론(apriorism) 사이에서의 선택만 남는다.
80 가설이 지닌 확률과 사건들이 지닌 확률: 확률 논리에 대한 비판
이론들은 결코 최종적으로 검증되지 않는다는 것이 인정된다할지라도, 더 큰 정도나 더 작은 정도까지 ㅡ 더 개연적이거나 덜 개연적으로 ㅡ 우리는 이론을 안전하게 만드는 데 성공하지 않을까? 결국, 가설이 지닌 확률이라는 문제는 가령 사건들이 지닌 확률이라는 문제로 환원될 수 있을 터이고 그리하여 수학적 및 논리적 취급을 받을 수 있게 될 터이다.*1
일반적인 귀납적 논리처럼, 가설들이 지닌 확률에 관한 이론은 심리적 문제를 논리적 문제와 혼동함을 통하여 발생한 듯이 보인다. 인정되는 바와 같이, 우리가 지닌 신념이라는 주관적인 느낌들은 다양한 강도들을 지니고, 우리가 사용하여 예측의 성취와 가설의 추가 입증을 기다리는 신뢰도는 다른 것들 가운데서 이 가설이 당시까지 견디어낸 시험들의 정도에 ㅡ 이 가설의 과거 입증에 ㅡ 의존하는 것 같다. 그러나 이 심리학적 문제들이 인식론이나 방법론에 속하지 않는다는 것은 심지어 확률 논리를 신봉하는 사람들에 의해서도 상당히 잘 인정된다. 그러나 그들은 확률의 등급들을 가설들 자체들에게 귀속시키는 것이 귀납론적 결정들을 토대로 가능하다고 주장한다; 그리고 나아가 이 개념을 사건들이 지닌 확률이라는 개념으로 환원하는 것이 가능하다고.
가설이 지닌 확률은 대부분, 서술이 지닌 확률이라는 일반적인 문제의 특별한 경우만으로서 간주된다; 그리고 이것은 반대로, 특별한 용어사용법으로 표현된 사건이 지닌 확률이라는 문제만으로서 간주된다. 그리하여 우리는 예를 들어 라이헨바흐(Reichenbach)에게서 다음을 읽는다: ‘우리가 확률을 서술들에게 혹은 사건들에게 귀속시키는지는 특별한 용어사용법의 문제일 따름이다. 지금까지 우리는, 1/6이라는 확률이 주사위의 특정 면에 나오는 데 할당되었는지를 사건들이 지닌 확률의 경우로서 간주했다. 그러나 우리는, 1/6 확률이 할당된 것은 “1을 보이는 면이 나올 것”이라는 서술이라고 말할 것이다.
사건들이 지닌 확률을 서술들이 지닌 확률과 동일시하는 것은, 우리가 23절에서 언급된 것을 상기한다면 더 잘 이해될 것이다. 거기서 ‘사건’이라는 개념은 단칭 서술들의 집합으로서 정의(定義)되었다. 그리하여 사건들이 지닌 확률 대신에 서술들이 지닌 확률을 말하는 것이 틀림없이 또한 허용될 수 있다. 그러므로 우리는 이것을 단지 특별한 용어사용법의 변화인 것으로 간주할 수 있다: 준거-수열들은 서술들의 수열들로서 해석된다. 우리가 ‘양자택일’을, 혹은 더 정확하게 양자택일의 항들을 서술들에 의하여 표상되는 것으로서 생각한다면, 우리는 앞면들이 나오는 것을 ‘k는 앞면들이다’라는 서술에 의하여 그리고 앞면들이 나오지 않는 것을 이 서술의 부정형으로 기술할 수 있다 (이 문장의 원문은 If we think of an 'alternative', or rather of its elements, as represented by statements, then we can describe the turning up of heads by the statement 'k is heads', and its failure to turn up by the negation of this statement.인데 its는 heads의 소유격이므로 their의 오기로 보인다: 역자). 이런 방식으로 우리는 pj, pk,
우리가 원한다면, 우리는 그렇게 변형된 확률 개념을 ‘서술들이 지닌 확률’이나 ‘명제들이 지닌 확률’이라고 지칭할 수 있다. 그리고 이 개념과 ‘진리’ 개념 사이의 매우 밀접한 연관성을 우리는 밝힐 수 있다. 이유인즉 서술들의 수열이 점점 짧아져서 종국에는 한 가지 항만을, 다시 말해서 하나의 단일한 서술만을 포함한다면 수열의 확률 즉 진리-빈도는 단일한 서술이 참인지 혹은 거짓인지에 따라서 두 가지 값들 1과 0 중에서 단지 한 가지 값만을 띨 수 있기 때문이다. 서술이 참인지 아니면 거짓인지는 그리하여 확률을 제한하는 경우로서 간주될 수 있다; 그리고 반대로, 확률이 진리 개념을 제한하는 경우로서 포함하는 한 확률은 진리 개념의 일반화로서 간주될 수 있다. 마지막으로, 통상적인 고전적 논리학의 진리-조작들이 이 진리-빈도들에 의한 조작들에 대하여 제한하는 경우들이 되는 방식으로 그 진리-빈도들에 의한 조작들을 정의(定義)하는 것이 가능하다. 그리고 이 조작들에 대한 계산은 ‘확률 논리’로 지칭될 수 있다.
그러나 우리는 이런 방식으로 정의(定義)된, 가설들이 지닌 확률과 서술들이 지닌 확률 그리고 그리하여 사건들이 지닌 확률을 간접적으로 실제로 동일시할 수 있는가? 나는 이 동일시가 혼동의 결과라고 믿는다. 발상은, 가설이 지닌 확률은 분명히 일종의 서술이 지닌 확률이기 때문에 방금 정의(定義)된 의미에서 ‘서술들이 지닌 확률’의 첫머리에 와야 한다는 것이다. 그러나 이 결론은 부당한 것으로 판명된다; 그리고 그 특별한 표현법은 그리하여 매우 부적절하다. 아마도 결국 우리가 사건들이 지닌 확률을 염두에 둔다면 ‘서술들이 지닌 확률’이라는 표현을 쓰지 않는 것이 더 나을 터이다.*2
이것이 어떠하든, 가설들이 지닌 확률이라는 개념으로부터 출현하는 쟁점들은 심지어 확률 논리에 근거한 고찰들에 의해서도 영향을 받지 않는다고 나는 주장한다. 어떤 사람이 가설에 대하여 그 가설은 참이 아니지만 ‘개연적’이라고 말한다면 이 서술은 여하한 상황 하에서도 사건들이 지닌 확률에 관한 서술로 번역될 수 없다고 나는 주장한다.
이유인즉 가설들이 지닌 확률이라는 개념을 서술들의 수열이라는 개념을 사용하는 진리-빈도의 개념으로 환원하려고 우리가 시도한다면, 우리는 다음 문제에 즉각 봉착하기 때문이다: 어떤 서술들의 수열과 관련하여 확률 값이 가설에 할당될 수 있는가? 라이헨바흐(Reichenbach)는 ‘자연과학의 주장’ 자체를 ㅡ 그 주장에 의하여 그가 과학적 가설을 의미하는 ㅡ 서술들의 준거-수열과 동일시한다. 그는, ‘... 자연과학의 주장들은 결코 단칭서술들이 아닌데 사실상 엄격히 말해서 우리가 확률의 등급 1이 아니라 더 작은 확률 값을 할당해야 하는 서술들의 수열이다. 그리하여 자연과학에 고유한 지식 개념을 엄격하게 표상할 수 있는 논리적 형태를 제공하는 것은 확률 논리뿐이다.’ 이제 가설들 자체가 서술들의 수열들이라는 제안을 추적하려고 노력하자. 그 제안을 해석하는 한 가지 방법은, 그런 수열의 항들로서 가설을 부정하거나 가설과 일치하는 다양한 단칭 서술들을 생각하는 것일 터이다. 이 가설이 지닌 확률은 그렇다면, 그 가설과 일치하는 이 서술들 가운데서 저 서술들의 진리-빈도에 의하여 결정될 터이다. 그러나 평균적으로 가설이 이 수열의 모든 두 번째 단칭 서술에 의하여 반박된다면 이것은 가설에게 1/2의 확률을 부여할 터이다! 이 파멸적인 결론으로부터 도피하기 위하여, 우리는 아마도 두 가지 더 많은 방책들을 시도할 것이다*3 한 가지 방책은 그 가설에 의하여 아직 시도되지 않은 모든 시험들에 대한 통과된 모든 시험들의 비율의 추산에 근거하여 가설에게 특정 확률을 ㅡ 아마도 그다지 정확하지 않은 확률 ㅡ 귀속시키는 일일 터이다. 그러나 이 방식 또한 소용이 없다. 왜냐하면 이 추산은, 실제로, 정확하게 계산될 수 있고 결과는 항상 확률이 0이라는 것이기 때문이다. 그리고 마지막으로, 우리는 우리의 추산을, 무관심한 결과를 ㅡ 다시 말해서 분명한 결정을 내놓지 않는 결과 ㅡ 야기한 저 시험들에 우호적인 결과를 낳은 저
시험들의 비율에 근거시키려고 노력할 수 있을 터이다. (이런 방식으로 우리는 아마도 정말로, 그 주관적인 신뢰감의 척도로써 실험자가 자신이 얻은 결과들을 보는 그 척도를 닮은 중요한 것을 얻을 것이다.) 그러나 이 마지막 방책도, 이런 종류의 추산으로써 우리가 진리-빈도라는 개념으로부터 그리고 사건들이 지닌 확률이라는 개념으로부터 멀리 길을 헤매었다는 사실을 우리가 무시할지라도, 또한 충분하지 않을 것이다. (이 개념들은 거짓인 서술들에 대한 참인 서술들의 비율에 근거하고, 우리는 무관심한 서술을 객관적으로 거짓인 서술과 동일시해서는 안 된다.) 이 마지막 시도 역시 실패하는 이유는, 제안된 정의(定義)로 인하여 가설이 지닌 확률이 절망적으로 주관적이 될 터라는 것이다: 가설이 지닌 확률은 객관적으로 재생될 수 있어서 시험될 수 있는 결과들에라기보다는 실험자가 받은 교육이나 실험자가 지닌 재주에 의존할 터이다.
그러나 나는, 가설이 서술들의 수열로 생각될 수 있다는 제안을 수용하는 것은 전적으로 불가능하다고 생각한다 (이 문장의 원문은 But I think it is altogether impossible to accept the suggestion that a hypothesis can be taken to be a sequence of statements.인데 think 다음에 that이 생략되어 있고 주절동사가 긍정인 think로 쓰인 반면, 종속절에 부정을 의미하는 impossible이 쓰여서 주절동사를 부정으로 바꾸고 종속절을 긍정으로 써서 I don’t think that it is altogether possible to accept the suggestion that a hypothesis can be taken to be a sequence of statements로 쓰는 것이 옳을 것이다: 역자). 전칭명제들이 다음 형태를 지닌다면 그것은 가능할 터이다: ‘모든 값 hf k에 대하여 장소 k에서 이런저런 일이 발생하는 것은 참이다.’ 전칭명제들이 이 형태를 띤다면 우리는 기초명제들을 (전칭명제를 부정하거나 전칭명제와 일치하는 기초명제들) 서술들의 수열의 ㅡ 전칭명제로서 생각될 수열 ㅡ 항들로서 간주할 수 있을 터이다. 그러나 우리가 본 바와 같이 (15절 및 28절 참조), 전칭명제들을 이 형태를 지니지 않는다. 기초명제들을 결코 전칭명제들로부터만 도출 가능하지 않다.* 후자(後者)는 그리하여 기초명제들의 수열들로서 간주될 수 없다. 그러나 우리가, 전칭명제들로부터 도출될 수 있는 기초명제들에 대한 저 부정사항들의 수열을 고려하려 한다면 모든 자기-일관적인 가설에 대한 추산은 동일한 확률, 즉 1을 낳을 것이다. 이유인즉 그럴 경우에 우리는 오류로 판정된 기초명제들에 대한 도출될 수 있는 오류로 판정되지 않은 무효화된 기초명제들의 (혹은 다른 도출 가능한 명제들) 비율을 고려해야 할 터이기 때문이다. 이것은, 진리 빈도를 고려하는 대신에 우리가 거짓 빈도라는 상보적 값(complementary value)을 고려해야 할 터임을 의미한다. 그러나 이 값은 1일 터이다. 왜냐하면 도출 가능한 서술들의 집합과 심지어 도출 가능한 기초명제들에 대한 무효사항들의 집합도 모두 무한집합이기 때문이다; 다른 한편으로, 기껏해야 수용된 오류로 판정하는 기초명제들의 유한한 숫자 이상이 있을 리가 없다. 그리하여 우리가, 전칭명제들은 결코 서술들의 수열들이 아니라는 사실을 무시할지라도, 그리고 우리가 전칭명제들을 그 종류의 것으로서 해석하여 완벽하게 결정 가능한 단칭명제들을 전칭명제들과 상호 관련시키려고 노력할지라도 우리는 수용 가능한 결과에 도달하지 않는다.
아직 우리는 또 다른, 서술들의 수열들을 통하여 가설이 지닌 확률을 설명하는 완전히 다른 가능성을 검토해야 한다. 주어진 단칭 사건발생이 특정 확률을 지닌 사건발생들의 수열의 항이라면 우리가 그 사건발생을 ‘개연적’으로 (‘형식적으로 단칭인 확률 서술’이라는 의미에서) 지칭했던 것이 기억될 것이다. 유사하게 가설이 확정된 진리-빈도를 지닌 가설들의 수열의 항이라면 우리는 아마도 그 가설을 ‘개연적’이라고 지칭하려고 시도할 것이다. 그러나 이 시도는 다시 실패한다 ㅡ 준거 수열을 결정하는 (준거-수열은 많은 방식들로 선택될 수 있다; 71절 참조) 난제와 완전히 별도로. 이유인즉 우리가 가설에 관하여 그 가설이 참인지를 결코 알 수 없다는 이유만으로 우리는 가설들의 수열 안에서의 진리-빈도를 말할 수 없기 때문이다. 우리가 이것을 알 수 있을 터이라면 우리에게는 가설이 지닌 확률이라는 개념이 전혀 필요하지 않을 터이다 (이 문장의 원문은 If we could know this, then we should hardly need the concept of the probability of a hypothesis at all.로 가정법으로 쓰인 문장이다. 따라서 If절의 동사 could know는 were able to know로 표현함이 옳다: 역자). 이제 위에서와 같이 우리는 가설들의 수열 안에서 거짓-빈도의 여집합을 우리의 출발점으로서 생각하려고 아마도 노력할 것이다. 그러나 가령, 우리가 수열의 오류로 판정된 가설들에 대한 오류로 판정되지 않은 가설들의 비율의 도움을 받아서 가설이 지닌 확률을 정의(定義)한다면, 이전과 같이 모든 무한 준거 수열 내부의 모든 가설의 확률은 1일 것이다. 그리고 유한 준거 수열이 선택된다할지라도 우리는 틀림없이 더 나은 위치에 있지 않다 (이 문장의 원문은 And even if a finite reference sequence were chosen we should be in no better position인데 even if절에서는 동사가 가정법으로 쓰이지 않기 때문에 were는 is의 오기이다: 역자). 이유인즉, 가설들의 어떤 (유한) 수열의 항들에게 이 절차에 따라서 0과 1 사이의 확률등급을 ㅡ 가령, 값 3/4 ㅡ 우리가 귀속시킬 수 있다고 가정하자. (수열에 속하는 이런 혹은 저런 가설이 오류로 판정되었다는 정보를 우리가 얻는다면 이것은 실행될 수 있다.) 이 오류로 판정된 가설들이 수열의 항들인 한, 그리하여 우리는 그 가설들에게 바로 이 정보 때문에 값 0이 아니라 3/4를 귀속시켜야 할 터이다. 그리고 일반적으로, 가설이 지닌 확률은 자체가 거짓이라는 정보의 결과로 1/n에 의하여 감소할 터인데 그곳에서 n은 준거 수열에서의 가설의 숫자이다. 이 모든 것으로 인하여, ‘가설들이 지닌 확률’을 통하여 우리가 증거를 뒷받침하거나 약화시키는 것을 고려하여 가설에게 귀속시켜야 하는 신뢰도를 표현하는 프로그램이 확연하게 부정된다.
이것은 내가 보기에 가설이 지닌 확률이라는 개념을 참인 서술들이 지닌 빈도라는 (혹은 거짓인 서술들이 지닌 빈도) 개념에 그리고 그리하여 사건들이 지닌 확률의 빈도 이론에 근거시키는 가능성들을 망라한다.*
나는 가설이 지닌 확률을 사건들이 지닌 확률과 동일시하려는 시도를 완벽한 실패작으로서 우리가 간주해야 한다고 생각한다. 이 결론은 우리가, 물리학의 모든 가설들은 ‘실제로’ 혹은 ‘더 세밀히 검토하면’ 확률 서술들에 (어떤 평균값으로부터 편차들을 항상 보여주는 관찰사항들의 수열들 내부의 몇 가지 평균 빈도들에 관한) 지나지 않는다는 주장을 (그것은 라이헨바흐[Reichenbach]의 주장이다) 우리가 수용하는지 또는 두 가지 다른 유형들의 자연법칙들을 ㅡ 한편으로는 ‘결정론적’이거나 ‘정밀’ 법칙들 및 다른 한편으로는 ‘확률 법칙들’이나 ‘빈도의 가설들’을 ㅡ 구분하는 경향이 우리에게 있는지와 전적으로 독립적이다. 이유인즉 이 두 가지 유형들 모두는, 반대로 결코 ‘개연적’이 될 수 없는 가설적 가정들이기 때문이다: 그 유형들은, 공격을 당하고 있으면서 ㅡ 우리가 시험들을 한다는 공격 ㅡ ‘자체의 패기를 증명’할 수 있다는 의미에서 입증될 수 있을 따름이다.
우리는 어떻게, 확률 논리를 신봉하는 사람들이 반대 견해에 도달했다는 사실을 설명할 수 있는가? 진스(Jeans)가 ‘... 우리는 아무 것도... 확실하게 알 수 없다’라고 서술하고 ㅡ 처음에는 내가 완전히 동의할 수 있는 의미에서 ㅡ 계속해서, ‘기껏해야 우리는 확률들을 거래할 수 있을 따름이다. [그리고] 새로운 양자론의 예측들이 그렇게 잘 [관찰사항들과] 일치해서 실제와 조금 상응하는 계획을 뒷받침하는 확률은 엄청나다. 정말로 우리는 계획이 거의 확실해서 정량적으로 참이다...’라고 말할 때 그가 저지른 오류는 어디에 놓여있는가?
의심의 여지없이 가장 흔한 오류는, 빈도들의 가설적 추산들은 다시 말해서 확률들에 관한 가설들은 반대로 개연적일 따름일 수 있다고 믿는 데 놓여있다; 혹은 다시 말해서, 확률의 가설들에게 소위 가설들의 확률의 어떤 등급을 귀속시키는 데. 확률들에 관한 가설들이 그 논리적 형태에 관한 한 (그리고 오류판정 가능성에 대한 우리의 방법론적 요건을 언급하지 않고) 검증될 수도 없고 오류로 판정될 수도 없다는 것을 우리가 기억한다면 우리는 이 오류인 결론을 뒷받침하여 설득적인 논증을 만들어낼 수 있을 것이다. (65절에서 68절까지 참조.) 확률들에 관한 가설들은 전칭명제들이기 때문에 검증될 수 없고 여하한 기초명제들에 의해서도 논리적으로 결코 부정될 수 없기 때문에 엄격하게 오류로 판정될 수 없다. 확률들에 관한 가설들은 그리하여 (라이헨바흐[Reichenbach]가 표현하는 바와 같이) 전적으로 결정 불가능하다. 이제 그 가설들은, 내가 밝히려고 노력한 바와 같이, 더 잘 혹은 덜 잘 ‘확인’될 수 있는데 이것은 그 가설들이 수용된 기초명제들과 더 많이 혹은 더 적게 일치할 것이라고 말하는 것이다. 이것은 확률 논리가 개입하는 듯이 보이는 곳이다. 고전적 귀납론적 논리학에 의하여 수용된 검증가능성과 오류판정 가능성 사이의 대칭성은, 라이헨바흐(Reichenbach)를 다시 인용하면 이 ‘결정 불가능한’ 확률 서술들과 ‘그 도달 불가능한 위와 아래 한계들이 참이고 거짓인 지속적인 확률 등급들’과 같은 것인 타당성 등급들의 어떤 규모를 상호 관련시키는 것이 틀림없이 가능하다는 믿음을 제시한다. 그러나 나의 견해에 의하면, 확률 서술들은 바로 그 서술들이 전적으로 결정 불가능하기 때문에 방법론적 규칙을 수용함에 의하여 그 서술들을 오류로 판정될 수 있도록 우리가 만들 결심을 하지 않는다면 형이상학적이다. 그리하여 그 서술들이 지닌 오류판정 불가능성이라는 단순한 결과는, 그 서술들이 더 잘 혹은 덜 잘 입증될 수 있다는 것이 아니라, 그 서술들이 경험적으로 전혀 입증될 수 없다는 것이다. 왜냐하면 그렇지 않다면 ㅡ 그 서술들이 아무 것도 배제하지 않아서 그리하여 모든 기초명제와 양립할 수 있다는 것을 알기에 ㅡ 자의적으로 선택된 모든 기초명제가 어떤 관련된 사례의 사건발생을 기술한다면 그 서술들은 그 기초명제에 (여하한 합성 정도를 지닌) 의하여 ‘입증된’다고 언급될 수 있을 터이기 때문이다 (이 문장의 원문은 For otherwise — seeing that they rule out nothing, and are therefore compatible with every basic statement — they could be said to be 'corroborated' by every arbitrarily chosen basic statement (of any degree of composition) provided it describes the occurrence of some relevant instance.인데 주문장의 주어가 probability statements를 대명사 they로 표시한 것이므로 분사구문 seeing that they rule out nothing, and are therefore compatible with every basic statement의 주어가 일반일 수밖에 없어서 분사구문의 주어를 표시해야 한다: 문법적 오류다: 역자).
확률론과 관련하여 내가 상세하게 토론한 방식으로만 물리학이 확률 서술들을 이용한다고 나는 믿는다; 그리고 더욱 특히 물리학이 확률 가정들을 다른 가설들과 꼭 마찬가지로 오류로 판정될 수 있는 서술들로서 이용한다고 나는 믿는다. 그러나 나는 물리학자들이 ‘사실상’ 진행하는 방식에 관한 여하한 논쟁에도 합류하기를 거부하겠는데 왜냐하면 이것이 틀림없이 주로 해석의
문제로 남을 것이기 때문이다.
우리는 여기서 나의 견해와 내가 10절에서 ‘자연주의적’ 견해라고 지칭한 것 사이의 대비에 관한 상당히 훌륭한 예시를 경험한다. 밝혀질 수 있는 것은, 먼저, 내 견해가 지닌 내부의 논리적 일관성이고 두 번째, 내 견해에는 다른 견해들을 괴롭히는 저 난제들이 없다는 것이다. 인정되는 바와 같이 나의 견해가 옳다는 것을 증명하기는 불가능해서 과학의 또 다른 논리를 옹호하는 사람들과의 논란은 무용할 것이다. 밝혀질 수 있는 유일한 것은, 이 특정 문제에 대한 나의 접근방식이 내가 지지하여 논증하고 있던 과학 구상의 결과라는 점이다.*
81 귀납적 논리와 확률 논리
가설들이 지닌 확률은 사건들이 지닌 확률로 환원될 수 없다. 이것은, 이전 절에서 수행된 검토로부터 출현하는 결론이다. 그러나 다른 접근방법이 혹시 가설들이 지닌 확률이라는 개념에 대하여 만족스러운 정의(定義)를 낳지 않을까?
‘참’과 ‘거짓’이라는 개념들과 유사하게, 가설이 지닌 ‘타당성의 정도’를 표현하는 것으로서 해석될 (그리고 덧붙여 ‘확률’이라는 단어의 사용을 정당화하기 위하여 ‘객관적 확률’이라는 개념과, 다시 말해서 상관 빈도와 충분히 밀접하게 관련된) 가설들이 지닌 확률이라는 개념을 구축하는 일이 가능하다고 나는 믿지 않는다.1 그럼에도 불구하는 이제 나는, 논증을 목적으로, 다음 질문을 제기하기 위하여 그런 개념이 사실상 성공적으로 구축되었다는 가정을 채택하겠다: 이것이 귀납의 문제에 어떻게 영향을 미칠 터인가?
특정 가설이 ㅡ 가령 슈뢰딩거(Schrödinger)의 이론 ㅡ 어떤 확정된 의미에서 ‘개연적’으로서 인정된다고 가정하자; ‘이런 혹은 저런 수량적 정도까지
개연적’으로서나 정도를 명시하지 않고 단지 ‘개연적’으로서. 슈뢰딩거(Schrödinger)의 이론을 ‘개연적’으로서 기술하는 서술을 우리는 그 이론에 대한 평가라고 지칭할 것이다.
평가는 물론 ‘슈뢰딩거(Schrödinger)의 이론은 참이다’나 ‘슈뢰딩거(Schrödinger)의 이론은 거짓이다’라는 서술이 그럴 터인 바와 동일한 정도로 틀림없이 종합명제이다 ㅡ ‘실제’에 관한 주장. 모든 그런 서술들은 분명히 이론의 적합성에 관하여 중요한 것을 말하고 그리하여 확실히 항진명제적(恒眞命題的: tautological)이 아니다.* 그 서술들은, 이론이 적합하거나 부적합하다고 혹은 이론이 어떤 정도로 적합하다고 말한다. 나아가 슈뢰딩거(Schrödinger)의 이론에 대한 평가는 이론 자체와 꼭 마찬가지로 틀림없이 검증 불가능한 종합명제이다. 이유인즉 이론이 지닌 ‘확률’은 ㅡ 다시 말해서, 이론이 수용 가능한 상태로 남을 확률 ㅡ 기초명제들로부터 최종적으로 연역될 수가 없는 듯이 보이기 때문이다. 그러므로 우리는 다음과 같이 질문할 수밖에 없다: 평가는 어떻게 정당화될 수 있는가? 평가는 어떻게 시험될 수 있는가? (그리하여 귀납의 문제가 다시 떠오른다; 1절 참조.)
평가 자체에 관하여, 이것은 ‘참’이라고 주장될 것이거나 반대로 ‘개연적’이라고 언급될 것이다. 평가가 ‘참’으로서 간주된다면 그 평가는 틀림없이 경험적으로 검증되지 않은 참인 종합명제이다 ㅡ 선험적으로 참인 종합명제. 평가가 ‘개연적’으로서 간주된다면 우리에게는 새로운 평가가 필요하다: 말하자면 평가에 대한 평가이면서 그리하여 상위 수준의 평가. 그러나 이것은, 우리가 무한회귀(無限回歸: infinite regress)에 빠졌음을 의미한다. 가설이 지닌 확률의 도움을 받으면 귀납적 논리라는 불안정한 논리적 상황은 개선될 수 없다.
확률 논리를 신봉하는 사람들 대부분은, 확률들을 귀납된 가설들에게 귀속시키는 ‘귀납의 원리’에 의하여 평가가 도달된다는 견해를 지지한다. 그러나 그들이 반대로 확률을 이 귀납의 원리에 귀속시키면 무한회귀(無限回歸: infinite regress)가 계속된다. 다른 한편으로 그들이 귀납의 원리에 ‘진리’를 귀속시키면 그들에게는 무한회귀(無限回歸: infinite regress)와 선험론(a priorism) 사이의 선택이 남는다. ‘최종적으로, 확률론은 귀납적 논증들을 설명할 수 없다; 왜냐하면 한 가지 귀납적 논증에 도사리고 있는 정확하게 동일한 문제가 다른 한 다른 귀납적 논증에 (확률론의 경험적 적용에) 도사리고 있기 때문이다. 두 가지 경우들 모두에서 결론은 전제들에 주어진 것을 초월한다.’고 하이만스(Heymans)는 말한다. 그리하여 ‘참’이라는 단어를 ‘개연적’이라는 단어로, 그리고 ‘거짓’이라는 단어를 ‘비개연적’이라는 단어로 갈음함에 의하여 얻어지는 것은 없다. 검증과 오류판정 사이의 비대칭이 ㅡ 이론과 기초명제들 사이의 논리적 관계로부터 생기는 저 비대칭 ㅡ 고려된다면 조건으로만 귀납의 문제라는 오류들을 피하는 것이 가능하다.
확률 논리를 신봉하는 사람들은, 나의 비판이 ‘고전적 논리의 체계에 묶여’ 그리하여 확률 논리에 의하여 사용되는 추론 방법들을 따를 수 없는 정신 상태에서 나온다고 주장함에 의하여 나의 비판에 대처하려고 시도할 것이다. 나는, 이 추론 방법들을 따를 수 없다는 것을 거리낌 없이 인정한다.
82 긍정적인 입증 이론: 가설이 ‘자체의 패기를 증명’할 방식
귀납의 확률론에 반대하여 내가 방금 개진하고 있던 반론들은 혹시 내 자신의 견해에 반대하여 겨냥될 수 없는가? 그 반론들이 그럴 수 있는 가능성이 높은 듯하다; 이유인즉 이 반론들이 평가라는 개념에 근거하기 때문이다. 그리고 분명히, 나도 이 개념을 틀림없이 사용한다. 나는 이론에 대한 ‘입증’을 말한다; 그리고 입증은 평가로서 표현될 수 있을 따름이다. (이런 점에서 입증과 확률 사이에는 차이점이 없다.) 게다가, 가설들은 ‘참인’ 서술들이라고 주장될 수 없지만 가설들은 ‘잠정적 추측들’이라고 (혹은 그런 종류의 것) 나도 또한 믿는다; 그리고 이 견해 또한 이 가설들에 대한 평가를 통하여 표현될 수 있을 따름이다.
이 반론의 두 번째 부분은 쉽게 답변될 수 있다. 정말로 내가 어쩔 수 없이 사용하는, 그리고 가설들을 ‘잠정적 추측들’로서 (혹은 그런 종류의 것) 기술하는 가설들에 대한 평가는 항진명제(恒眞命題: tautology)의 위상을 지닌다. 그리하여 그 평가는, 귀납적 논리가 야기하는 유형의 난제들을 야기하지 않는다. 왜냐하면 이 기술이, 엄격한 전칭명제들 다시 말해서 이론들이 단칭명제들로부터 도출될 수 없다는 주장을 (그 기술이 정의[定義]에 의하여 대등한) 의역하거나 해석할 따름이기 때문이다.
이론이 입증된다고 서술하는 평가들과 관련되는 반대론의 첫 번째 부분과 관련하여 입장은 유사하다. 입증이라는 평가는 가설이 아니라, 우리에게 수용된 기초명제들뿐만 아니라 이론이 주어진다면 도출될 수 있다. 입증이라는 평가는, 이 기초명제들이 이론과 모순되지 않는다는 사실을 주장하며, 서술된 시기까지 이론의 시험가능성의 정도와 그리고 이론이 회부되었던 시험들의 엄혹함과 합당하게 관련하여 그 사실을 주장한다.
이론이 이 시험들을 견디어낸다면 이론은 ‘입증된’다고 우리는 말한다. 입증을 주장하는 평가는 (입증적 평가) 특정 근본적인 관계들, 즉 양립가능성과 양립불가능성을 확립한다. 우리는 양립불가능성을 이론의 오류판정으로서 간주한다. 그러나 양립가능성만으로 인하여 우리는 이론에게 긍정적 입증 등급을 귀속시켜서는 안 된다: 이론이 아직 오류로 판정되지 않았다는 단순한 사실은 분명히 충분한 것으로서 간주될 수 없다. 왜냐하면 수용된 기초명제들로 구성된 여하한 주어진 이론체계와 양립 가능한 여하한 숫자의 이론 체계들을 구축하는 것보다 더 쉬운 일은 없기 때문이다. (이 언급은 또한 모든 ‘형이상학적’ 이론 체계들에게도 적용된다.)
이론이 수용된 기초명제들로 구성된 이론체계와 양립 가능하다면, 그리고 덧붙여 이 이론체계의 한 부분이 이론으로부터 도출될 수 있다면 이론에게는 어떤 긍정적 입증 등급이 부여되어야 한다고 혹시 제안될지도 모른다. 아니면 기초명제들은 순수 이론체계로부터 도출될 수 없음을 (그 기초명제들에 대한 부정사항들이 그렇게 도출될 수 있을지라도) 고려하여, 다음 규칙이 채택되어
야 한다고 우리는 아마도 제안할 것이다: 이론이 수용된 기초명제들과 양립 가능하다면 그리고 덧붙여 이 기초명제들의 공집합이 아닌 부분집합이 다른 수용된 기초명제들과 결합하여 이론으로부터 도출 가능하다면 이론에게는 긍정적 입증 등급이 부여될 수 있다.*
내가 보기에 이론에 대한 긍정적 입증 등급을 합당하게 규정하기에 이 마지막 정식화가 불충분하다는 것을 제외하고 나는 이 마지막 정식화에 대하여 엄격하게 반대하지 않는다. 왜냐하면 우리는 이론들에 대하여 더 낫게 혹은 덜 충분하게 입증된 것으로 말하고 싶어 하기 때문이다. 그러나 이론의 입증 등급은, 입증하는 사례들의 다시 말해서 지정된 방식으로 도출될 수 있는 수용된 기초명제들의 숫자를 셈에 의해서만 분명히 확립될 수 없다. 왜냐하면 우리가 첫 번째 이론을 도움을 받아서 매우 많은 기초명제들을 그리고 두 번째 이론의 도움을 받아서 극소수의 기초명제들을 도출했다할지라도, 첫 번째 이론은 두 번째 이론보다 훨씬 덜 충분하게 입증된 것으로 보이는 일이 발생할 것이기 때문이다. 보기로서 우리는 아마도 ‘모든 까마귀들은 검다’라는 가설을 ‘전자전하(電子電荷)에는 밀리컨(Millikan)에 의하여 결정된 값이 있다’라는 가설과 (37절에서 언급된) 비교할 것이다. 전자(前者) 종류의 가설의 경우에 우리가 아마도 훨씬 더 많은 입증적 기초명제들과 조우했을지라도, 그럼에도 불구하고 우리는 밀리컨(Millikan)의 가설이 두 가지 가설 중 더 잘 입증된다고 판단할 것이다.
이것은, 입증 등급을 결정하는 것은 입증하는 사례들의 숫자라기보다는 문제의 가설이 회부될 수 있고 회부되었던 다양한 시험들의 엄격성이라는 것을 밝힌다. 그러나 시험들의 엄격성은 반대로 가설이 지닌 시험가능성의 등급에 그리하여 가설의 단순성에 의존한다: 더 높은 정도로 오류로 판정될 수 있는
가설 즉 더 단순한 가설은 더 높은 정도로 입증될 수 있는 가설이기도 하다. 물론 실제로 도달된 입증 등급은 오류판정 가능성의 등급에만 의존하지 않는다: 서술은 높은 정도까지 오류로 판정될 것이지만 그럼에도 불구하고 그 서술은 가볍게만 입증될 것이거나 사실상 오류로 판정될 것이다. 그리고 그 서술은 아마도 오류로 판정되지 않고도 그 서술이 ㅡ 혹은 그 서술에 충분히 밀접한 근사치 ㅡ 연역될 수 있는 더 잘 시험될 수 있는 이론에 의하여 대체될 것이다. (이 경우에도 역시 그 서술이 지닌 입증 등급은 낮추어진다.)
두 가지 서술들이 지닌 입증 등급은 오류판정 가능 등급이 그러한 것처럼 모든 경우들에서 비교될 수는 없을 것이다: 우리는 숫자적으로 계산 가능한 입증 등급을 정의(定義)할 수 없지만 긍정적 입증 등급, 부정적 입증 등급들과 기타 등등에 관하여 개략적으로만 말할 수 있다.* 그럼에도 불구하고 우리는 다양한 규칙들을 주장할 수 있다; 예를 들어 오류로 판정하는 가설에 근거한 상호-주관적으로 시험될 수 있는 실험에 의하여 오류로 판정된 이론에게 우리는 지속적으로 긍정적 입증 등급을 부여하지 않을 것이라는 규칙 (8 및 22절 참조). (그러나 우리는 특정 상황 하에서 또 다른 이론이 사고의 동류 노선을 따른다할지라도 그 이론에게 긍정적 입증 등급을 부여할 것이다. 보기는 아인슈타인의 광양자 이론인데 그 이론은 뉴튼의 빛 입자설과 동류이다.) 일반적으로 우리는 상호-주관적으로 시험될 수 있는 오류판정을 최종적인 것으로서 간주한다 (그 오류 판정이 잘 시험된다면): 이것이, 이론들에 대한 검증과 오류판정 사이의 비대칭이 스스로 감지되는 방식이다. 이 방법론적 요점들 각각은 점진적 근사치들의 절차로서 자체의 고유한 방식으로 과학의 역사적 발전에 기여한다. 훗날 이루어지는 입증적 평가는 ㅡ 다시 말해서, 새로운 기초명제들이 이미 수용된 기초명제들에게 추가된 다음에 이루어진 평가 ㅡ 긍정적 입증 등급을 부정적 입증 등급에 의하여 대체할 수 있지만 역순은 불가능하다. 그리고 과학의 역사에서 새로운 지식의 길을 여는 것은 항상 실험이 아니라 이론이고 관찰이 아니라 아이디어라고 내가 믿을지라도 아무런 결실도 없는 길을 따르
는 것으로부터 우리를 구조하는 것은 항상 실험이라고 나는 믿는다: 우리가 틀에 박힌 생활에서 벗어나는 데 도움을 주는 것 그리하여 우리에게 새로운 길을 발견하라고 도전하는 것.
그리하여 이론이 지닌 오류판정 가능성이나 단순성의 등급은 이론 입증에 대한 평가의 한 부분이다. 그리고 이 평가는 이론과 수용된 기초명제들 사이의 논리적 관계들 중 한 가지 관계로서 간주될 것이다: 이론에게 부과된 시험들의 엄격성을 고려하는 평가로서.
83 입증가능성, 시험가능성, 그리고 논리적 확률*
이론이 지닌 입증 등급을 평가하면서 우리는 이론이 지닌 오류판정 가능성의 등급을 고려한다. 이론은 더 잘 시험될 수 있을수록 더 잘 입증될 수 있다. 그러나 실험가능성은 논리적 확률이라는 개념과 반대여서 입증에 대한 평가가 문제의 서술이 지닌 논리적 확률 고려한다고 우리는 또한 말할 수 있다. 이것은 반대로 72절에서 밝혀진 바와 같이 객관적 확률이라는 ㅡ 사건들이 지닌 확률 ㅡ 개념과 관련된다. 그리하여 논리적 확률을 고려함에 의하여 입증이라는 개념은 혹시 단지 간접적으로 그리고 느슨하게일지라도 사건들이 지닌 확률이라는 개념과 연결된다. 혹시 위에 비판된 가설들이 지닌 확률이라는 교설과의 연결이 있다는 생각이 여기서 우리에게 떠오를지도 모른다.
이론이 지닌 입증 등급을 평가하려고 할 때 우리는 다소 다음과 같이 추론할 것이다. 이론이 지닌 입증 등급은 이론에 대하여 입증하는 사례들의 숫자에 비례하여 증가할 것이다. 여기서 우리는 통상적으로 나중의 입증하는 사례들보다 훨씬 더 큰 중요성을 첫 번째로 입증하는 사례들에게 부여한다: 이론이 충분히 입증되자마자 추가 사례들은 이론이 지닌 입증 등급을 매우 적게만 높인다. 그러나 이 규칙은, 새로운 사례들이 앞선 사례들과 매우 다르다면 다시 말해서 이 새로운 사례들이 새로운 적용의 분야에서 이론을 입증한다면, 성립하지 않는다. 이 경우에 그 새로운 사례들은 입증 등급을 매우 많이 증가시킬 것이다. 그리하여 더 높은 보편성의 등급을 지닌 이론에 대한 입증 등급은 낮은 보편성의 등급을 (그리하여 더 낮은 오류판정 가능성의 등급) 지닌 이론에 대한 입증 등급보다 더 클 수 있다. 유사한 방식으로, 더 높은 정확도를 지닌 이론들은 덜 정확한 이론들보다 더 잘 입증될 수 있다. 우리가 점쟁이들의 전형적인 예언들에게 긍정적 입증 등급을 부여하지 않는 이유들 중 한 가지 이유는, 그들의 예측이 너무 조심스럽고 부정확하여 그 예측들이 옳을 논리적 확률이 극단적으로 높다는 것이다. 그리고 이런 종류의 더 정확하고 그리하여 논리적으로 덜 개연적인 예측들이 성공했다는 말을 우리가 들으면, 우리에게 의심하는 의향이 있는 것은 통상적으로 그 예측들의 성공이라기보다는 그 예측들이 지닌 이른바 논리적 비개연성이다: 그런 예언들은 입증 불가능하다고 믿는 경향이 우리에게 있기 때문에 우리에게는 또한 그런 경우들에는 그런 예언들이 지닌 낮은 입증가능성의 등급으로부터 그런 예언들이 지닌 낮은 시험가능성의 등급으로 논증하는 경향이 있다.
나의 견해들 중 이 견해들과 (귀납적) 확률 논리에서 함축적인 것을 우리가 비교한다면, 우리는 정말로 두드러진 결과를 얻는다. 나의 견해에 따르면, 이론이 지닌 입증가능성, 그리고 또한 사실상 엄격한 시험들을 통과한 이론이 지닌 입증 등급 모두는 말하자면* 이론이 지닌 논리적 확률과 반비례한다 (이 문장의 원문은 According to my view, the corroborability of a theory ㅡ and also the degree of corroboration of a theory which has in fact passed severe tests, stand both, as it were,*2 in inverse ratio to its logical probability;인데 문장부호 대시[ㅡ]는 문맥상 쉼표의 오기로 보인다: 역자); 왜냐하면 두 가지 모두가 이론이 지닌 시험가능성과 단순성의 등급과 비례하여 증가하기 때문이다. 그러나 확률 논리에 의하여 함축되는 견해는 이것과 정반대이다. 그 견해를 옹호하는 사람들은 가설이 지닌 확률이 가설이 지닌 논리적 확률과 정비례하여 증가하도록 한다 ㅡ 의심의 여지없이 그들이 의도하는 바, 그들이 말하는 ‘가설이 지닌 확률’이 내가 ‘입증 등급’에 의하여 지적하려고 하는 것과 유사한 것을 의미할지라도.*
이런 방식으로 논증하는 사람들 가운데 한 사람이 케인즈(Keynes)인데 그는 내가 ‘논리적 확률’이라고 지칭하는 것에 대하여 ‘선험적 확률’이라는 표현을 사용한다 (이 문장의 원문은 Among those who argue in this way is Keynes who uses the expression 'a priori probability' for what I call 'logical probability'.인데 관계대명사의 선행사가 고유명사일 경우에 관계대명사절은 앞에 쉼표를 표기하고 계속적 용법으로 사용해야 한다. 이 문장은 쉼표 없이 관계대명사절을 써서 제한적 용법이 되었기에 문법적 오류이다: 역자). (34절의 주석 1 참조.) 그는 ‘조건’이자 전건(前件: antecedent)이자 조건문(protasis)인 φ와 ‘결론’이자 후건(後件: consequent)이자 귀결절(apodosis)인 f를 사용하여 ‘일반화’ g에 (다시 말해서 가설) 대하여 다음과 같이 완벽하게 정확한 언급을1 한다: ‘조건 φ가 더 포괄적이고 결론 f가 덜 포괄적일수록 더 큰 선험적*4 확률을 우리는 일반화 g에 귀속시킨다 (이 문장의 원문은 The more comprehensive the condition φ and the less comprehensive the conclusion f, the greater a priori*4 probability do we attribute to the generalization g.로 주절에서 do we attribute라는 도치가 쓰였는데 불필요한 문법인 듯하다: 역자). φ에서의 모든 증가에 비례하여 이 확률은 증가하고 f에서의 모든 증가에 비례하여 이 확률은 감소할 것이다.’ 케인즈(Keynes)가 자신이 ‘일반화의 확률’이라고 지칭하는 것과 ㅡ 여기서 ‘가설이 지닌 확률’로 지칭되는 것에 대응하는 ㅡ 가설이 지닌 ‘선험적 확률’을 뚜렷하게 구분하지 않을지라도*5 이것은 내가 말한 바와 같이 완벽하게 정확하다. 그리하여 내가
말하는 입증 등급과 대조적으로, 케인즈(Keynes)가 말하는 가설이 지닌 확률은 가설이 지닌 선험적인 논리적 확률에 비례하여 증가한다. 그럼에도 불구하고 케인즈(Keynes)가 자신이 말하는 ‘확률’에 의하여, 내가 말하는 ‘입증’에 의하여 내가 의도하는 것과 동일한 것을 의도한다는 것이, 그가 말하는 ‘확률’이 입증하는 사례들의 숫자와 비례하고 또한 (매우 중요한) 그 사례들 가운데서의 다양성의 증가와 비례하여 높아진다는 사실로부터 보일 것이다. 그러나 케인즈(Keynes)는, 입증하는 사례들이 크게 다양한 적용 분야들에 속하는 이론들은 통상적으로 상응하는 고도의 일반성을 지닐 것이라는 사실을 간과한다. 그리하여 높은 확률을 얻는 것에 대하여 그가 주장하는 두 가지 요건들은 ㅡ 최소한으로 가능한 보편성과 최대한으로 가능한 사례들의 다양성 ㅡ 통상적으로 양립 불가능할 것이다.
나의 특별한 표현법으로 표현되면, 입증은 (혹은 가설들이 지닌 확률) 시험가능성과 비례하여 감소한다는 것을 케인즈(Keynes)의 이론은 의미한다. 그는 귀납적 논리에 대한 자신의 믿음에 의하여 이 견해에 다다른다.* 이유인즉 과학적 가설들을 가능한 한 확실하게 만드는 것이 귀납적 논리의 경향이기 때문이다. 과학적 중요성은, 다양한 가설들이 경험에 의하여 정당화될 수 있다는 정도까지만 그 가설들에게 할당된다. 이론과 경험서술들 사이의 밀접한 논리적 근접성 때문에만 (48절의 주석 2 및 원문 참조) 이론은 과학적으로 귀중한 것으로서 간주된다. 그러나 이것은, 이론의 내용이 경험적으로 증명되는 것을 가능한 한 초월하지 않아야 한다는 것을 의미할 따름이다.* 이 견해는, 예측의 가치를 부인하는 경향과 밀접하게 연관된다. ‘예측이 지닌 특유한 장점은...전적으로 상상적이다. 검토된 사례들의 숫자와 그 사례들 사이의 유사점은 본질적인 요점들이고 특정 가설이 그 요점들을 검토하기 이전에 혹은 이후에 우연히 제시되는지에 관한 질문은 전혀 무관하다’고 케인즈(Keynes)는 서술한다.2 ‘선험적으로 제시된’ ㅡ 다시 말해서, 귀납적 토대들에 근거하여 우리가 그 가설들에 대하여 충분히 입증하기 전에 제시된 ㅡ 가설들을 언급하여 케인즈(Keynes)는 다음과 같이 서술한다: ‘... 그것이 추측에 지나지 않는다면, 자체를 검증하는 몇 가지 혹은 모든 경우들에 그것이 선행한다는 다행스러운 사실로 인하여 자체의 가치에 여하한 것도 추가되지 않는다.’ 예측에 대한 이 견해는 틀림없이 일관적이다. 그러나 이 견해로 인하여 우리가 조금이라도 일반화를 해야 하는지 우리는 의아하게 된다. 이 이론들과 가설들을 모두 구축하는 데 대하여 어떤 가능한 이유가 있을 수 있는가? 귀납적 논리의 관점으로 인하여 이 활동들은 완전히 이해 불가능하게 된다. 우리가 가장 귀중하게 여기는 것이 이용 가능한 가장 안전한 지식이라면 ㅡ 그리고 예측들과 같은 것들이 입증을 향하여 아무 기여도 하지 않는다면 ㅡ 왜 우리는 기초명제들에게 만족하지 않을 것인가?*
매우 유사한 질문들을 야기하는 또 다른 견해는, 카일라(Kaila)의 견해이다.3 그 이론들이 지닌 논리적 비개연성 때문에만 잘 입증될 수 있는 것은 단순한 이론들과 보조 가설들을 사용하지 않는 이론들이라고 (46절 참조) 내가 믿는 반면, 카일라(Kaila)는 케인즈(Keynes)가 말하는 근거들과 유사한 근거들을 토대로 정반대 방식으로 상황을 해석한다. 그도 역시, 우리가 통상적으로 높은 확률을 (우리의 특별한 용어사용법으로, 높은 ‘가설들이 지닌 확률’) 단순한 이론들에게 게다가 특히 보조 가설들이 필요 없는 단순한 이론들에게 귀속시킨다는 것을 안다. 그러나 그가 말하는 이유들은 내가 말하는 이유들과 반대이다. 그런 이론들은 엄격하게 시험될 수 있거나 논리적으로 비개연적이기 때문에 그는, 내가 귀속시키는 바와 같이, 높은 확률을 그런 이론들에게 귀속시키지 않는다; 다시 말해서, 그런 이론들에는 말하자면 선험적으로 기초명제들과 충돌하는 많은 기회들이 있기 때문이다. 반대로 가설들 없이 구성되는 이론체계에는 많은 가설들로 구성되는 이론체계보다 실제와 충돌하는 기회들이 선험적으로 더 없을 것이라고 믿기 때문에 그는 이 높은 확률을 보조 가설들이 없는 단순한 이론들에 귀속시킨다. 여기서 우리는 다시, 우리가 성가시게 이 모험적인 이론들을 왜 구축해야 하는지 의아하게 생각한다. 실제와의 갈등으로부터 우리가 위축된다면, 주장들을 펴면서 갈등을 초래할 이유가 무엇인가? 가장 안전한 길을 여하한 가설들 없는 이론체계를 채택하는 것이다. [‘말은
은이요, 침묵은 금이다.’]
보조 가설들을 가능한 한 적게 사용될 것을 요구하는 내 자신의 규칙에는 (‘가설 사용의 인색 원칙’) 카일라(Kaila)의 고찰들과 같은 고찰들과 공통적인 것이 전혀 없다. 우리의 서술들의 숫자를 단순히 낮추는 것에 나는 관심이 없다: 높은 시험가능성이라는 의미에서 그 서술들이 지닌 단순성에 나는 관심을 갖는다. 한편으로 가능한 한 적게 보조 가설들이 사용되어야 한다는 나의 규칙을 낳고 다른 한편으로 우리들의 공리들(公理: axioms)의 ㅡ 우리의 가장 근본적인 가설들의 ㅡ 숫자가 낮추어져야 한다는 나의 요구를 낳는 것은 이 관심이다. 이유인즉 이 후자(後者) 요점은, 고도의 보편성을 지닌 서술들이 선택되어야 한다는 그리고 많은 ‘공리들(公理: axioms)’로 구성되는 이론체계는 가능하면 더 적은 공리들(公理: axioms)을 지니고 게다가 더 높은 수준의 보편성을 지닌 이론체계로부터 연역될 수 (그리고 그 이론체계에 의하여 설명될 수) 있어야 한다는 요건으로부터 나타나기 때문이다.
84 ‘참’ 및 ‘입증된’이란 개념들의 사용에 관한 언급들
여기서 개괄된 과학의 논리에서 ‘참’과 ‘거짓’이라는 개념들의 사용을 피하는 것이 가능하다.* 그 개념들은 도출가능성 관계들에 관한 논리적 고찰들에 의하여 대체될 것이다. 그리하여 우리에게는 다음과 같이 말할 필요가 없다: ‘이론 t와 기초명제 b가 참이라면 예측 p가 참이다.’ 대신에 우리는 서술 p는 t와 b의 (비-부정적) 접속으로부터 귀결된다고 말할 것이다. 이론에 대한 오류판정도 유사한 방식으로 기술될 것이다. 우리에게는 이론이 ‘거짓’이라고 말할 필요는 없지만 대신에 우리는 이론이 수용된 기초명제들의 특정 집합에 의하여 부정된다고 말할 것이다. 또한 우리에게는 기초명제들에 관하여 그 기초명제들이 ‘참’이나 ‘거짓’이라고 말할 필요가 없는데 왜냐하면 우리는 기초명제들의 수용을 규약적 결정의 결과로서 그리고 수용된 서술들을 이 결정의 결과들로서 해석할 것이기 때문이다.
이것은 분명히, 우리가 ‘참’과 ‘거짓’이라는 개념들을 사용하는 것이 금지된다거나 그 개념들의 사용으로 인하여 어떤 특정 난제가 생긴다는 것을 의미하지 않는다. 우리가 그 개념들을 피할 수 있다는 바로 그 사실로 인하여 그 개념들은 여하한 근본적인 문제도 야기할 수 없다는 것이 밝혀진다. ‘참’과 ‘거짓’이라는 개념들의 사용은 ‘항진명제(恒眞命題: tautology)’, ‘부정(否定: contradiction)’, ‘접속(conjunction)’, ‘함의(implication)’ 그리고 그 종류의 다른 것들과 같은 개념들의 사용과 철저히 유사하다. 이것들은 비-경험적 개념들인 논리적 개념들이다.1 이것들은 경험의 세상에서의 여하한 변화들을 무시하고 서술을 기술하거나 평가한다. 물리적 대상들의 (레빈[Lewin]이 의미하는 바, ‘동일유전자인’ 대상들의) 속성들이 시간이 경과함에 따라 변한다고 우리가 가정하는 반면, 우리는 서술들이 지닌 논리적 속성들이 불변해지는 정도로 이 논리적 술어들을 사용하기로 결정한다: 서술이 항진명제(恒眞命題: tautology)이면, 그 서술은 최종적으로 항진명제(恒眞命題: tautology)이다. 이 동일한 불변성을 우리는 통상적인 용법에 맞추어 ‘참’과 ‘거짓’이라는 개념들에 또한 부착한다. 서술에 대하여 그 서술이 어제는 완벽하게 참이었지만 오늘은 거짓이 되었다고 말하는 것은 통상적인 용법이 아니다. 오늘 우리가 거짓으로서 평가하는 서술을 어제 우리가 참으로 평가했다면, 우리는 함축적으로 오늘 어제 우리가 틀렸었다고 주장하는 것이다; 서술은 심지어 어제 거짓이었다고 ㅡ 불변하게 거짓 ㅡ 그러나 우리가 오류로 ‘그 서술을 참으로서 생각했다’고. 여기서 우리는 진리와 입증 사이의 차이점을 매우 명징하게 알 수 있다. 입증된 것으로서의 혹은 입증되지 않은 것으로서의 서술에 대한 평가는 또한 논리적 평가이고 그리하여 또한 불변한다; 이유인즉 그 평가는, 특정 논리적 관계가 이론체계와 수용된 기초명제들로 구성된 어떤 체계 사이에 성립하다고 주장하기 때문이다. 그러나 우리는 서술에 대하여 그와 같은 것이 혹은 그 서술이 본질적으로 ‘입증된다’고 (그 서술이 ‘참’이라고 우리가 말할 정도로) 결코 단순하게 말할 수 없다. 우리는, 서술이 기초명제들로 구성된 어떤 체계와 ㅡ 특정 시점까지 수용된 체계 ㅡ 관련하여 입증된다고만 말할 수 있다. ‘이론이 어제까지 받은 입증’은 ‘이론이 오늘까지 받은 입증’과 논리적으로 동일하지 않다. 그리하여 우리는 입증에 대한 모든 평가에 말하자면 밑 첨자를 ㅡ 입증이 관여하는 (예를 들어, 입증이 수용된 날짜에 의하여) 기초명제들로 구성된 체계를 규정하는 밑 첨자 ㅡ 부착해야 한다.*
입증은 그리하여 ‘진리 값’이 아니다; 다시 말해서, 입증은 ‘참’과 ‘거짓’이라는 개념들과 (시간적 밑 첨자가 없는) 동등한 위치에 놓일 수 없다; 이유인즉 동일한 서술에 대하여 여하한 숫자의 다양한 입증 값들이 있을 것이고 그 값들 모두는 정말로 동시에 ‘옳은’ 혹은 ‘참’일 수 있기 때문이다. 왜냐하면 그 입증 값들은, 이론과 다양한 시간들에서 수용된 기초명제들의 다양한 집합들로부터 논리적으로 도출될 수 있는 값들이기 때문이다.
위의 언급들은, 나의 견해들과 ‘진리’를 이론의 성공과 ㅡ 그리하여 이론의 유용성이나 이론의 확인이나 이론의 입증과 ㅡ 관련하여 정의(定義)하자고 제안하는 실용주의자들의 견해들의 대조를 설명하는 데 도움이 될 것이다. 그들의 의도가 단지, 이론의 성공에 대한 논리적 평가가 이론에 대한 입증의 평가만일 수 있다면 나는 동의할 수 있다. 그러나 입증이라는 개념을 진리라는 개념과 동일시하는 것은 ‘유용함’과 거리가 멀 터이라고 나는 생각한다.* 이것은 또한 통상적인 용법에서 회피된다. 왜냐하면 우리는 이론에 대하여 그 이론이 지금까지 전혀 입증되지 않았다거나 그 이론이 여전히 입증되지 않는다고 말할 가능성이 높기 때문이다. 그러나 우리는 이론에 대하여, 그 이론이 지금까지 전혀 참이 아니라거나 그 이론이 여전히 거짓이라고 통상적으로 말해서는
안 된다.
85 과학의 길
우리는 물리학의 진보에서 일반적인 방향과 ㅡ 낮은 수준의 일반성을 지닌 이론으로부터 높은 수준으로의 방향 ㅡ 같은 것을 감지할 것이다. 이것은 통상적으로 ‘귀납적 방향’으로 지칭된다; 그래서 물리학이 이 ‘귀납적’ 방향으로 진보한다는 사실이 귀납적 방법을 선호하는 논증으로서 이용될 수 있을 터라고 혹시 생각될 것이다.
그러나 귀납적 방향으로의 진보가 반드시 귀납적 추론들의 수열로 구성되는 것은 아니다. 그 진보가 완벽하게 다른 관계들로 ㅡ 시험가능성과 입증가능성의 등급의 관계들로 ㅡ 설명될 것임을 우리는 정말로 밝혔다. 이유인즉 잘 입증된 이론은 더 높은 보편성의 수준을 지닌 이론에 의하여 대체될 수 있을 따름이기 때문이다; 다시 말해서, 더 잘 시험될 수 있고 덧붙여, 옛 이론이자 잘 입증된 이론을 ㅡ 혹은 적어도 그 이론에 대한 충분한 근사치 ㅡ 포함하는 이론에 의하여. 그리하여 저 추세를 ㅡ 항상 더 높은 수준을 지닌 이론들을 향한 진보 ㅡ ‘유사-귀납적’으로서 기술하는 것이 더 나을 것이다.
유사-귀납적 과정은 틀림없이 다음과 같이 상상된다. 어떤 수준의 보편성을 지닌 이론들이 제시되어 연역적으로 시험된다; 그 다음에, 더 높은 수준의 보편성을 지닌 이론들이 제시되어 반대로 이전 수준들의 보편성을 지닌 저 이론들의 도움을 받아서 시험되고 그런 과정이 계속된다. 시험하는 방법들은 더 높은 수준에서 낮은 수준으로의 연역적 추론들에 변함없이 근거한다;* 다른 한편으로 보편성의 등급들은 시간 순서로 낮은 수준들에서 높은 수준들로 나아감에 의하여 도달된다.
다음 질문이 제기될 것이다: ‘최고 수준의 보편성을 지닌 이론들을 왜 즉시 발명하지 않는가? 이 유사-귀납적 진보를 왜 기다리는가? 혹시 결국 그 진보 안에 귀납적 요소가 포함되기 때문이 아닌가?’ 나는 그렇게 생각하지 않는다. 가능한 모든 수준들의 보편성을 지닌 제안들이 ㅡ 추측들이나 이론들 ㅡ 반복적으로 제시된다. 너무 높은 수준의 보편성 위에 있는 저 이론들은 (다시 말해서, 당시의 시험 가능한 과학에 의하여 도달되는 수준으로부터 너무 동떨어진), 말하자면 아마도 ‘형이상학적 이론체계’를 낳는다. 이 경우에 이 이론체계로부터 지배적인 과학적 이론체계에 속하는 서술들이 틀림없이 연역될 수 (혹은 예를 들어 스피노자의 이론체계의 경우에서처럼 단지 반[半]-연역될 수) 있을지라도, 그 서술들 가운데에는 시험될 수 있는 새로운 서술이 없을 것이다; 이것은, 문제의 이론체계를 시험하기 위하여 결정적인 실험이 고안될 수 없음을 의미한다.* 다른 한편으로 그 이론체계에 대하여 결정적인 실험이 고안될 수 있다면, 그 이론체계는 최초의 근사치로서 어떤 잘 입증된 이론을 그리고 동시에 또한 새로운 것을 ㅡ 게다가 시험될 수 있는 것 ㅡ 포함할 것이다. 그리하여 그 이론체계는 물론 ‘형이상학적’이 아닐 것이다. 이 경우에 문제의 이론체계는 과학의 유사-귀납적 진보에서 새로운 진전으로서 간주될 것이다. 이것으로 인하여 당시 과학과의 연계가 통상적으로 당시의 문제 상황에 대처하려는 시도에서 제시되는 저 이론들에 의해서만 확립되는 이유가 설명된다; 다시 말해서, 당시 난제들, 모순들 그리고 오류판정 사례들. 이 난제들에 대하여 해결책을 제시하면서 이 이론들은 결정적 실험을 향한 방향을 가리킬 것이다.
이 과학의 유사-귀납적 진보 그림이나 모형을 얻기 위하여, 다양한 개념들과 가설들이 액체에 뜬 입자들로서 상상될지도 모른다. 시험될 수 있는 과학은 용기의 바닥에 이 입자들을 침전시키는 것이다; 그 입자들은 층들을 (보편성의) 이루면서 가라앉는다. 침전물의 두께는 이 층들의 숫자에 비례하여 커지며, 모든 새로운 층은 그 층 아래에 있는 저 이론들보다 더 보편적인 이론과 대응한다. 이 과정의 결과로서 더 높은 형이상학적 영역들에서 이전에 부유하던 개념들이 과학의 성장에 의하여 도달되어 그리하여 그 개념들이 과학의 성장과 접촉하여 정착한다. 그런 개념들의 보기들이 원자론이다; 단일한 물리학적 ‘원리’나 궁극적 원소라는 (그 원리나 원소로부터 다른 것들이 도출되는 [이 괄호 안의 관계대명사절의 원문은 from which the others derive인데 의미상 the others가 도출되고 derive는 타동사이므로 수동태인 from which the others are derived로 표기되어야 할 것이다: 역자]) 개념; 지구 운동론 (베이컨이 허구라고 반대한); 한 시대나 지난 빛의 입자론; 전기의 유체론 (금속 전도의 전자-기체 가설로서 되살아난). 이 모든 형이상학적 개념들과 관념들은, 심지어 그 개념들과 관념들의 초기 형태로도, 세상에 대한 인간의 그림 속으로 질서를 가져오는 데 도움을 주었을 것이고 몇몇 경우들에는 심지어 성공적인 예측들을 낳았을 것이다. 그럼에도 불구하고 이런 종류의 개념은, 오류로 판정될 수 있는 형태로 제시될 때만 과학적 위상을 얻는다; 다시 말해서, 그 개념과 어떤 상대방 이론 사이에서 경험적으로 결정하는 것이 가능해졌을 때만.
나의 연구는, 이 저서의 시작에서 채택된 결정사항들과 규약들의 ㅡ 특히 구획설정의 기준의 ㅡ 다양한 결과들을 추적했다. 되돌아보면서, 우리는 이제 과학에 대한 그리고 나타난 과학적 발견에 대한 그림을 마지막으로 포괄적으로 보려고 노력할 것이다. (내가 염두에 두고 있는 것은 생물학적 현상으로서의, 적응 도구로서의 혹은 우회적인 생산 방법으로서의 과학에 대한 그림이 아니다: 과학에 대한 그림이 지닌 인식론적 모습들을 나는 염두에 두고 있다.)
과학은 확실하거나 잘-확립된 서술들로 구성된 체계가 아니다; 또한 과학은 궁극성의 상태를 향하여 꾸준히 전진하는 체계도 아니다. 우리의 과학은 참된 지식이 (epistēmē) 아니다: 우리의 과학은 진리에 혹은 심지어 확률과 같은 진리 대체물에 도달했다고 결코 주장할 수 없다.
그럼에도 불구하고 과학에는 단순히 생물학적 생존 가치 이상이 있다. 과학은 유용한 도구만이 아니다. 과학이 진리나 확률에 도달할 수 없을지라도, 지식에 대한 열망과 진리 탐구는 여전히 과학적 발견에 대한 가장 강력한 동기들이다.
우리는 무식하다; 우리는 추측할 따름이다. 그리고 우리의 추측들은 법칙들에 대한, 우리가 뚜껑을 열 수 있는 ㅡ 발견할 수 있는 ㅡ 규칙성들에 대한 비과학적이고 형이상학적인 (생물학적으로 설명될 수 있을지라도) 믿음에 의하여 영향을 받는다. 베이컨처럼, 우리는 아마도 우리 자신의 동시대 과학을 ㅡ ‘인간들이 지금 평범하게 자연에게 적용하는 추론 방법’ ㅡ ‘성급하고 설익은 예상들’로 그래서 ‘편견들’로 이루어진 것으로서 기술할 것이다.
그러나 이 탁월하게 창의적이고 대담한 우리들의 추측들이나 ‘예상들’은 체계적인 시험들에 의하여 신중하고도 진지하게 통제된다. 제시되는 순간, 우리들의 ‘예상들’ 중 어떤 예상도 독단적으로 옹호되지 않는다. 우리의 연구 방법은, 우리가 어느 정도 옳았는지를 증명하기 위하여 그 예상들을 옹호하는 것이 아니다. 반대로 우리는 그 예상들을 전복하려고 노력한다. 우리의 논리적, 수학적 그리고 기술적 병기고의 모든 무기들을 사용하여 우리의 예상들이 거짓이었음을 증명하려고 우리는 노력한다 ㅡ 그 예상들 대신에 베이컨이 조롱하여 새로운 ‘성급하고 설익은 편견들’로 지칭했던 것처럼 새롭고 정당화되지 않고 정당화될 수 없는 예상들을 제시하기 위하여.*3
과학의 길들을 보다 무미건조하게 해석하는 것이 가능하다. 우리는 아마도, 진보를 ‘... 두 가지 방식으로만 발생한다: 새로운 지각적 경험들을 수집함에 의하여, 그리고 이미 사용 가능한 지각적 경험들을 더 잘 조직함에 의하여’라고 말할지도 모른다. 그러나 과학적 진보에 대한 이 기술은, 실제로 틀리지는 않을지라도, 요점을 놓치는 듯하다. 그 기술은 베이컨의 귀납법을 너무 상기시킨다: ‘무한히 많은 익어 제철인 포도들’에 대한 그의 열성적인 채집을 너무 상기시키는데 그 채집으로부터 그는 과학이라는 포도주가 흘러나오기를 기대했다; 관찰과 실험으로부터 시작하여 그 다음에 이론들로 나아가는 그의 과학적 방법에 대한 신화를 상기시키는. (이 전설적 방법은, 그런데, 그 방법이 실험적 물리학의 방법이라는 지배적인 믿음 때문에 그 방법을 실행하려고 노력하는 더 새로운 과학들 중 몇 가지를 여전히 고무한다.)
과학의 발전은, 시간이 흐르면 점점 더 지각적 경험들이 축적된다는 사실에 기인하지 않는다. 또한 과학의 발전은, 우리가 우리의 감관들을 항상 더 잘 사용하고 있다는 사실에도 기인하지도 않는다. 해석되지 않은 감관-경험들로부터 아무리 우리가 열심히 그 경험들을 수집하여 정리하려고 노력할지라도 과학은 정제되지 않는다. 대담한 개념들, 정당화되지 않은 예상들 그리고 사변적 사고가 자연을 해석하기 위하여 우리가 지닌 유일한 수단들이다: 자연을 이해하기 위하여 우리가 지닌 유일한 지식도구이자 우리가 지닌 도구. 그래서 보상을 받기 위하여 우리는 위험을 무릅쓰고 그 수단들을 이용해야 한다. 우리들 중에서 자신들의 아이디어들을 반박당하는 위험에 노출시키기를 꺼리는 사람들은 과학적 게임에 참여하지 않는다.
심지어 경험에 의하여 우리의 개념들을 신중하고 냉철하게 시험하는 것도 반대로 개념들이 의하여 영감을 받는다: 실험은, 그 안에서 모든 단계가 이론에 의하여 영향을 받는 계획된 행위이다. 우리는 우리의 경험들을 우연히 발견하지 않고, 또한 우리는 우리의 경험들이 우리 위를 시냇물처럼 흘러가도록 하지 않는다. 오히려, 우리는 능동적이어야 한다: 우리는 우리의 경험들을 ‘만들어야’ 한다. 자연에 부쳐질 질문들을 항상 정식화하는 것은 우리다; 명백한 ‘예’ 혹은 ‘아니오’를 뽑아내기 위하여 반복적으로 이 질문들을 제기하려고 시도하는 것은 우리다 (왜냐하면 자연은 답변할 압박을 받지 않으면 답변을 주지 않기 때문이다) (이 문장의 원문은 it is we who try again and again to put these question so as to elicit a clear-cut 'yes' or 'no' (for nature does not give an answer unless pressed for it).인데 question이 questions의 오기로 보인다: 역자). 그리고 종국적으로 답변을 내는 것도 다시 우리다; 엄격한 분석 후에 우리가 자연에 부친 질문에 대한 답변을 결정하는 ㅡ 자연으로부터 분명한 ‘아니오’를 뽑아내려고 지연되고 진지한 시도들 후에 ㅡ 것은 우리들 자신이다. ‘최종적으로 나는, 우리가 만드는 이론들을 결정적인 아니오(No)로써 ㅡ 혹은 들리지 않는 예(Yes)로써 ㅡ 대처하는 방법을 매우 잘 알고 있는 완고한 자연으로부터 해석 가능한 사실들을 빼내려고 싸우는 데서 실험가의 작업에 대하여 나의 무한한 경의를 표하고 싶다’고 바일(Weyl)은 말하는데 나는 전적으로 그의 의견에 동의한다.
참된 지식(epistēmē)이라는 ㅡ 절대적으로 확실하고 증명 가능한 지식 ㅡ 오래된 과학적 이상은 우상으로 판명되었다. 과학적 객관성에 대한 요구로 인하여, 모든 과학적 서술이 틀림없이 영원히 잠정적이라는 것은 불가피하게 된다. 과학적 서술은 정말로 입증될 것이지만 모든 입증은, 다시 잠정적인 다른 서술들과 상대적이다. 확신과 관련된 우리의 주관적 경험들인 우리의 주관적 신념에서만 우리는 ‘절대적으로 확신할’ 수 있다.
확실성이라는 우상에 (불완전한 확실성의 등급들이라는 혹은 확률이라는 우상을 포함하여) 과학적 발전의 길을 막는 반계몽주의에 대한 옹호들 중 한 가지 옹호가 대응한다. 왜냐하면 이 우상에 대한 숭배는 우리의 질문들이 지닌 대담성뿐만 아니라 우리가 실시하는 시험들의 엄격성 및 온전함도 방해하기 때문이다. 과학에 대한 그릇된 견해는 옳고자 하는 열망에서 드러난다; 이유인즉 과학자를 만드는 것은 과학자의 지식의, 반박 불가능한 진리의 소유가 아니라 진리를 향한 과학자의 끈질기고도 무모하게 비판적인 추구이기 때문이다.
그렇다면 우리의 태도는 유보적인 태도여야 하는가? 과학은 자체의 생물학적 과제만을 성취할 수 있다고; 과학은 기껏해야 과학을 입증할 실용적 적용들에서 과학의 패기를 증명할 수 있을 따름이라고 우리는 말해야 하는가? 과학과 관련된 지성적 문제들은 해결이 불가능한가? 나는 그렇게 생각하지 않는다. 과학은 결코 자체가 내놓는 답변들을 최종적으로 혹은 심지어 개연적으로 만드는 비현실적인 목표를 추구하지 않는다. 과학의 발전은 오히려 무한하지만 도달 가능한 목표를 향한다: 새롭고 더 깊고 그리고 더 일반적인 문제들을 항상 발견하는, 그리고 우리가 내는 항상 잠정적인 답변들을 언제나 갱신되고 언제나 더 엄혹한 시험들에 부치는 목표.
이것이 원저서의 원문의 끝이다.
여기 285ㅡ310쪽에 인쇄된 부록
i-vii도 역시 저 원저서의 한
부분이었다 (285ㅡ310쪽은 한글
번역본에서 바뀔 수 있음: 역자).
부록, 1972년
나의 저서의 앞 장(章)에서 (마지막 장[章]이었던) 나는, 이론에 대한 입증 등급에 의하여, 내가 이론이 시험을 견디어낸 정도와 이 시험들이 어느 정도 엄격했는지를 요약하는 간단한 보고서를 의미함을 명백히 하려고 노력했다.
나는 이 관점으로부터 결코 이탈하지 않았다; 예를 들어 새로운 부록들의 시작부분들인 *vii, 378쪽; *ix, 406쪽; 그리고 특히 *ix, 441쪽 이하의 마지막 부분 (*14)을 참조. 여기서 나는 다음 요점들을 추가하고 싶다:
(1) 귀납에 관한 논리적 및 방법론적 문제는 해결이 불가능하지 않지만 나의 저서는 부정적인 해결책을 제시했다: (a) 우리는 이론을 합리적으로 정당화할 수 없는데, 다시 말해서 이론의 진실성에 대한 혹은 이론이 개연적으로 참일 것에 대한 우리의 믿음을 정당화할 수 없다. 이 부정적 해결책은, 다른 이론들보다 더 잘 입증되는 이론들을 선호하는 규칙에 포함된 다음과 같은 긍정적 해결책과 양립 가능하다: (b) 이론에 대한 입증을, 다시 말해서 경쟁하는 이론들에 대한 비판적 토론의 현재 상태를 고려하여 이론에 대한 선호를 우리는 때때로 합리적으로 정당화할 수 있는데 그 경쟁하는 이론들은 그 이론들이 지닌 진리에 대한 근접성을 (박진성[迫眞性]: verisimilitude) 평가하는 관점으로부터 비판적으로 토론되어 비교된다. 이 토론의 현재 상태는, 원칙적으로, 입증 등급의 형태로 보고될 것이다. 그러나 입증 등급은 박진성(迫眞性: verisimilitude)에 대한 척도가 (그런 척도는 틀림없이 영원할 터이다) 아니라, 그 경쟁하는 이론들이 지닌 박진성(迫眞性: verisimilitude)을 찬성하고 반대하여 제시된 이용 가능한 근거들을 판단함에 의하여 경쟁하는 이론들이 내는 상대적 주장들에 관하여 특정 순간까지 우리가 발견할 수 있었던 것에 대한 보고서일 따름이다.
(2) 박진성(迫眞性: verisimilitude)이라는 개념에 의하여 제기된 형이상학적 문제는: 자연에는 진짜 규칙성들이 있는가? 나의 답변은 ‘예’이다. 이 답변을 지지하는 논증들 중 한 가지 논증은 (비-과학적이지만 아마도 ‘초월적인’; 384-5쪽 참조): 자연에서 규칙성들이 겉으로 나타나지 않는다면 관찰사항들이나 언어가 존재할 수 없을 터이다: 기술적 언어나 논증적 언어가 존재할 수 없을 터이다.
(3) 이 답변의 힘은 어떤 종류의 일반 상식적 사실주의에 의존한다.
(4) 귀납과 관련된 실용적 문제는 스스로 해결된다: 합리적 토론에 비추어 진리에 더 가깝게 보이는 이론에 대한 실제적 선호는 위험하지만 합리적이다.
(5) 심리학적 문제는 (그렇게 선택된 이론이 지속적으로 우리의 신뢰를 받을 가치가 있을 것이라는 우리는 왜 믿는가?), 하찮다고 나는 제안한다: 믿음이나 신뢰는 항상 비합리적이지만 행동과 관련하여 중요할 것이다.
(6) 모든 가능한 ‘귀납과 관련된 문제들’이 이런 방식으로 해결되는 것은 아니다.
(출간이 임박한 나의 저서: 객관적 지식: 진화적 접근[Objective Knowledge: An Evolutionary Approach] 또한 참조.)
*영어 원문은 원본에서 옮기는 과정에서 교정되었으나 주석은 교정되지 못했으므로 원본을 참조하시오. 그리고 번역문 및 원문의 밑금은 역자가 중요하다고 생각하여 자의적으로 그었을 뿐이요: 한글역자
10
CORROBORATION, OR HOW A THEORY STANDS UP TO TESTS
Theories are not verifiable, but they can be 'corroborated'.
The attempt has often been made to describe theories as being neither true nor false, but instead more or less probable. Inductive logic, more especially, has been developed as a logic which may ascribe not only the two values 'true' and 'false' to statements, but also degrees of probability; a type of logic which will here be called 'probability logic'. According to those who believe in probability logic, induction should determine the degree of probability of a statement. And a principle of induction should either make it sure that the induced statement is 'probably valid' or else it should make it probable, in its turn — for the principle of induction might itself be only 'probably valid'. Yet in my view, the whole problem of the probability of hypotheses is misconceived. Instead of discussing the 'probability' of a hypothesis we should try to assess what tests, what trials, it has withstood; that is, we should try to assess how far it has been able to prove its fitness to survive by standing up to tests. In brief, we should try to assess how far it has been 'corroborated'.*1
*1 I introduced the terms 'corroboration' ('Bewdhrung') and especially 'degree of corroboration' ('Grad der Bewahrung', 'Bevrahrungsgrod') in my book because I wanted a neutral term to
CORROBORATION, OR HOW A THEORY STANDS UP TO TESTS 249
79 CONCERNING THE SO-CALLED VERIFICATION OF HYPOTHESES
The fact that theories are not verifiable has often been overlooked. People often say of a theory that it is verified when some of the predictions derived from it have been verified. They may perhaps admit that the verification is not completely impeccable from a logical point of view, or that a statement can never be finally established by establishing some of its consequences. But they are apt to look upon such objections as due to somewhat unnecessary scruples. It is quite true, they say, and even trivial, that we cannot know for certain whether the sun will rise tomorrow; but this uncertainty may be neglected: the fact that theories may not only be improved but that they can also be falsified by new experiments presents to the scientist a serious possibility which may at any moment become actual; but never yet has a theory had to be regarded as falsified owing to the sudden breakdown of a well-confirmed law. It never happens that old experiments one day yield
describe the degree to which a hypothesis has stood up to severe tests, and thus 'proved its metde'. By 'neutral' I mean a term not prejudging the issue whether, by standing up to tests, the hypothesis becomes 'more probable', in the sense of the probability calculus.
In other words, I introduced the term 'degree of corroboration' mainly in order to be able to discuss the problem whether or not 'degree of corroboration' could be indentified with 'probability' (either in a frequency sense or in the sense of Keynes, for example).
Carnap translated my term 'degree of corroboration' ('Grad der Bewdhrunc;'), which I had first introduced into the discussions of the Vienna Circle, as 'degree of confirmation'.
(See his 'Testability and Meaning', in Philosophy of Science 3, 1936; especially p. 427); and so the term 'degree of confirmation' soon became widely accepted. I did not like this term, because of some of its associations ('make firm'; 'establish firmly'; 'put beyond doubt'; 'prove'; 'verify'; 'to confirm' corresponds more closely to 'erhdrten' or 'bestdtigen' than to 'bewdhren'). I therefore proposed in a letter to Carnap (written, I think, about 1939) to use the term 'corroboration'. (This term had been suggested to me by Professor H. N. Parton.) But as Carnap declined my proposal, I fell in with his usage, thinking that words do not matter. This is why I myself used the term 'confirmation' for a time in a number
of my publications.
Yet it turned out that I was mistaken: the associations of the word 'confirmation' did matter, unfortunately, and made themselves felt: 'degree of confirmation' was soon used — by Carnap himself — as a synonym (or 'explicans') of 'probability'. I have therefore now abandoned it in favour of 'degree of corroboration'. See also appendix *ix, and section *29 of my Postscript.
250 SOME STRUCTURAL COMPONENTS OF A THEORY OF EXPERIENCE
new results. What happens is only that new experiments decide against an old theory. The old theory, even when it is superseded, often retains its validity as a kind of limiting case of the new theory; it still applies, at least with a high degree of approximation, in those cases in which it was successful before. In short, regularities which are directly testable by experiment do not change. Admittedly it is conceivable, or logically possible, that they might change; but this possibility is disregarded by empirical science and does not affect its methods. on the contrary,
scientific method presupposes the immutability of natural processes, or the 'principle of the uniformity of nature'.
There is something to be said for the above argument, but it does not affect my thesis. It expresses the metaphysical faith in the existence of regularities in our world (a faith which I share, and without which practical action is hardly conceivable).*1 Yet the question before us — the question which makes the non-verifiability of theories significant in the present context — is on an altogether different plane. Consistently with my attitude towards other metaphysical questions, I abstain from arguing for or against faith in the existence of regularities in our world. But I shall try to show that the non-verifiability of theories is methodologically important. It is on this plane that I oppose the argument just advanced.
I shall therefore take up as relevant only one of the points of this argument — the reference to the so-called 'principle of the uniformity of nature'. This principle, it seems to me, expresses in a very superficial way an important methodological rule, and one which might be derived, with advantage, precisely from a consideration of the non-verifiability of theories.*2
Let us suppose that the sun will not rise tomorrow (and that we shall nevertheless continue to live, and also to pursue our scientific interests). Should such a thing occur, science would have to try to explain it, i.e. to derive it from laws. Existing theories would presumably require to be drastically revised. But the revised theories would not merely have to account for the new state of affairs: our older experiences would also have to be derivable from them. From the methodological point of view one sees that
*1 Cf. appendix *x, and also section * 1 5 of my Postscript.
*2 1 mean the rule that any new system of hypotheses should yield, or explain, the old, corroborated, regularities. See also section *3 (third paragraph) of my Postscript.
CORROBORATION, OR HOW A THEORY STANDS UP TO TESTS 251
the principle of the uniformity of nature is here replaced by the postulate of the invariance of natural laws, with respect to both space and time. I think, therefore, that it would be a mistake to assert that natural regularities do not change. (This would be a kind of statement that can neither be argued against nor argued for.) What we should say is, rather, that it is part of our definition of natural laws if we postulate that they are to be invariant with respect to space and time; and also if we postulate that they are to have no exceptions. Thus from a methodological point of view, the possibility of falsifying a corroborated law is by no means without significance. It helps us to find out what we demand and expect from natural laws. And the 'principle of the uniformity of nature' can again be regarded as a metaphysical interpretation of a methodological rule — like its near relative, the 'law of causality'.
One attempt to replace metaphysical statements of this kind by principles of method leads to the 'principle of induction', supposed to govern the method of induction, and hence that of the verification of theories. But this attempt fails, for the principle of induction is itself metaphysical in character. As I have pointed out in section 1, the assumption that the principle of induction is empirical leads to an
infinite regress. It could therefore only be introduced as a primitive proposition (or a postulate, or an axiom). This would perhaps not matter so much, were it not that the principle of induction would have in any case to be treated as a non-falsifiable statement. For if this principle — which is supposed to validate the inference of theories — were itself falsifiable, then it would be falsified with the first falsified theory, because this theory would then be a conclusion, derived with the help of the principle of induction; and this principle, as a premise, will of course be falsified by the modus tollens whenever a theory is falsified which was derived from it.*3 But this means that a falsifiable principle of induction would be falsified anew with every advance made by science. It would be necessary, therefore, to introduce a principle of induction assumed not to be falsifiable. But this would amount to the
*3 The premises of the derivation of the theory would (according to the inductivist view here discussed) consist of the principle of induction and of observation statements. But the latter are here tacitly assumed to be unshaken and reproducible, so that they cannot be made responsible for the failure of the theory.
252 SOME STRUCTURAL COMPONENTS OF A THEORY OF EXPERIENCE
misconceived notion of a synthetic statement which is a priori valid, i.e. an irrefutable statement about reality.
Thus if we try to turn our metaphysical faith in the uniformity of nature and in the verifiability of theories into a theory of knowledge based on inductive logic, we are left only with the choice between an infinite regress and apriorism.
80 THE PROBABILITY OF A HYPOTHESIS AND THE PROBABILITY OF EVENTS: CRITICISM OF PROBABILITY LOGIC
Even if it is admitted that theories are never finally verified, may we not succeed in making them secure to a greater or lesser extent — more probable, or less so? After all, it might be possible that the question of the probability of a hypothesis could be reduced, say, to that of the probability of events, and thus be made susceptible to mathematical and logical handling.*1
Like inductive logic in general, the theory of the probability of hypotheses seems to have arisen through a confusion of psychological with logical questions. Admittedly, our subjective feelings of conviction are of different intensities, and the degree of confidence with which we await the fulfilment of a prediction and the further corroboration of a hypothesis is likely to depend, among other things, upon the way in which this hypothesis has stood up to tests so far — upon its past corroboration. But that these psychological questions do not belong to epistemology or methodology is pretty well acknowledged even by the believers in probability logic. They argue, however, that it is possible, on the basis of inductivist decisions, to ascribe degrees of probability to the hypotheses themselves; and further, that it is possible to reduce this concept to that of the probability of events.
The probability of a hypothesis is mostly regarded as merely a special case of the general problem of the probability of a statement; and this in
*1 The present section (80) contains mainly a criticism of Reichenbach's attempt to
interpret the probability of hypotheses in terms of a frequency theory of the probability of events. A criticism of Keynes's approach is contained in section 83. *Note that Reichenbach is anxious to reduce the probability of a statement or hypothesis (what Carnap many years later called 'probability 1 ') to a frequency ('probability 2 ').
CORROBORATION, OR HOW A THEORY STANDS UP TO TESTS 253
turn is regarded as nothing but the problem of the probability of an event, expressed in a particular terminology. Thus we read in Reichenbach, for example: 'Whether we ascribe probability to statements or to events is only a matter of terminology. So far we have regarded it as a case of the probability of events that the probability of 1 /6 has been assigned to the turning up of a certain face of a die. But we might just as well say that it is the statement "the face showing the I will turn up" which has been assigned the probability of 1/6.'1
This identification of the probability of events with the probability of statements may be better understood if we recall what was said in section 23. There the concept 'event' was defined as a class of singular statements. It must therefore also be permissible to speak of the probability of statements in place of the probability of events. So we can regard this as being merely a change of terminology: the reference-sequences are interpreted as sequences of statements. If we think of an 'alternative', or rather of its elements, as represented by statements, then we can describe the turning up of heads by the statement 'k is heads', and its failure to turn up by the negation of this statement. In this way we
obtain a sequence of statements of the form pj, pk,
If we like, we can call the concept of probability, so transformed, the 'probability of statements' or the 'probability of propositions'. And we can show a very close connection between this concept and the concept of 'truth'. For if the sequence of statements becomes shorter and shorter and in the end contains only one element, i.e. only one single statement, then the probability, or truth-frequency, of the sequence can assume only one of the two values 1 and 0, according to whether the single statement is true or false. The truth or falsity of a statement can thus be looked upon as a limiting case of probability; and conversely, probability can be regarded as a generalization of the concept
1 Reichenbach, Erkenntnis 1, 1930, pp. 171 f.
2 According to Keynes, A Treatise on Probability, 1921, p. 101 ff., the expression 'truth- frequency' is due to Whitehead; cf. the next note.
254 SOME STRUCTURAL COMPONENTS OF A THEORY OF EXPERIENCE
of truth, in so far as it includes the latter as a limiting case. Finally, it is possible to define operations with truth-frequencies in such a way that the usual truth-operations of classical logic become limiting cases of these operations. And the calculus of these operations can be called 'probability logic'.3
But can we really identify the probability of hypotheses with the probability of statements, defined in this manner, and thus indirectly with the probability of events? I believe that this identification is the result of a confusion. The idea is that the probability of a hypothesis, since it is obviously a kind of probability of a statement, must come under the head of 'probability of statements' in the sense just defined. But this conclusion turns out to be unwarranted; and the terminology is thus highly unsuitable. Perhaps after all it would be better never to use the expression 'probability of statements' if we have the probability of events in mind.*2
However this may be, I assert that the issues arising from the concept of a probability of hypotheses are not even touched by considerations based on probability logic. I assert that if one says of a hypothesis that it is not true but 'probable', then this statement can under no circumstances be translated into a statement about the probability of events.
For if one attempts to reduce the idea of a probability of hypotheses to that of a truth-frequency which uses the concept of a sequence of statements, then one is at once confronted with the question: with reference to what sequence of statements can a probability value be assigned
3 1 am giving here an outline of the construction of the probability logic developed by Reichenbach (Wahrscheinlichkeitslogik, Sitzungsberichte tier Preussischen Akademie der Wissenschaften, Physik-mathem. Klasse 29, 1932, p. 476 ff.) who follows E. L. Post (American Journal of Mathematics 43, 1 92 1 , p. 1 84), and, at the same time, the frequency theory of von Mises. Whitehead's form of the frequency theory, discussed by Keynes, op. cit. p. 101 ff. is similar.
*2 1 still think (a) that the so-called 'probability of hypotheses' cannot be interpreted by a truth-frequency; (b) that it is better to call a probability defined by a relative frequency — whether a truth-frequency or the frequency of an event — the 'probability of an event'; (c) that the so-called 'probability of a hypothesis' (in the sense of its acceptability) is not a special case of the 'probability of statements'. And I should now regard the 'probability of statements' as one interpretation (the logical interpretation) among several possible interpretations of the formal calculus of probability, rather than as a truth-frequency. (Cf. appendices *ii, *iv, and *ix, and my Postscript.)
CORROBORATION, OR HOW A THEORY STANDS UP TO TESTS 255
to a hypothesis? Reichenbach identifies an 'assertion of natural science' — by which he means a scientific hypothesis — itself with a reference-sequence of statements. He says, '. . . the assertions of natural science, which are never singular statements, are in fact sequences of statements to which, strictly speaking, we must assign not the degree of probability I but a smaller probability value. It is therefore only probability logic which provides the logical form capable of strictly representing the concept of knowledge proper to natural science.'4 Let us now try to follow up the suggestion that the hypotheses themselves are sequences of statements. one way of interpreting it would be to take, as the elements of such a sequence, the various singular statements which can contradict, or agree with, the hypothesis. The probability of this hypothesis would then be determined by the truth-frequency of those among these statements which agree with it. But this would give the hypothesis a probability of ½ if, on the average, it is refuted by every second singular statement of this sequence! In order to escape from this devastating conclusion, we might try two more expedients.*3 one would be to ascribe to the hypothesis a certain probability — perhaps not a very precise one — on the basis of an estimate of the ratio of all the tests passed by it to all the tests which have not yet been attempted. But this way too leads nowhere. For this estimate can, as it happens, be computed with precision, and the result is always that the probability is zero. And finally, we
could try to base our estimate upon the ratio of those tests which led to a favourable result to those which led to an indifferent result — i.e. one which did not produce a clear decision. (In this way one might indeed obtain something resembling a measure of the subjective feeling of confidence with which the experimenter views his results.) But this last expedient will not do either, even if we disregard the fact that with this kind of estimate we have strayed a long way from the concept of a truth-frequency, and that of a probability of events. (These concepts are based upon the ratio of the true statements to those which are false,
4 Reichenbach, Wahrscheinlichkeitslogik (op. cit. p. 488), p. 15 of the reprint.
* 3 It is here assumed that we have by now made up our minds that whenever there is a clear-cut falsification, we will attribute to the hypothesis the probability zero, so that the discussion is now confined to those cases in which no clear-cut falsification has been obtained.
256 SOME STRUCTURAL COMPONENTS OF A THEORY OF EXPERIENCE
and we must not, of course, equate an indifferent statement with one that is objectively false.) The reason why this last attempt fails too is that the suggested definition would make the probability of a hypothesis hopelessly subjective: the probability of a hypothesis would depend upon the training and skill of the experimenter rather than upon objectively reproducible and testable results.
But I think it is altogether impossible to accept the suggestion that a hypothesis can be taken to be a sequence of statements. It would be possible if universal statements had the form: 'For every value hf k it is true that at the place k so-and-so occurs.' If universal statements had this form, then we could regard basic statements (those that contradict, or agree with, the universal statement) as elements of a sequence of statements — the sequence to be taken for the universal statement. But as we have seen (cf. sections 15 and 28), universal statements do not have this form. Basic statements are never derivable from universal statements alone.*4 The latter cannot therefore be regarded as sequences of basic statements. If, however, we try to take into consideration the sequence of those negations of basic statements which are derivable from universal statements, then the estimate for every self-consistent hypothesis will lead to the same probability, namely I. For we should then have to consider the ratio of the non-falsified negated basic statements which can be derived (or other derivable statements) to the falsified ones. This means that instead of considering a truth frequency we should have to consider the complementary value of a falsity frequency. This value however would be equal to 1. For the class of derivable statements, and even the class of the derivable negations of basic statements, are both infinite; on the other hand, there cannot be more than at most a finite number of accepted falsifying basic
*4 As explained in section 28 above, the singular statements which con be deduced from a theory — the 'instantial statements' — are not of the character of basic statements or of observation statements. If we nevertheless decide to take the sequence of these statements and base our probability upon the truth frequency within this sequence, then the probability will be always equal to 1 , however often the theory may be falsified; for as has been shown in section 28, note *1, almost any theory is 'verified' by almost all instances (i.e. by almost all places k) . The discussion following here in the text contains a very similar argument — also based upon 'instantial statements' (i.e. negated basic statements) — designed to show that the probability of a hypothesis, if based upon these negated basic statements, would always be equal to one.
CORROBORATION, OR HOW A THEORY STANDS UP TO TESTS 257
statements. Thus even if we disregard the fact that universal statements are never sequences of statements, and even if we try to interpret them as something of the kind and to correlate with them sequences of completely decidable singular statements, even then we do not reach an acceptable result.
We have yet to examine another, quite different, possibility of explaining the probability of a hypothesis in terms of sequences of statements. It may be remembered that we have called a given singular occurrence 'probable' (in the sense of a 'formally singular probability statement') if it is an element of a sequence of occurrences with a certain probability. Similarly one might try to call a hypothesis 'probable' if it is an element of a sequence of hypotheses with a definite truth-frequency. But this attempt again fails — quite apart from the difficulty of determining the reference sequence (it can be chosen in many ways; cf. section 71). For we cannot speak of a truth-frequency within a sequence of hypotheses, simply because we can never know of a hypothesis whether it is true. If we could know this, then we should hardly need the concept of the probability of a hypothesis at all. Now we might try, as above, to take the complement of the falsity-frequency within a sequence of hypotheses as our starting point. But if, say, we define the probability of a hypothesis with the help of the ratio of the non-falsified to the falsified hypotheses of the sequence, then, as before, the probability of every hypothesis within every infinite reference sequence will be equal to 1. And even if a finite reference sequence were chosen we should be in
no better position. For let us assume that we can ascribe to the elements of some (finite) sequence of hypotheses a degree of probability between 0 and 1 in accordance with this procedure — say, the value 3/4. (This can be done if we obtain the information that this or that hypothesis belonging to the sequence has been falsified.) In so far as these falsified hypotheses are elements of the sequence, we thus would have to ascribe to them, just because of this information, not the value o, but 3/4. And in general, the probability of a hypothesis would decrease by 1/n in consequence of the information that it is false, where n is the number of hypothesis in the reference sequence. All this glaringly contradicts the programme of expressing, in terms of a 'probability of hypotheses', the degree of reliability which we have to ascribe to a hypothesis in view of supporting or undermining evidence.
SOME STRUCTURAL COMPONENTS OF A THEORY OF EXPERIENCE
This seems to me to exhaust the possibilities of basing the concept of the probability of a hypothesis on that of the frequency of true statements (or the frequency of false ones), and thereby on the frequency theory of the probability of events.*5
I think we have to regard the attempt to identify the probability of a
* s one might summarize my foregoing attempts to make sense of Reichenbach's somewhat cryptic assertion that the probability of a hypothesis is to be measured by a truth frequency, as follows. (For a similar summary, with criticism, see the penultimate paragraph of appendix
Roughly, we can try two possible ways of defining the probability of a theory. one is to count the number of experimentally testable statements belonging to the theory, and to determine the relative frequency of those which turn out to be true; this relative frequency can then be taken as a measure of the probability of a theory. We may call this a probability of the first kind. Secondly, we can consider the theory as an element of a class of ideological entities — say, of theories proposed by other scientists — and we can then determine the relative frequencies within this class. We may call this a probability of the second kind.
In my text I tried, further, to show that each of these two possibilities of making
sense of Reichenbach's idea of truth frequency leads to results which must be quite unacceptable to adherents of the probability theory of induction.
Reichenbach replied to my criticism, not so much by defending his views as by
attacking mine. In his paper on my book (Erkenntnis 5, 1935, pp. 267—284), he said that 'the results of this book are completely untenable', and explained this by a failure of my 'method' — by my failure 'to think out all the consequences' of my conceptual system.
Section iv of his paper (pp. 274 f.) is devoted to our problem — the probability of
hypotheses. It begins: 'In this connection, some remarks may be added about the probability of theories— remarks which should render more complete my so far all too brief communications of the subject, and which may remove a certain obscurity which still surrounds the issue.' After this follows a passage which forms the second paragraph of the present note, headed by the word 'Roughly' (the only word which I have added to Reichenbach's text).
Reichenbach remained silent about the fact that his attempt to remove 'the obscurity which still surrounds the issue' is but a summary — a rough one, admittedly — of some pages of the very book which he is attacking. Yet in spite of this silence I feel that I may take it as a great compliment from so experienced a writer on probability (who at the time of writing his reply to my book had two books and about a dozen papers on the subject to his credit) that he did accept the results of my endeavours to 'think out the consequences' of his 'all too brief communications on the subject'. This success of my endeavours was due, I believe, to a rule of 'method': that we should always try to clarify and to strengthen our opponent's position as much as possible before criticizing him, if we wish our criticism to be worth while.
CORROBORATION, OR HOW A THEORY STANDS UP TO TESTS 259
hypothesis with the probability of events as a complete failure. This conclusion is quite independent of whether we accept the claim (it is Reichenbach's) that all hypotheses of physics are 'in reality', or 'on closer examination' nothing but probability statements (about some average frequencies within sequences of observations which always show deviations from some mean value), or whether we are inclined to make a distinction between two different types of natural laws —
between the 'deterministic' or 'precision' laws on the one hand, and the 'probability laws' or 'hypotheses of frequency' on the other. For both of these types are hypothetical assumptions which in their turn can never become 'probable': they can only be corroborated, in the sense that they can 'prove their mettle' under fire — the fire of our tests.
How are we to explain the fact that the believers in probability logic have reached an opposite view? Wherein lies the error made by Jeans when he writes — at first in a sense with which I can fully agree — that '. . . we can know nothing ... for certain', but then goes on to say: 'At best we can only deal in probabilities. [And] the predictions of the new quantum theory agree so well [with the observations] that the odds in favour of the scheme having some correspondence with reality are enormous. Indeed, we may say the scheme is almost certain to be
quantitatively true . . .'?5
Undoubtedly the commonest error consists in believing that hypothetical estimates of frequencies, that is to say, hypotheses regarding probabilities, can in their turn be only probable; or in other words, in ascribing to hypotheses of probability some degree of an alleged probability of hypotheses. We may be able to produce a persuasive argument in favour of this erroneous conclusion if we remember that hypotheses regarding probabilities are, as far as their logical form is concerned (and without reference to our methodological requirement of falsifiability), neither verifiable nor falsifiable. (Cf. sections 65 to 68.) They are not verifiable because they are universal statements, and they are not strictly falsifiable because they can never be logically contradicted by any basic statements. They are thus (as Reichenbach puts it) completely
5 Jeans, The New Background of Science, 1934, p. 58. (Only the words 'for certain' are italicized by Jeans.)
260 SOME STRUCTURAL COMPONENTS OF A THEORY OF EXPERIENCE
undecidable.6 Now they can, as I have tried to show, be better, or less well, 'confirmed', which is to say that they may agree more, or less, with accepted basic statements. This is the point where, it may appear, probability logic comes in. The symmetry between verifiability and falsifiability accepted by classical inductivist logic suggests the belief that it must be possible to correlate with these 'undecidable' probability statements some scale of degrees of validity, something like 'continuous degrees of probability whose unattainable upper and lower limits
are truth and falsity',7 to quote Reichenbach again. According to my view, however, probability statements, just because they are completely undecidable, are metaphysical unless we decide to make them falsifiable by accepting a methodological rule. Thus the simple result of their non-falsifiability is not that they can be better, or less well corroborated, but that they cannot be empirically corroborated at all. For otherwise — seeing that they rule out nothing, and are therefore compatible with every basic statement — they could be said to be 'corroborated' by every arbitrarily chosen basic statement (of any degree of composition) provided it describes the occurrence of some relevant instance.
I believe that physics uses probability statements only in the way which I have discussed at length in connection with the theory of probability; and more particularly that it uses probability assumptions, just like other hypotheses, as falsifiable statements. But I should decline
to join in any dispute about how physicists 'in fact' proceed, since this must remain largely a matter of interpretation.
We have here quite a nice illustration of the contrast between my view and what I called, in section 10, the 'naturalistic' view. What can be shown is, first, the internal logical consistency of my view, and secondly, that it is free from those difficulties which beset other views. Admittedly it is impossible to prove that my view is correct, and a controversy with upholders of another logic of science may well be futile. All that can be shown is that my approach to this particular
6 Reichenbach, Erkenntnis 1, 1930, p. 169 (cf. also Reichenbach's reply to my note in Erkenntnis 3, 1933, pp. 426 f.). Similar ideas about the degrees of probability or certainty of inductive knowledge occur very frequently (cf. for instance Russell, Our Knowledge of the External World, 1914, pp. 225 f, and The Aioiysis of Matter, 1927, pp. 141 and 398).
7 Reichenbach, Erkenntnis 1, 1930, p. 186 (cf. note 4 to section 1).
CORROBORATION, OR HOW A THEORY STANDS UP TO TESTS 261
problem is a consequence of the conception of science for which I have been arguing.*6
81 INDUCTIVE LOGIC AND PROBABILITY LOGIC
The probability of hypotheses cannot be reduced to the probability of events. This is the conclusion which emerges from the examination carried out in the previous section. But might not a different approach lead to a satisfactory definition of the idea of a probability of hypotheses?
I do not believe that it is possible to construct a concept of the probability of hypotheses which may be interpreted as expressing a 'degree of validity' of the hypothesis, in analogy to the concepts 'true' and 'false' (and which, in addition, is sufficiently closely related to the concept 'objective probability', i.e. to relative frequency, to justify the use of the word 'probability').1 Nevertheless, I will now, for the sake of argument, adopt the supposition that such a concept has in fact been successfully constructed, in order to raise the question: how would this affect the problem of induction?
Let us suppose that a certain hypothesis — say Schrödinger's theory — is recognized as 'probable' in some definite sense; either as 'probable to this or that numerical degree', or merely as 'probable', without specification of a degree. The statement that describes Schrödinger's theory as 'probable' we may call its appraisal.
*6 The last two paragraphs were provoked by the 'naturalistic' approach sometimes adopted by Reichenbach, Neurath, and others; cf. section 10, above.
1 (Added while the book was in proof.) It is conceivable that for estimating degrees of corroboration, one might find a formal system showing some limited formal analogies with the calculus of probability (e.g. with Bayes's theorem), without however having anything in common with the frequency theory. I am indebted to Dr. J. Hosiasson for suggesting this possibility to me. I am satisfied, however, that it is quite impossible to tackle the problem of induction by such methods with any hope of success. *See also note 3 to section *57 of my Postscript.
* Since 1938,1 have upheld the view that 'to justify the use of the word probability', as my text puts it, we should have to show that the axioms of the formal calculus are satisfied. (Cf. appendices *ii to *v, and especially section *28 of my Postscript.) This would of course include the satisfaction of Bayes's theorem. As to the formal analogies between Bayes's theorem on probability and certain theorems on degree of corroboration, see appendix *ix, point 9 (vii) of the first note, and points (12) and (1 3) of section *32 of my Postscript.
262 SOME STRUCTURAL COMPONENTS OF A THEORY OF EXPERIENCE
An appraisal must, of course, be a synthetic statement — an assertion about 'reality' — in the same way as would be the statement 'Schrödinger's theory is true' or 'Schrödinger's theory is false'. All such statements obviously say something about the adequacy of the theory, and are thus certainly not tautological.*1 They say that a theory is adequate or inadequate, or that it is adequate in some degree. Further, an appraisal of Schrödinger's theory must be a non-verifiable synthetic statement, just like the theory itself. For the 'probability' of a theory — that is, the probability that the theory will remain acceptable — cannot, it appears, be deduced from basic statements with finality. Therefore we are forced to ask: How can the appraisal be justified? How can it be tested? (Thus the problem of induction arises again; see section 1.)
As to the appraisal itself, this may either be asserted to be 'true', or it may, in its turn, be said to be 'probable'. If it is regarded as 'true' then it must be a true synthetic statement which has not been empirically verified — a synthetic statement which is a priori true. If it is regarded as
*1 The probability statement *p(S,e) = r' , in words, 'Schrödinger's theory, given the evidence e, has the probability r' — a statement of relative or conditional logical probability — may certainly be tautological (provided the values of e and r are chosen so as to fit each other: if e consists only of observational reports, r will have to equal zero in a sufficiently large universe). But the 'appraisal', in our sense, would have a different form (see section 84, below, especially the text to note *2) — for example, the following:
Pk(S) = r, where k is today's date; or in words: 'Schrodinger's theory has today (in view of the actual total evidence now available) a probability of r. ' In order to obtain this assessment, pk(S) = r, from (i) the tautological statement of relative probability p(S,e) = r, and (ii) the statement 'e is the total evidence available today', we must apply a principle of inference (called the 'rule of absolution' in my Postscript, sections *43 and *51). This principle of inference looks very much like the modus ponens, and it may therefore seem that it should be taken as analytic. But if we take it to be analytic, then this amounts to the decision to consider pk as denned by (i) and (ii) , or at any rate as meaning no more than do (i) and (ii) together; but in this case, pk cannot be interpreted as being of any practical significance: it certainly cannot be interpreted as a practical measure of acceptability. This is best seen if we consider that in a sufficiendy large universe, pk(t,e) = o for every universal theory t, provided e consists only of singular statements. (Cf. appendices, *vii and *viii.) But in practice, we certainly do accept some theories and reject others.
If, on the other hand, we interpret pk as degree of adequacy or acceptability, then the principle of inference mentioned — the 'rule of absolution' (which, on this interpretation, becomes a typical example of a 'principle of induction') — is simply false, and therefore clearly non-analytic.
CORROBORATION, OR HOW A THEORY STANDS UP TO TESTS 263
'probable', then we need a new appraisal: an appraisal of the appraisal, as it were, and therefore an appraisal on a higher level. But this means that we are caught up in an infinite regress. The appeal to the probability of the hypothesis is unable to improve the precarious logical situation of inductive logic.
Most of those who believe in probability logic uphold the view that the appraisal is arrived at by means of a 'principle of induction' which ascribes probabilities to the induced hypotheses. But if they ascribe a probability to this principle of induction in its turn, then the infinite regress continues. If on the other hand they ascribe 'truth' to it then they are left with the choice between infinite regress and a priorism. 'once and for all', says Heymans, 'the theory of probability is incapable of explaining inductive arguments; for precisely the same problem which lurks in the one also lurks in the other (in the empirical application of probability theory). In both cases the conclusion goes beyond what is given in the premises.'2 Thus nothing is gained by replacing the word 'true' by the word 'probable', and the word 'false' by the word 'improbable'. only if the asymmetry between verification and falsification is taken into account — that asymmetry which results from the logical relation between theories and basic statements — is it possible to avoid the pitfalls of the problem of induction.
Believers in probability logic may try to meet my criticism by asserting that it springs from a mentality which is 'tied to the frame-work of classical logic', and which is therefore incapable of following the methods of reasoning employed by probability logic. I freely admit that I am incapable of following these methods of reasoning.
2 Heymans, Gesetze und Elemente des wissenscliaftiichen Denkens (1890, 1894), pp. 290 f.; *third edition, 1915, p. 272. Heymans's argument was anticipated by Hume in his anonymous pamphlet. An Abstract of a Book lately published entitled A Treatise of Human Nature, 1 740. 1 have little doubt that Heymans did not know this pamphlet which was re-discovered and attributed to Hume by J. M. Keynes and E SrafTa, and published by them in 1938.1 knew neither of Hume's nor of Heymans's anticipation of my arguments against the probabilistic theory of induction when I presented them in 1931 in an earlier book, still unpublished, which was read by several members of the Vienna Circle. The fact that Heymans's passage had been anticipated by Hume was pointed out to me by J. O. Wisdom; cf. his Foundations of Inference in Natural Science, 1952, p. 218. Hume's passage is quoted below, in appendix *vii, text to footnote 6 (p. 386).
264 SOME STRUCTURAL COMPONENTS OF A THEORY OF EXPERIENCE
82 THE POSITIVE THEORY OF CORROBORATION: HOW A HYPOTHESIS MAY 'PROVE ITS METTLE'
Cannot the objections I have just been advancing against the probability theory of induction be turned, perhaps, against my own view? It might well seem that they can; for these objections are based on the idea of an appraisal. And clearly, I have to use this idea too. I speak of the 'corroboration' of a theory; and corroboration can only be expressed as an appraisal. (In this respect there is no difference between corroboration and probability.) Moreover, I too hold that hypotheses cannot be asserted to be 'true' statements, but that they are 'provisional conjectures' (or something of the sort); and this view, too, can only be
expressed by way of an appraisal of these hypotheses.
The second part of this objection can easily be answered. The appraisal of hypotheses which indeed I am compelled to make use of, and which describes them as 'provisional conjectures' (or something of the sort) has the status of a tautology. Thus it does not give rise to difficulties of the type to which inductive logic gives rise. For this description only paraphrases or interprets the assertion (to which it is equivalent by definition) that strictly universal statements, i.e. theories, cannot be derived from singular statements.
The position is similar as regards the first part of the objection which concerns appraisals stating that a theory is corroborated. The appraisal of the corroboration is not a hypothesis, but can be derived if we are given the theory as well as the accepted basic statements. It asserts the fact that these basic statements do not contradict the theory, and it does this with due regard to the degree of testability of the theory, and to the severity of the tests to which the theory has been subjected, up to a stated period of time.
We say that a theory is 'corroborated' so long as it stands up to these tests. The appraisal which asserts corroboration (the corroborative appraisal) establishes certain fundamental relations, viz. compatibility and incompatibility. We regard incompatibility as falsification of the theory. But compatibility alone must not make us attribute to the theory a positive degree of corroboration: the mere fact that a theory has not yet been falsified can obviously not be regarded as sufficient. For
nothing is easier than to construct any number of theoretical systems
CORROBORATION, OR HOW A THEORY STANDS UP TO TESTS 265
which are compatible with any given system of accepted basic statements. (This remark applies also to all 'metaphysical' systems.)
It might perhaps be suggested that a theory should be accorded some positive degree of corroboration if it is compatible with the system of accepted basic statements, and if, in addition, part of this system can be derived from the theory. Or, considering that basic statements are not derivable from a purely theoretical system (though their negations may be so derivable), one might suggest that the following rule should be adopted: a theory is to be accorded a positive degree of corroboration if it is compatible with the accepted basic statements and if, in addition, a non-empty sub-class of these basic statements is derivable from the theory in conjunction with the other accepted basic statements.*1
I have no serious objections to this last formulation, except that it seems to me insufficient for an adequate characterization of the positive degree of corroboration of a theory. For we wish to speak of theories as being better, or less well, corroborated. But the degree of corroboration of a theory can surely not be established simply by counting the number of the corroborating instances, i.e. the accepted basic statements which are derivable in the way indicated. For it may happen
*1 The tentative definition of 'positively corroborated' here given (but rejected as insufficient in the next paragraph of the text because it does not explicitly refer to the results of severe tests, i.e. of attempted refutations) is of interest in at least two ways. First, it is closely related to my criterion of demarcation, especially to that formulation of it to which I have attached note *1 to section 21. In fact, the two agree except for the restriction to accepted basic statements which forms part of the present definition. Thus if we omit this restriction, the present definition turns into my criterion of demarcation.
Secondly, if instead of omitting this restriction we restrict the class of the derived
accepted basic statements further, by demanding that they should be accepted as the results of sincere attempts to refute the theory, then our definition becomes an adequate definition of 'positively corroborated', though not, of course, of 'degree of corroboration'. The argument supporting this claim is implicit in the text here following. Moreover, the basic statements so accepted may be described as 'corroborating statements' of the theory.
It should be noted that 'instantial statements' (i.e. negated basic statements; see section 28) cannot be adequately described as corroborating or confirming statements of the theory which they instantiate, owing to the fact that we know that every universal law is instantiated almost everywhere, as indicated in note *1 to section 28. (See also note *4 to section 80, and text.)
266 SOME STRUCTURAL COMPONENTS OF A THEORY OF EXPERIENCE
that one theory appears to be far less well corroborated than another one, even though we have derived very many basic statements with its help, and only a few with the help of the second. As an example we might compare the hypothesis 'All crows are black' with the hypothesis (mentioned in section 37) 'the electronic charge has the value determined by Millikan'. Although in the case of a hypothesis of the former kind, we have presumably encountered many more corroborative basic statements, we shall nevertheless judge Millikan's hypothesis to be the better corroborated of the two.
This shows that it is not so much the number of corroborating instances which determines the degree of corroboration as the severity of the various tests to which the hypothesis in question can be, and has been, subjected. But the severity of the tests, in its turn, depends upon the degree of testability, and thus upon the simplicity of the hypothesis: the hypothesis which is falsifiable in a higher degree, or the simpler hypothesis, is also the one which is corroborable in a higher degree.1 Of course, the degree of corroboration actually attained does not depend only on the degree of falsifiability: a statement may be falsifiable to a high degree yet it may be only slightly corroborated, or it may in fact be falsified. And it may perhaps, without being falsified, be superseded by a better testable theory from which it — or a sufficiently close approximation to it — can be deduced. (In this case too its degree of corroboration is lowered.)
The degree of corroboration of two statements may not be comparable in all cases, any more than the degree of falsifiability: we cannot define a numerically calculable degree of corroboration, but can speak only roughly in terms of positive degree of corroboration, negative degrees of corroboration, and so forth.*2 Yet we can lay down various
1 This is another point in which there is agreement between my view of simplicity and Weyl's; cf. note 7 to section 42. This agreement is a consequence of the view, due to Jeffreys, Wrinch, and Weyl (cf. note 7 to section 42), that the paucity of the parameters of a function can be used as a measure of its simplicity, taken in conjunction with my view (cf. sections 38 ff.) that the paucity of the parameters can be used as a measure of testability or improbability — a view rejected by these authors. (See also notes *1 and *2 to sections 43.)
*2 As far as practical application to existing theories goes, this seems to me still correct; but I think now that it is possible to define 'degree of corroboration' in such a way that
CORROBORATION, OR HOW A THEORY STANDS UP TO TESTS 267
rules; for instance the rule that we shall not continue to accord a positive degree of corroboration to a theory which has been falsified by an inter-subjectively testable experiment based upon a falsifying hypothesis (cf. sections 8 and 22). (We may, however, under certain circumstances accord a positive degree of corroboration to another theory, even though it follows a kindred line of thought. An example is Einstein's photon theory, with its kinship to Newton's corpuscular theory of light.) In general we regard an inter-subjectively testable falsification as final (provided it is well tested): this is the way in which the asymmetry between verification and falsification of theories makes itself felt. Each of these methodological points contributes in its own peculiar way to the historical development of science as a process of step by step approximations. A corroborative appraisal made at a later date — that is, an appraisal made after new basic statements have been added to those already accepted — can replace a positive degree of corroboration by a negative one, but not vice versa. And although I believe that in the history of science it is always the theory and not the experiment, always the idea and not the observation, which opens up the way to new knowledge, I also believe that it is always the experiment which saves us from following a track that leads nowhere: which helps us out of the rut, and which challenges us to find a new way.
Thus the degree of falsifiability or of simplicity of a theory enters into the appraisal of its corroboration. And this appraisal may be regarded as one of the logical relations between the theory and the accepted basic statements: as an appraisal that takes into consideration the severity of the tests to which the theory has been subjected.
we can compare degrees of corroboration (for example, those of Newton's and of Einstein's theory of gravity). Moreover, this definition makes it even possible to attribute numerical degrees of corroboration to statistical hypotheses, and perhaps even to other statements provided we can attribute degrees of (absolute and relative) logical probability to them and to the evidence statements. See also appendix *ix.
268 SOME STRUCTURAL COMPONENTS OF A THEORY OF EXPERIENCE
83 CORROBORABILITY, TESTABILITY, AND LOGICAL PROBABILITY*1
In appraising the degree of corroboration of a theory we take into account its degree of falsifiability. A theory can be the better corroborated the better testable it is. Testability, however, is converse to the concept of logical probability, so that we can also say that an appraisal of corroboration takes into account the logical probability of the statement in question. And this, in turn, as was shown in section 72, is
related to the concept of objective probability — the probability of events. Thus by taking logical probability into account the concept of corroboration is linked, even if perhaps only indirectly and loosely, with that of the probability of events. The idea may occur to us that there is perhaps a connection here with the doctrine of the probability of hypotheses criticized above.
When trying to appraise the degree of corroboration of a theory we may reason somewhat as follows. Its degree of corroboration will increase with the number of its corroborating instances. Here we usually accord to the first corroborating instances far greater importance than to later ones: once a theory is well corroborated, further instances raise its degree of corroboration only very little. This rule however does not hold good if these new instances are very different from the earlier ones, that is if they corroborate the theory in a new field of application. In this case, they may increase the degree of corroboration very considerably. The degree of corroboration of a theory which has a higher degree
of universality can thus be greater than that of a theory which has a lower degree of universality (and therefore a lower degree of falsifiability). In a similar way, theories of a higher degree of precision can be better corroborated than less precise ones. one of the reasons why we do not accord a positive degree of corroboration to the typical prophecies of palmists and soothsayers is that their predictions are so cautious and imprecise that the logical probability of their being correct is extremely high. And if we are told that more precise and thus
*1 If the terminology is accepted which I first explained in my note in Mind, 1938, then the word 'absolute' should be inserted here throughout (as in section 34, etc.) before 'logical probability' (in contradistinction to 'relative' or 'conditional' logical
probability); cf. appendices *ii, *iv, and *ix.
CORROBORATION, OR HOW A THEORY STANDS UP TO TESTS 269
logically less probable predictions of this kind have been successful, then it is not, as a rule, their success that we are inclined to doubt so much as their alleged logical improbability: since we tend to believe that such prophecies are non-corroborable, we also tend to argue in such cases from their low degree of corroborability to their low degree of testability.
If we compare these views of mine with what is implicit in (inductive) probability logic, we get a truly remarkable result. According to my view, the corroborability of a theory — and also the degree of corroboration of a theory which has in fact passed severe tests, stand both, as it were,*2 in inverse ratio to its logical probability; for they both increase with its degree of testability and simplicity. But the view implied by probability logic is the precise opposite of this. Its upholders let the probability of a hypothesis increase in direct proportion to its logical probability — although there is no doubt that they intend their 'probability of a
hypothesis' to stand for much the same thing that I try to indicate by 'degree of corroboration'.*3
*2 1 said in the text 'as it were': I did so because I did not really believe in numerical (absolute) logical probabilities. In consequence of this, I wavered, when writing the text, between the view that the degree of corroborability is complementary to (absolute) logical probability and the view that it is inversely proportional; or in other words, between a definition of C(g), i.e. the degree of corroborability, by C(g) = 1 — P(g) which would make corroborability equal to content, and by C(g) = 1/P(q), where P(g) is the absolute logical probability of g. In fact, definitions may be adopted which lead to either of these consequences, and both ways seem fairly satisfactory on intuitive grounds; this explains, perhaps, my wavering. There are strong reasons in favour of the first method, or else of a
logarithmic scale applied to the second method. See appendix *ix.
*3 The last lines of this paragraph, especially from the italicized sentence on (it was not italicized in the original) contain the crucial point of my criticism of the probability theory of induction. The point may be summarized as follows.
We want simple hypotheses — hypotheses of a high content, a high degree of testability. These are also the highly corroborable hypotheses, for the degree of corroboration of a hypothesis depends mainly upon the severity of its tests, and thus upon its testability. Now we know that testability is the same as high (absolute) logical improbability, or low (absolute) logical probability.
But if two hypotheses, h, and h 2 , are comparable with respect to their content, and thus with respect to their (absolute) logical probability, then the following holds: let the (absolute) logical probability of h, be smaller than that of h 2 . Then, whatever the evidence e, the (relative) logical probability of h, given e can never exceed that of h 2 given e. Thus the better testable and better corroborable hypothesis can never obtain a higher probability, on the given evidence, than the less testable one. But this entails that degree of corroboration cannot be the same as probability.
270 SOME STRUCTURAL COMPONENTS OF A THEORY OF EXPERIENCE
Among those who argue in this way is Keynes who uses the expression 'a priori probability' for what I call 'logical probability'. (See note 1 to section 34.) He makes the following perfectly accurate remark1 regarding a 'generalization' g (i.e. a hypothesis) with the 'condition' or antecedent or protasis φ and the 'conclusion' or consequent or apodosis f: 'The more comprehensive the condition φ and the less comprehensive the conclusion f, the greater a priori*4 probability do we
attribute to the generalization g. With every increase in φ this probability increases, and with every increase in f it will diminish.' This, as I said, is perfectly accurate, even though Keynes does not draw a sharp distinction*5 between what he calls the 'probability of a generalization' — corresponding to what is here called the 'probability of a hypothesis' — and its 'a priori probability'. Thus in contrast to my degree of corroboration, Keynes's probability of a hypothesis increases with its a priori logical probability. That Keynes nevertheless intends by his 'probability' the same as I do by my 'corroboration' may be seen from the fact that his 'probability' rises with the number of corroborating instances, and also (most important) with the increase of diversity
This is the crucial result. My later remarks in the text merely draw the conclusion from it: if you value high probability, you must say very little — or better still, nothing at all: tautologies will always retain the highest probability.
1 Keynes, A Treatise on Probability, 1921, pp. 224 f. Keynes's condition tp and conclusion f correspond (cf. note 6 to section 1 4) to our conditioning statement function ID and our consequence statement function f; cf. also section 36. It should be noticed that Keynes called the condition or the conclusion more comprehensive if its content, or its intension, rather than its extension, is the greater. (I am alluding to the inverse relationship holding between the intension and the extension of a term.)
*4 Keynes follows some eminent Cambridge logicians in writing 'd priori' and 'a posteriori'; one can only say, d propos de rien — unless, perhaps, apropos of 'd propos'.
*5 Keynes does, in fact, allow for the distinction between the a priori (or 'absolute
logical', as I now call it) probability of the 'generalization' g and its probability with respect to a given piece of evidence h, and to this extent, my statement in the text needs correction. (He makes the distinction by assuming, correctly though perhaps only implicitly — see p. 225 of the Treatise — that if (p = (p^. ancl f — fi^i then the a priori probabilities of the various g are: g((p, f,) ^ g((p, f) 5= g((p lt f).) And he correctly proves that the a posteriori probabilities of these hypotheses g (relative to any given piece of evidence h) change in the same way as their a priori probabilities. Thus while his probabilities change like (absolute) logical probabilities, it is my cardinal point that degrees of corroborability (and of corroboration) change in the opposite way.
CORROBORATION, OR HOW A THEORY STANDS UP TO TESTS 271
among them. But Keynes overlooks the fact that theories whose corroborating instances belong to widely different fields of application will usually have a correspondingly high degree of universality. Hence his two requirements for obtaining a high probability — the least possible universality and the greatest possible diversity of instances — will as a rule be incompatible.
Expressed in my terminology, Keynes's theory implies that corroboration (or the probability of hypotheses) decreases with testability. He is led to this view by his belief in inductive logic.*6 For it is the tendency of inductive logic to make scientific hypotheses as certain as possible. Scientific significance is assigned to the various hypotheses only to the extent to which they can be justified by experience. A theory is regarded as scientifically valuable only because of the close logical proximity (cf. note 2 to section 48 and text) between the theory and empirical statements. But this means nothing else than that the content of the theory must go as little as possible beyond what is empirically established.*7 This view is closely connected with a tendency to deny the value of prediction. 'The peculiar virtue of prediction' Keynes writes2 '. . . is altogether imaginary. The number of instances examined and the analogy between them are the essential points, and the question as to whether a particular hypothesis happens to be
propounded before or after their examination is quite irrelevant.' In reference to hypotheses which have been 'a priori proposed' — that is, proposed before we had sufficient support for them on inductive grounds — Keynes writes: '. . . if it is a mere guess, the lucky fact of its preceding some or all of the cases which verify it adds nothing whatever to its value.' This view of prediction is certainly consistent. But it makes one wonder why we should ever have to generalize at all. What possible reason can there be for constructing all these theories and hypotheses? The standpoint of inductive logic makes these activities quite incomprehensible. If what we value most is the securest
*6 See my Postscript, chapter In my theory of corroboration — in direct opposition to Keynes's, Jeffreys's, and Carnap's theories of probability — corroboration does not decrease with testability, but tends to increase with it.
*7 This may also be expressed by the unacceptable rule: 'Always choose the hypothesis which is most ad hoc!'
2 Keynes, op. cit., p. 305.
272 SOME STRUCTURAL COMPONENTS OF A THEORY OF EXPERIENCE
knowledge available — and if predictions as such contribute nothing towards corroboration — why then may we not rest content with our basic statements?*8
Another view which gives rise to very similar questions is that of Kaila.3 Whilst I believe that it is the simple theories, and those which make little use of auxiliary hypotheses (cf. section 46) which can be well corroborated, just because of their logical improbability, Kaila interprets the situation in precisely the opposite way, on grounds similar to Keynes's. He too sees that we usually ascribe a high probability
(in our terminology, a high 'probability of hypotheses') to simple theories, and especially to those needing few auxiliary hypotheses. But his reasons are the opposite of mine. He does not, as I do, ascribe a high probability to such theories because they are severely testable, or logically improbable; that is to say because they have, a priori as it were, many opportunities of clashing with basic statements. on the contrary he ascribes this high probability to simple theories with few auxiliary hypotheses because he believes that a system consisting of few hypotheses will, a priori, have fewer opportunities of clashing with reality than a system consisting of many hypotheses. Here again one wonders why we should ever bother to construct these adventurous theories. If we shrink from conflict with reality, why invite it by making assertions? The safest course is to adopt a system without any hypotheses. ['Speech is silvern, silence is golden.']
My own rule which requires that auxiliary hypotheses shall be used as sparingly as possible (the 'principle of parsimony in the use of hypotheses') has nothing whatever in common with considerations
*8 Carnap, in his Logical Foundations of Probability, 1950, believes in the practical value of predictions; nevertheless, he draws part of the conclusion here mentioned — that we might be content with our basic statements. For he says that theories (he speaks of 'laws') are 'not indispensable' for science — not even for making predictions: we can manage throughout with singular statements. 'Nevertheless', he writes (p. 575) 'it is expedient, of course, to state universal laws in books on physics, biology, psychology, etc' But the question is not one of expediency — it is one of scientific curiosity. Some scientists want to explain the world: their aim is to find satisfactory explanatory theories — well testable, i.e. simple theories — and to test them. (See also appendix *x and section *15 of my Postscript.)
3 Kaila, Die Principien der Wahrscheinlichkeitslogik (Annales Universitatis Aboensis, Turku 1926), p. 140.
CORROBORATION, OR HOW A THEORY STANDS UP TO TESTS 273
such as Kaila's. I am not interested in merely keeping down the number of our statements: I am interested in their simplicity in the sense of high testability. It is this interest which leads, on the one hand, to my rule that auxiliary hypotheses should be used as sparingly as possible, and on the other hand, to my demand that the number of our axioms — of our most fundamental hypotheses — should be kept down. For this latter point arises out of the demand that statements of a high level of universality should be chosen, and that a system consisting of many 'axioms' should, if possible, be deduced from (and thus explained by) one with fewer 'axioms', and with axioms of a higher level of universality.
84 REMARKS CONCERNING THE USE OF THE CONCEPTS 'TRUE' AND 'CORROBORATED'
In the logic of science here outlined it is possible to avoid using the concepts 'true' and 'false'.*1 Their place may be taken by logical
*' Not long after this was written, I had the good fortune to meet Alfred Tarski who explained to me the fundamental ideas of his theory of truth. It is a great pity that this theory — one of the two great discoveries in the field of logic made since Principia Mathematica — is still often misunderstood and misrepresented. It cannot be too strongly emphasized that Tarski's idea of truth (for whose definition with respect to formalized languages Tarski gave a method) is the same idea which Aristotle had in mind and indeed most people (except pragmatists) : the idea that truth is correspondence with the facts (or with reality). But what can we possibly mean if we say of a statement that it corresponds with the facts (or with reality)? once we realize that this correspondence cannot be one of structural similarity, the task of elucidating this correspondence seems hopeless; and as a consequence, we may become suspicious of the concept of truth, and prefer not to use it. Tarski solved (with respect to formalized languages) this apparently hopeless problem by making use of a semantic metalanguage, reducing the idea of correspondence to that of 'satisfaction' or 'fulfilment'.
As a result of Tarski's teaching, I no longer hesitate to speak of 'truth' and 'falsity'. And like everybody else's views (unless he is a pragmatist), my views turned out, as a matter of course, to be consistent with Tarski's theory of absolute truth. Thus although my views on formal logic and its philosophy were revolutionized by Tarski's theory, my views on science and its philosophy were fundamentally unaffected, although clarified.
Some of the current criticism of Tarski's theory seems to me wide of the mark. It is said that his definition is artificial and complex; but since he defines truth with respect to formalized languages, it has to be based on the definition of a well-formed formula in such a language; and it is of precisely the same degree of 'artificiality' or 'complexity' as this definition. It is also said that only propositions or statements can be true or false, but
274 SOME STRUCTURAL COMPONENTS OF A THEORY OF EXPERIENCE
considerations about derivability relations. Thus we need not say: 'The prediction p is true provided the theory t and the basic statement b are true.' We may say, instead, that the statement p follows from the (non-contradictory) conjunction of t and b. The falsification of a theory may be described in a similar way. We need not say that the theory is 'false', but we may say instead that it is contradicted by a certain set of accepted basic statements. Nor need we say of basic statements that they are 'true' or 'false', for we may interpret their acceptance as the result of a conventional decision, and the accepted statements as results of this decision.
This certainly does not mean that we are forbidden to use the concepts 'true' and 'false', or that their use creates any particular difficulty. The very fact that we can avoid them shows that they cannot give rise to any new fundamental problem. The use of the concepts 'true' and 'false' is quite analogous to the use of such concepts as 'tautology', 'contradiction', 'conjunction', 'implication' and others of the kind. These are non-empirical concepts, logical concepts.1 They describe or appraise a statement irrespective of any changes in the empirical world. Whilst we assume that the properties of physical objects (of 'genidentical'
objects in Lewin's sense) change with the passage of time, we decide to use these logical predicates in such a way that the logical properties of statements become timeless: if a statement is a tautology, then it is a tautology once and for all. This same timelessness we also attach to the concepts 'true' and 'false', in agreement with common usage. It is not common usage to say of a statement that it was perfectly true yesterday but has become false today. If yesterday we appraised a statement as true which today we appraise as false, then we implicitly assert today
not sentences. Perhaps 'sentence' was not a good translation of Tarski's original terminology. (I personally prefer to speak of 'statement' rather than of 'sentence'; see for example my 'Note on Tarski's Definition of Truth', Mind 64, 1955, p. 388, footnote 1.) But Tarski himself made it perfectly clear that an uninterpreted formula (or a string of symbols) cannot be said to be true or false, and that these terms only apply to interpreted formulae — to 'meaningful sentences' (as the translation has it) . Improvements in terminology are always welcome; but it is sheer obscurantism to criticize a theory on terminological grounds.
1 (Added in 1934 in proof.) Carnap would probably say 'syntactical concepts' (cf. his Logical Syntax of Language).
CORROBORATION, OR HOW A THEORY STANDS UP TO TESTS 275
that we were mistaken yesterday; that the statement was false even yesterday — timelessly false — but that we erroneously 'took it for true'.
Here one can see very clearly the difference between truth and corroboration. The appraisal of a statement as corroborated or as not corroborated is also a logical appraisal and therefore also timeless; for it asserts that a certain logical relation holds between a theoretical system and some system of accepted basic statements. But we can never simply say of a statement that it is as such, or in itself, 'corroborated' (in the way in which we may say that it is 'true'). We can only say that it is corroborated with respect to some system of basic statements — a system accepted up to a particular point in time. 'The corroboration which a theory has received up to yesterday' is logically not identical with 'the corroboration which a theory has received up to today'. Thus we must attach a subscript, as it were, to every appraisal of corroboration — a subscript characterizing the system of basic statements to which the corroboration relates (for example, by the date of its acceptance).*2
Corroboration is therefore not a 'truth value'; that is, it cannot be placed on a par with the concepts 'true' and 'false' (which are free from temporal subscripts); for to one and the same statement there may be any number of different corroboration values, of which indeed all can be 'correct' or 'true' at the same time. For they are values which are logically derivable from the theory and the various sets of basic statements accepted at various times.
The above remarks may also help to elucidate the contrast between my views and those of the pragmatists who propose to define 'truth' in terms of the success of a theory — and thus of its usefulness, or of its confirmation or of its corroboration. If their intention is merely to assert that a logical appraisal of the success of a theory can be no more than an appraisal of its corroboration, I can agree. But I think that it would be far from 'useful' to identify the concept of corroboration with that of truth.*3 This is also avoided in ordinary usage. For one might well say of a theory that it has hardly been corroborated at all so far, or that it is still
*2 Cf. note * 1 to section 8 1 .
*3 Thus if we were to define 'true' as 'useful' (as suggested by some pragmatists), or else as 'successful' or 'confirmed' or 'corroborated', we should only have to introduce a new 'absolute' and 'timeless' concept to play the role of 'truth'.
276 SOME STRUCTURAL COMPONENTS OF A THEORY OF EXPERIENCE
uncorroborated. But we should not normally say of a theory that it is hardly true at all so far, or that it is still false.
85 THE PATH OF SCIENCE
One may discern something like a general direction in the evolution of physics — a direction from theories of a lower level of universality to theories of a higher level. This is usually called the 'inductive' direction; and it might be thought that the fact that physics advances in this 'inductive' direction could be used as an argument in favour of the inductive method.
Yet an advance in the inductive direction does not necessarily consist of a sequence of inductive inferences. Indeed we have shown that it may be explained in quite different terms — in terms of degree of testability and corroborability. For a theory which has been well corroborated can only be superseded by one of a higher level of universality; that is, by a theory which is better testable and which, in addition, contains the old, well corroborated theory — or at least a good approximation to it. It may be better, therefore, to describe that trend — the
advance towards theories of an ever higher level of universality — as 'quasi-inductive'.
The quasi-inductive process should be envisaged as follows. Theories of some level of universality are proposed, and deductively tested; after that, theories of a higher level of universality are proposed, and in their turn tested with the help of those of the previous levels of universality, and so on. The methods of testing are invariably based on deductive inferences from the higher to the lower level;*1 on the other hand, the levels of universality are reached, in the order of time, by
proceeding from lower to higher levels.
The question may be raised: 'Why not invent theories of the highest level of universality straight away? Why wait for this quasi-inductive evolution? Is it not perhaps because there is after all an inductive element contained in it?' I do not think so. Again and again suggestions are
*1 The 'deductive inferences from the higher to the lower level' are, of course, explanations (in the sense of section 12); thus the hypotheses on the higher level are explanatory with respect to those on the lower level.
CORROBORATION, OR HOW A THEORY STANDS UP TO TESTS 277
put forward — conjectures, or theories — of all possible levels of universality. Those theories which are on too high a level of universality, as it were (that is, too far removed from the level reached by the testable science of the day) give rise, perhaps, to a 'metaphysical system'. In this case, even if from this system statements should be deducible (or only semi-deducible, as for example in the case of Spinoza's system), which belong to the prevailing scientific system, there will be no new testable statement among them; which means that no crucial experiment can be designed to test the system in question.*2 If, on the other hand, a crucial experiment can be designed for it, then the system will contain, as a first approximation, some well corroborated theory, and at the same time also something new — and something that can be tested. Thus the system will not, of course, be 'metaphysical'. In this case, the system in question may be looked upon as a new advance in the quasi-inductive evolution of science. This explains why a link with the science of the day is as a rule established only by those theories which are proposed in an attempt to meet the current problem situation; that is, the current difficulties, contradictions, and falsifications. In proposing a solution to these difficulties, these theories may point the way to a crucial experiment.
To obtain a picture or model of this quasi-inductive evolution of science, the various ideas and hypotheses might be visualized as particles suspended in a fluid. Testable science is the precipitation of these particles at the bottom of the vessel: they settle down in layers (of universality). The thickness of the deposit grows with the number of these layers, every new layer corresponding to a theory more universal than those beneath it. As the result of this process ideas previously
floating in higher metaphysical regions may sometimes be reached by the growth of science, and thus make contact with it, and settle. Examples of such ideas are atomism; the idea of a single physical 'principle' or ultimate element (from which the others derive); the theory of terrestrial motion (opposed by Bacon as fictitious); the
*2 It should be noted that I mean by a crucial experiment one that is designed to refute a theory (if possible) and more especially one which is designed to bring about a decision between two competing theories by refuting (at least) one of them — without, of course, proving the other. (See also note x to section 22, and appendix *ix.)
278 SOME STRUCTURAL COMPONENTS OF A THEORY OF EXPERIENCE
age-old corpuscular theory of light; the fluid-theory of electricity (revived as the electron-gas hypothesis of metallic conduction). All these metaphysical concepts and ideas may have helped, even in their early forms, to bring order into man's picture of the world, and in some cases they may even have led to successful predictions. Yet an idea of this kind acquires scientific status only when it is presented in falsifiable form; that is to say, only when it has become possible to decide empirically between it and some rival theory.
My investigation has traced the various consequences of the decisions and conventions — in particular of the criterion of demarcation — adopted at the beginning of this book. Looking back, we may now try to get a last comprehensive glimpse of the picture of science and of scientific discovery which has emerged. (What I have here in mind is not a picture of science as a biological phenomenon, as an instrument of adaptation, or as a roundabout method of production: I have in mind its epistemological aspects.)
Science is not a system of certain, or well-established, statements; nor is it a system which steadily advances towards a state of finality. Our science is not knowledge (epistēmē): it can never claim to have attained truth, or even a substitute for it, such as probability.
Yet science has more than mere biological survival value. It is not only a useful instrument. Although it can attain neither truth nor probability, the striving for knowledge and the search for truth are still the strongest motives of scientific discovery.
We do not know; we can only guess. And our guesses are guided by the unscientific, the metaphysical (though biologically explicable) faith in laws, in regularities which we can uncover — discover. Like Bacon, we might describe our own contemporary science — 'the method of reasoning which men now ordinarily apply to nature' — as consisting of 'anticipations, rash and premature' and of 'prejudices'.1
But these marvellously imaginative and bold conjectures or 'anticipations' of ours are carefully and soberly controlled by systematic tests. once put forward, none of our 'anticipations' are dogmatically upheld. Our method of research is not to defend them, in order to prove how
1 Bacon, Novum Orgcmum I, 26.
CORROBORATION, OR HOW A THEORY STANDS UP TO TESTS 279
right we were. on the contrary, we try to overthrow them. Using all the weapons of our logical, mathematical, and technical armoury, we try to prove that our anticipations were false — in order to put forward, in their stead, new unjustified and unjustifiable anticipations, new 'rash and premature prejudices', as Bacon derisively called them.*3
It is possible to interpret the ways of science more prosaically. one might say that progress can '. . . come about only in two ways: by gathering new perceptual experiences, and by better organizing those which are available already'. 2 But this description of scientific progress, although not actually wrong, seems to miss the point. It is too reminiscent of Bacon's induction: too suggestive of his industrious
gathering of the 'countless grapes, ripe and in season',3 from which he expected the wine of science to flow: of his myth of a scientific method that starts from observation and experiment and then proceeds to theories. (This legendary method, by the way, still inspires some of the newer sciences which try to practice it because of the prevalent belief that it is the method of experimental physics.)
*3 Bacon's 'anticipation' ('anticipatio'; Novum Organum I, 26) means almost the same as 'hypothesis' (in my usage). Bacon held that, to prepare the mind for the intuition of the true essence or nature of a thing, it has to be meticulously cleansed of all anticipations, prejudices, and idols. For the source of all error is the impurity of our own minds: Nature itself does not lie. The main function of eliminative induction is (as with Aristotle) to assist the purification of the mind. (See also my Open Society, chapter 24; note 59 to chapter 10; note 33 to chapter 1 1, where Aristotle's theory of induction is briefly described). Purging the mind of prejudices is conceived as a kind of ritual, prescribed for the scientist who wishes to prepare his mind for the interpretation (the unbiassed reading) of the Book of Nature: just as the mystic purifies his soul to prepare it for the vision of God. (Cf. the Introduction to my Conjectures and Refutations (1963) 1965.)
2 P. Frank, Das Kausalgesetz und seine Grenzen, 1932. *The view that the progress of science is due to the accumulation of perceptual experiences is still widely held (cf. my second Preface, 1958). My denial of this view is closely connected with the rejection of the doctrine that science or knowledge is bound to advance since our experiences are bound to accumulate. As against this, I believe that the advance of science depends upon the free competition of thought, and thus upon freedom, and that it must come to an end if freedom is destroyed (though it may well continue for some time in some fields, especially in technology). This view is more fully expounded in my Poverty of Historicism (section 32). I also argue there (in the Preface) that the growth of our knowledge is unpredictable by scientific means, and that, as a consequence, the future course of our history is also unpredictable.
3 Bacon, Novum Organum I, 123.
280 SOME STRUCTURAL COMPONENTS OF A THEORY OF EXPERIENCE
The advance of science is not due to the fact that more and more perceptual experiences accumulate in the course of time. Nor is it due to the fact that we are making ever better use of our senses. Out of uninterpreted sense-experiences science cannot be distilled, no matter how industriously we gather and sort them. Bold ideas, unjustified anticipations, and speculative thought, are our only means for interpreting nature: our only organon, our only instrument, for grasping her. And we must hazard them to win our prize. Those among us who are unwilling to expose their ideas to the hazard of refutation do not take part in the scientific game.
Even the careful and sober testing of our ideas by experience is in its turn inspired by ideas: experiment is planned action in which every step is guided by theory. We do not stumble upon our experiences, nor do we let them flow over us like a stream. Rather, we have to be active: we have to 'make' our experiences. It is we who always formulate the questions to be put to nature; it is we who try again and again to put these question so as to elicit a clear-cut 'yes' or 'no' (for nature does not give an answer unless pressed for it). And in the end, it is again we who give the answer; it is we ourselves who, after severe scrutiny, decide upon the answer to the question which we put to nature — after protracted and earnest attempts to elicit from her an unequivocal 'no'. 'once and for all', says Weyl,4 with whom I fully agree, 'I wish to record my unbounded admiration for the work of the experimenter in his struggle to wrest interpretable facts from an unyielding Nature who knows so well how to meet our theories with a decisive No — or with an inaudible Yes.'
The old scientific ideal of epistēmē — of absolutely certain, demonstrable knowledge — has proved to be an idol. The demand for scientific objectivity makes it inevitable that every scientific statement must remain tentative for ever. It may indeed be corroborated, but every corroboration is relative to other statements which, again, are tentative. only in our subjective experiences of conviction, in our subjective faith, can we be 'absolutely certain'.5
4 Weyl, Gruppentheorie und Quantenmechcmik, 1931, p. 2. English translation by H. P. Robertson: The Theory of Groups and Quantum Mechanics, 1 93 1 , p. xx.
5 Cf. for example note 3 to section 30. This last remark is of course a psychological remark rather than an epistemological one; cf. sections 7 and 8.
CORROBORATION, OR HOW A THEORY STANDS UP TO TESTS 281
With the idol of certainty (including that of degrees of imperfect certainty or probability) there falls one of the defences of obscurantism which bar the way of scientific advance. For the worship of this idol hampers not only the boldness of our questions, but also the rigour and the integrity of our tests. The wrong view of science betrays itself in the craving to be right; for it is not his possession of knowledge, of irrefutable truth, that makes the man of science, but his persistent and recklessly critical quest for truth.
Has our attitude, then, to be one of resignation? Have we to say that science can fulfil only its biological task; that it can, at best, merely prove its mettle in practical applications which may corroborate it? Are its intellectual problems insoluble? I do not think so. Science never pursues the illusory aim of making its answers final, or even probable. Its advance is, rather, towards an infinite yet attainable aim: that of ever discovering new, deeper, and more general problems, and of subjecting our ever tentative answers to ever renewed and ever more rigorous tests.
This is the end of the text of the original book.
The Appendices i-vii which are here printed on
pp. 285-310 were also part of that original edition.
Addendum, 1972
In the preceding chapter of my book (which was the final chapter) I tried to make clear that by the degree of corroboration of a theory I mean a brief report that summarizes the way in which the theory has stood up to tests, and how severe these tests were.
I have never deviated from this view; see for example the beginnings of the new Appendices *vii, p. 378; *ix, p. 406; and especially the last section (*14) of *ix, pp. 441 f. Here I wish to add the following points:
(1) The logical and methodological problem of induction is not insoluble, but my book offered a negative solution: (a) We can never rationally justify a theory, that is to say, our belief in the truth of a theory, or in its being probably true. This negative solution is compatible with the following positive solution, contained in the rule of preferring theories which are better corroborated than others: (b) We can sometimes rationally
282 SOME STRUCTURAL COMPONENTS OF A THEORY OF EXPERIENCE
justify the preference for a theory in the light of its corroboration, that is, of the present state of the critical discussion of the competing theories, which are critically discussed and compared from the point of view of assessing their nearness to the truth (verisimilitude). The current state of this discussion may, in principle, be reported in the form of their degrees of corroboration. The degree of corroboration is not, however, a measure of verisimilitude (such a measure would have to be timeless) but only a report of what we have been able to ascertain up to a certain moment of time, about the comparative claims of the competing theories by judging the available reasons which have been proposed for and against their verisimilitude.
(2) A metaphysical problem raised by the idea of verisimilitude is: are there genuine regularities in nature? My reply is 'yes'. one of the arguments (non-scientific but perhaps 'transcendental'; see pp. 384-5) in favour of this reply is: if no regularities were apparent in nature then neither observations nor language could exist: neither a descriptive nor an argumentative language.
(3) The force of this reply depends on some kind of commonsense realism.
(4) The pragmatic problem of induction solves itself: the practical preference for the theory which in the light of the rational discussion appears to be nearer to the truth is risky but rational.
(5) The psychological problem (why do we believe that the theory so chosen will continue to be worthy of our trust?) is, I suggest, trivial: a belief or trust is always irrational, but it may be important for action.
(6) Not all possible 'problems of induction' are solved in this way.
(See also my forthcoming book: Objective Knowledge: An Evolutionary
Approach.)
과학적 발견의 논리, II부 10장 입증, 즉 이론이 시험을 견디는 정도.hwp
'칼포퍼 원전+번역문' 카테고리의 다른 글
Objective Knowledge (0) | 2018.03.22 |
---|---|
Evolutionary Epistemology (0) | 2018.03.22 |
과학적 발견의 논리, II부 9장 양자론에 관한 몇 가지 관찰 (0) | 2017.12.16 |
과학적 발견의 논리, II부 8장 확률 (0) | 2017.10.08 |
과학적 발견의 논리, II부 7장 단순성 (0) | 2017.07.03 |