6
시험가능성의 등급들
이론들은 더 엄격하게 시험될 수 있거나 덜 엄격하게 시험될 수 있을 것이다; 다시 말해서, 더 쉽게 오류로 판정될 수 있거나 또는 덜 쉽게 오류로 판정될 수 있게. 이론들의 시험가능성의 등급은 이론들의 선택과 관련하여 중요성을 지닌다.
이 장(章)에서, 나는 이론들에 대한 잠재적 오류판정 증거들의 집합들을 비교함을 통하여 이론들이 지닌 시험가능성이나 오류판정 가능성의 다양한 등급들을 비교하겠다. 이 탐구는, 절대적인 의미로 오류로 판정될 수 있는 이론들과 오류로 판정될 수 없는 이론들을 구분하는 것이 가능한지 아닌지의 문제와 전혀 관련이 없다. 정말로 우리는 아마도 현재의 장(章)에 관하여 오류판정 가능성이 등급의 문제임을 밝힘에 의하여 현재의 장(章)이 오류판정 가능성에 대한 요건을 ‘상대화한다’고 말할 것이다.
31 한 가지 프로그램과 한 가지 예시
우리가 23절에서 보았듯이, 이론에 의하여 금지되는 적어도 한 가지 동형 기초명제들로 된 비공집합인 집합이 있다면 이론은 오류로 판정될 수 있다; 이론에 대한 잠재적 오류판정 증거들의 집합이 공집합이 아니라면. 23절에서처럼, 원형의 영역에 의하여 우리가 모든 가능한 기초명제들의 집합을 그리고 원의 반지름들에 의하여 가능한 사건들을 나타낸다면 우리는 다음과 같이 말할 수 있다: 적어도 하나의 반지름이 – 혹시 더 낫게는, 그 폭이 사건은 ‘관찰될 수’ 있다는 사실을 의미할 한 가지 좁은 부채꼴 – 틀림없이 이론과 양립할 수 없어서 이론에 의하여 배제된다. 그 경우에 우리는 아마도 다양한 폭들을 지닌 부채꼴들에 의하여 다양한 이론들에 대한 잠재적 오류판정 증거들을 나타낼 것이다. 이론들에 의하여 배제되는 부채꼴들의 더 큰 그리고 더 작은 폭에 따라서, 이론들은 아마도 그 경우에 더 많은 또는 더 적은 잠재적 오류판정 증거들을 지닌다고 언급될 것이다. (이 ‘더 많은’ 혹은 ‘더 적은’이 조금이라도 더 정확해질 수 있는지의 문제는 당장에는 미결상태로 남겨질 것이다.) 그렇다면 추가적으로, 한 가지 이론에 대한 잠재적 오류판정 증거들의 집합이 또 다른 이론에 대한 잠재적 오류판정 증거들의 집합보다 ‘더 크다’면 첫 번째 이론이 경험에 의하여 반박될 더 많은 기회들이 있을 것이라고 아마도 언급될 것이다; 그리하여 두 번째 이론과 비교되어, 첫 번째 이론은 ‘더 놓은 정도로 오류로 판정될 수’ 있다고 언급될 것이다. 이것은 또한, 첫 번째 이론이 두 번째 이론보다 경험의 세상에 대하여 더 많은 것을 말한다는 것을 의미하는데 왜냐하면 첫 번째 이론이 기초명제들의 더 큰 집합을 배제하기 때문이다. 허용된 명제들의 집합이 그리하여 더 작아진다할지라도, 이것은 우리의 논증에 영향을 미치지 않는다; 이유인즉 이론이 이 집합에 관하여 어떤 것도 주장하지 않는다는 것을 우리는 보았기 때문이다. 그리하여 이론에 의하여 전달되는 경험적 정보의 수량 혹은 이론이 지닌 경험적 내용은 이론의 오류판정 가능성의 정도와 비례하여 증가한다고 언급될 수 있다.
이제 우리에게 이론이 주어진다고, 그리고 그 이론이 금지하는 기초명제들을 나타내는 부채꼴이 점점 더 넓어진다고 상상하자. 궁극적으로 이론에 의하여 금지되지 않는 기초명제들은 남는 좁은 부채꼴에 의하여 표현될 것이다. (이론이 일관적일 수 있다면, 어떤 그런 부채꼴이 틀림없이 남는다.) 이와 같은 이론은 분명히 오류로 판정하기가 매우 쉬울 터인데 왜냐하면 그 이론으로 인하여 경험적 세상에는 단지 좁은 범위의 가능성들만 허용되기 때문이다; 이유인즉 그런 이론은 거의 모든 상상 가능한, 다시 말해서 논리적으로 가능한, 사건들을 배제하기 때문이다. 그런 이론은 경험의 세상에 관하여 매우 많은 것을 주장하고 그런 이론이 지닌 경험적 내용이 매우 크기 때문에 말하자면 그런 이론이 오류판정을 피할 기회가 거의 없다.
이제 이론과학은 정확하게, 이런 의미에서 쉽게 오류로 판정될 수 있는 이론들을 획득하는 것을 목표로 한다. 이론과학은 허용된 사건들의 범위를 최소한으로 제한하는 것을 목표로 한다; 그리고 이것이 조금이라도 수행될 수 있다면, 추가적 제한이 이론에 대하여 실제적인 오류판정을 야기할 터인 정도까지이다. 우리가 이런 이론을 획득하는 데 성공할 수 있을 터라면 이 이론은 가능한 한 정확하게 ‘우리의 특유한 세계’를 기술할 터이다; 이유인즉 이 이론은 이론과학이 도달할 수 있는 최고의 정확성으로써, 논리적으로 가능한 모든 경험의 세상들의 집합으로부터 ‘우리가 경험하는’ 세상을 골라낼 터이기 때문이다. 우리가 실제로 조우하여 관찰하는 모든 사건들이나 사건발생들의 집합들, 그리고 이것들만이 ‘허용된 것’으로서 규정될 터이다.*
32 잠재적 오류판정 증거들의 집합들은 어떻게 비교될 수 있는가?
잠재적 오류판정 증거들의 집합들은 무한집합들이다. 특별한 보호 장치 없이도 유한집합들에 적용될 수 있는 직관적인 ‘더 많은(more)’이나 ‘더 적은(fewer)’은 유사하게 무한집합들에게 적용될 수 없다.
우리는 이 난제를 쉽게 피할 수 없다; 심지어 금지된 기초명제들이나 사건발생들 대신에 우리가 비교를 목표로 그 집합들 중 어느 집합이 ‘더 많은’ 금지된 사건들 포함하는지를 발견하기 위하여 금지된 사건들의 집합들을 고려한다할지라도 그렇다. 왜냐하면 금지된 사건을 여하한 다른 사건과 (금지되었든 아니든) 접속시키는 것은 다시 금지된 사건이라는 사실로부터 알려질 것과 같이, 경험적 이론에 의하여 금지된 사건들의 숫자 또한 무한하기 때문이다.
나는 심지어 무한집합들의 경우에도 그 집합들 중 어느 집합이 금지된 사건들의 집합들을 비교할 목적으로 사용될지를 발견하기 위하여 직관적인 ‘더 많은(more)’이나 ‘더 적은(fewer)’에게 정확한 의미를 제공하는 세 가지 방식들을 고려하겠다.
(1) 집합의 기수(基數: cardinality)라는 (혹은 부분[power]) 개념. 이 개념은 우리가 우리의 문제를 해결하는 데 도움을 줄 수 없는데 왜냐하면 잠재적 오류판정 증거들의 집합들에는 모든 이론들에 대하여 동일한 기수(基數: cardinal number)가 있다는 것이 쉽게 밝혀질 수 있기 때문이다.1
(2) 차원의 개념. 정육면체가 가령 직선보다 어느 정도 더 많은 점들을 포함한다는 모호한 직관적인 개념은 차원이라는 집합론적 개념에 의하여 논리적으로 비예외적인 용어들로 분명하게 정식화될 수 있다. 이것은, 점들로 구성된 집합들의 원소들 사이의 ‘이웃 관계들’의 풍요로움에 따라서 점들의 집합들을
구분한다: 고차원의 집합들에는 더 풍부한 이웃 관계들이 있다. 우리가 ‘고’차원과 ‘저’차원의 집합들을 비교하는 것을 허용하는 차원이라는 개념은 여기서 시험가능성의 등급들을 비교하는 문제를 다루는 데 사용될 것이다. 이것은, 기초명제들이 다른 기초명제들의 접속에 의하여 결합되어, 그럼에도 불구하고 다른 기초명제들의 요소들보다 ‘더 많은 고도로 합성적인’ 기초명제들을 다시 야기하기 때문에, 가능하다; 그러나 이용되어야 할 것은 이 기초명제들이 금지한 사건들의 합성들이 아니라 허용된 사건들의 합성들이다 (이 문장의 원문은 However, it is not the compositions of the forbidden events but that of the permitted ones which will have to be used.인데 that은 the compositions를 대신하는 대명사이므로 those로 써야하고 it ~ that 강조구눔이기 때문에 which는 that으로 표현되어야 한다. 문법적인 오류다: 역자). 이유는, 이론에 의하여 금지된 사건들은 어떤 정도로도 합성이기 때문이기 때문이다; 다른 한편으로, 허용된 명제들 중 몇 가지는 그 명제들의 형태 때문에만 혹은 더 정확하게는 그 명제들의 합성 정도가 너무 낮아서 그 명제들이 문제의 이론을 부정할 수 없기 때문에만 허용된다; 그리고 이 사실은 차원들을 비교하는 데에 사용될 수 있다.*
(3) 부분집합 관계. 집합 α의 모든 원소들이 또한 집합 β이어서 α가 β의 부분집합이 (기호로는: α ⊂ β) 되도록 하라. 그렇다면 β의 모든 원소들이 반대로 또한 α의 원소들이거나 – 그 경우에 두 가지 집합들은 동일한 외연(外延)을 지니거나 동일하다고 언급된다 – 혹은 α에 속하지 않는 β의 원소들이 있다. 후자(後者)의 경우에 α에 속하지 않는 β의 원소들은 β에 관하여 ‘차집합’이나 α의 보집합을 형성하고, α는 β의 진부분집합이다. 부분집합 관계는 직관적인 ‘더 많은(more)’과 ‘더 적은(fewer)’과 매우 잘 일치하지만 그 관계는, 두 가지 집합들 중에서 한 가지 집합이 나머지 집합을 포함한다면 이 관계가 그 두 가지 집합들을 비교하는 데 사용될 수만 있다는 불이익을 당한다. 그리하여 잠재적 오류판정 증거들이 두 가지 집합들의 하나가 나머지 하나에 포함되지 않고 교차한다거나 혹은 그 두 가지 집합들이 공통 원소들을 지니지 않는다면, 일치하는 이론들의 오류판정 가능성의 등급은 부분집합 관계의
도움을 받아서 비교될 수 없다: 그 일치하는 이론들은 이 관계와 관련하여 비교될 수 없다.
33 부분집합 관계에 의하여 비교되는 오류판정 가능성의 등급
다음 정의(定義: definitions)들은 잠정적으로 도입되어 나중에 우리가 이론들의 차원들을 토론하는 과정에서 개선된다.*
(1) x라는 서술은, x에 대한 잠재적 오류판정 증거들의 집합이 y에 대한 잠재적 오류판정 증거들의 집합을 진부분집합으로서 포함한다는 조건으로만 y라는 서술보다 ‘더 고도로 오류로 판정될 수 있다’거나 ‘더 잘 시험될 수 있다’고 언급되는데 혹은 기호들로 표시하면 Fsb(x) > Fsb(y)가 된다.
(2) x와 y라는 두 가지 서술들에 대한 잠재적 오류판정 증거들의 집합들이 동일하다면 그 집합들에는 동일한 등급의 오류판정 가능성이 있는데, 다시 말해서 Fsb(x) =Fsb(y)이다.
(3) 두 가지 서술들에 대한 잠재적 오류판정 증거들의 집합들 중 어느 것도 나머지 하나를 진부분집합으로서 포함하지 않는다면 두 가지 서술들에는 오류판정 가능성에 관한 비교될 수 없는 등급들이 있다 (Fsb(x) || Fsb(y)).
(1)이 적용되면, 항상 공집합이 아닌 보집합이 있을 것이다. 전칭명제들의 경우에, 이 보집합은 틀림없이 무한하다. 그리하여 두 가지 (엄격한 전칭)이론들이, 그 중 한 이론이 나머지 이론에 의하여 허용된 단일 사건발생들의 유한한 숫자를 금지하기 때문에 다르다는 것은 가능하지 않다.
모든 항진명제적(恒眞命題的: tautological)이고 형이상학적인 서술들에 대한 잠재적 오류판정 증거들의 집합들은 공집합이다. 그리하여 (2)에 따라서 그 집합들은 동일하다. (이유인즉 공집합들은 모든 집합들의 부분집합들이고 그리하여 또한 공집합들의 부분집합들이어서 모든 공집합들은 동일하기 때문이다; 이것은, 단지 하나의 공집합이 존재한다고 말함에 의하여 표현될 것이다.) 우리가 ‘e’에 의하여 경험서술을 그리고 ‘t’나 ‘m’에 의하여 항진명제(恒眞命題: tautology)나 형이상학적 명제를 (예를 들어 순수 존재명제) 각각 나타낸다면 우리는 항진명제적(恒眞命題的: tautological) 및 형이상학적 명제들에 0인 오류판정 가능성의 등급을 부여할 것이고 우리는 다음과 같이 서술할 수 있다: Fsb(t) = Fsb(m) = 0, 그리고 Fsb(e) > 0.
자기-모순적인 명제는 (우리가 ‘c’에 의하여 나타낼), 논리적으로 가능한 모든 기초명제들의 집합을 자체에 대한 잠재적 오류판정 증거들의 집합으로 지닌다고 언급될 것이다. 이것은, 여하한 명제도 자체에 대한 오류판정 가능성의 등급에 관하여 자기-모순적 명제와 비교될 수 있다는 것을 의미한다 (이 문장의 원문은 This means that any statements whatsoever is comparable with a self-contradictory statement as to its degree of falsifiability.인데 종속절의 주어 any statements whatsoever와 동사 is가 문법적으로 어긋나기 때문에 any statement whatsoever라고 복수가 아닌 단수 주어로 표기하거나 원문 주어에 따라 동사 is를 are로 바꾸어야 한다: 역자 주). 우리에게는 Fsb(c) > Fsb(e) > 0가 남는다.* 우리가 자의적으로 Fsb(c) = 1이라고 표현한다면, 다시 말해서 숫자 1을 자기-모순적 명제에 대한 오류판정 가능성의 등급에게 자의적으로 할당한다면 우리는 조건 1 > Fsb(e) > 0에 의하여 경험서술 e를 심지어 정의(定義)할 것이다. 이 공식에 따라서, Fsb(e)는 항상 0과 1 사이의 구간 안에 속하는데 이 한계들을 제외하는 것이고 다시 말해서 이 숫자들에 의하여 한계가 표시되는 ‘열린구간’ 내부에 속하는 것이다. 모순과 항진명제(恒眞命題: tautology)를 (형이상학적 명제들뿐만 아니라) 제외함에 의하여 그 공식은 동시에 일관성이라는 요건과 오류판정 가능성이라는 요건 모두를 표현한다.
34 부분집합 관계의 구조. 논리적 확률
우리는 두 가지 명제들에 대한 오류판정 가능성의 등급 비교를 부분집합 관계의 도움을 받아서 정의(定義)했다: 그리하여 그 비교는 후자(後者)의 구조적 속성들을 공유한다. 비교가능성이라는 문제는 도표(그림 1)의 도움을 받아서 설명될 수 있는데, 그 도표 안에서 특정 부분집합 관계가 왼쪽에 그려지고 상응하는 시험가능성 관계가 오른쪽에 그려진다. 오른편의 아라비아 숫자들은, 주어진 로마숫자가 상응하는 아라비아 숫자에 의하여 표시되는 저 서술에 대한 잠재적 오류판정 증거들의 집합을 나타내는 방식으로 왼쪽의 로마 숫자들과 상응한다. 시험가능성의 등급들을 보여주는 표에서의 화살표들은, 더 잘 시험될 수 있거나 더 잘 오류로 판정될 수 있는 서술들에서부터 그다지 잘 시험될 수 없는 서술들로 움직인다. (그리하여 그 화살표들은 도출가능성-화살표들과 상당히 정확하게 일치한다; 35절 참조.)
예를 들어 순서 I-II-IV 혹은 I-III-V처럼 다양한 부분집합들의 순서들이 구분되어 추적될 수 있다는 것과, 이것들은 새로운 중간집합들을 도입함에 의하여 더 ‘촘촘하게’ 될 수 있을 터임은 도표로부터 알려질 것이다. 이 모든 순서들은 이 특정한 경우에 1로써 시작하고 공집합으로 끝나는데 왜냐하면 후자(後者)가 모든 집합에 포함되기 때문이다. (공집합은 왼쪽에 있는 우리의 도표
그림 1
모든 기초명제들의 집합과 동일시하기로 결정한다면 1은 모순 (c)가 된다; 그리고 (공집합과 상응하여) 그 경우에 항진명제(恒眞命題: tautology) (t)를 나타낼 것이다. 다양한 경로들에 의하여 1에서 공집합으로 혹은 (c)에서 (t)로 이동하는 것이 가능하다. 이 경로들 중 몇 가지는 오른쪽 표로부터 알려질 수 있는 바와 같이 서로 교차할 것이다. 그리하여 우리는, 관계의 구조는 격자(格子: lattice)의 (화살표나 부분집합 관계에 의하여 배열된 ‘순서들의 격자’) 구조라고 말할 것이다. 그 안에는 격자(格子: lattice)가 부분적으로 연결되는 결절점(結節點: nodal points)들이 (예를 들어 명제 4와 5) 있다. 그 관계는,
모순 c와 항진명제(恒眞命題: tautology) t가 상응하여 전체집합에서 그리고 공집합에서만 완전히 연결된다.
다양한 명제들에 대한 오류판정 가능성의 등급들을 한 가지 척도로 배열하는 것이, 다시 말해서 그 다양한 명제들을 그 명제들에 대한 오류판정 가능성에 따라 배열하는 숫자들을 다양한 명제들과 상호 관련짓는 것이 가능한가? 분명히 우리는 이런 방식으로 모든 명제들을 배열할 수 없다.* 왜냐하면 우리가 그렇게 한다면, 우리는 틀림없이 자의적으로 비교될 수 없는 명제들을 비교될 수 있게 만들고 있기 때문이다. 그러나 격자(格子: lattice)로부터 순서들 중 하나를 우리가 골라내어 숫자들에 의하여 그것의 명제들의 배열을 지적하는 것을 막는 것은 없다. 그렇게 하면서 우리는, 항진명제(恒眞命題: tautology) t에 더 가까이 놓여있는 명제보다 모순 c에 더 가깝게 놓여있는 명제에게 항상 더 높은 숫자가 주어지는 방식으로 나아가야 할 터이다. 우리는 이미 항진명제(恒眞命題: tautology)와 모순에게 각각 숫자들과 1을 할당했기 때문에 우리는 선택된 순서의 경험적 서술들에게 진분수들을 할당해야 할 터이다.
그러나 나에게는 순서들 중 하나를 선택하려는 의도가 실제로 없다. 또한 순서의 서술들에게 숫자들을 할당하는 것은 전적으로 자의적일 터이다. 그럼에도 불구하고, 그런 분수들을 할당하는 것이 가능하다는 사실은 매우 흥미로운데, 특히 그 사실이 오류판정 가능성의 등급과 확률이라는 개념 사이의 연관성을 밝히는 설명이기 때문이다. 우리가 두 가지 서술들에 대한 오류판정 가능성의 등급들을 비교할 수 있을 때마다 우리는, 오류판정이 덜 가능한 서술이 자체의 논리적 형태에 의하여 그만큼 더 개연적이기도 하다고 말할 수 있다. 이 확률을 나는 ‘논리적 확률’이라고 부른다*;1 이 확률은, 우연의 게임들에 대한 이론과 통계학에서에서 사용되는 숫자적 확률과 혼동되어서는 안 된다. 서술의 논리적 확률은 자체에 대한 오류판정 가능성의 정도와 상호보완적이다. 그 확률은 오류판정 가능성이 감소함에 따라서 증가한다. 논리적 확률 1은 오류판정 가능성의 정도 0과 일치하고 역순도 성립한다. 더 잘 시험될 수 있는 서술, 즉 더 높은 정도의 오류판정 가능성을 지닌 서술은 논리적으로 덜 개연적인 서술이다; 그리고 잘 시험되기가 덜한 서술은 논리적으로 개연성이 더 큰 서술이다.
72절에서 밝혀질 것과 같이, 숫자적 확률은 논리적 확률과 연결될 수 있고 그리하여 오류판정 가능성의 등급과 연결될 수 있다. 숫자적 확률을, 빈도추정들을 근거로 측정의 체계가 대신해서 정의(定義)될 수 있는 하부순서에 (논리적 확률 관계로부터 선택된) 적용되는 것으로 해석하는 것이 가능하다.
오류판정 가능성들의 비교에 관한 이 관찰들은 전칭명제들에 관해서만 혹은 이론들의 체계들에 관해서만 유효하지 않다; 그 관찰들은 단칭명제들에게 적용하기 위하여 확대될 수 있다. 그리하여 그 관찰들은, 예를 들어, 초기조건들과 접속된 이론들에 대하여 유효하다. 이 경우에 잠재적 오류판정 증거들의 집합은 사건들의 집합으로서 – 동일유형의 기초명제들로서 - 오해되어서는 안 되는데 왜냐하면 그 집합이 사건발생들의 집합이기 때문이다. (이 언급은, 72절에서 분석될 논리적 확률과 숫자적 확률 사이의 연결과 어떤 관련이 있다.)
35 경험적 내용, 함의 그리고 오류판정 가능성의 등급들
우리가 서술의 경험적 내용이라고 부르는 것이 자체에 대한 오류판정 가능성에 비례하여 증가한다고 31절에서 언급되었다: 서술이 금지할수록 서술은 경험의 세상에 관하여 더 많이 말한다. (6절 참조.) 내가 ‘경험적 내용’이라고 부르는 것은, 예를 들어 카르납(Carnap)에 의하여 정의(定義)된 것으로서의 ‘내용’이라는 개념과 밀접하게 관련되지만 동일하지는 않다.1 후자(後者)에 대하여 나는 ’논리적 내용‘이라는 용어를 사용할 것인데 그 용어를 경험적 내용이라는 용어와 구분하기 위해서이다.
나는 서술 p의 경험적 내용을 그 서술에 대한 잠재적 오류판정 증거들의 집합으로서 정의(定義)한다 (31절 참조). 논리적 내용은, 도출가능성이라는 개념의 도움을 받아서, 문제의 서술로부터 도출될 수 있는 모든
비-항진명제적(非-恒眞命題的: non-tautological) 서술들의 집합으로서 정의(定義)된다. (논리적 내용은 그 서술의 ‘귀결 집합’으로 지칭될 것이다.) 그러므로 p의 논리적 내용은, q가 p로부터 도출될 수 있다면 (혹은 기호로 표시하여, ‘p → q라면*)’, 서술 q의 내용과 적어도 동등하다 (다시 말해서 더 크거나 동등하다). 도출가능성이 상호적이라면 (기호로는, ‘p ↔ q’) p와 q는 동등한 내용을 지닌다고 언급된다. q가 p로부터 도출될 수 있지만, q로부터 p가 될 수는 없다면 q의 귀결 집합은 틀림없이 p의 귀결 집합의 진부분집합이다; 그리고 그 경우에 p는 더 큰 귀결 집합을 소유하고 그리하여 더 큰 논리적 내용을 (혹은 논리적 힘*2) 지닌다.
비교되는 서술들이 형이상학적 요소들을 포함하지 않는다는 조건으로 두 가지 서술 p와 q의 논리적 및 경험적 내용들의 비교가 동일한 결과를 낳는 것은 내가 경험적 내용을 정의(定義)한 결과이다. 그리하여 우리는 다음을 요구할 것이다: (a) 동등한 논리적 내용을 지닌 두 가지 서술들에는 틀림없이 또한 동등한 경험적 내용이 있다; (b) 그 논리적 내용이 서술 q의 논리적 내용보다 더 큰 서술 p에는 틀림없이 또한 더 큰 경험적 내용이나 적어도 동등한 경험적 내용이 있다; 그리고 마지막으로, (c) 서술 p의 경험적 내용이 서술 q의 경험적 내용보다 더 크다면, 논리적 내용은 틀림없이 더 크거나 아니면 비교가 불가능하다. (b)의 ‘이나 적어도 동등한 경험적 내용’이라는 제한사항은 추가되었어야 했는데 왜냐하면 p가 예를 들어 어떤 순수 존재명제에 대한 혹은 우리가 특정 논리적 내용을 귀속시켜야 하는 어떤 다른 종류의 형이상학적 서술에 대한 q의 접속일지도 모르기 때문이다; 이유인즉 이 경우에 p의 경험적 내용은 q의 경험적 내용보다 크지 않을 것이기 때문이다. 상응하는 고찰들로 인하여 (c)에 ‘거나 아니면 비교가 불가능한’이라는 제한사항이 추가되는 것이 필수적이다.*3
시험가능성의 혹은 경험적 내용의 등급들을 비교하면서 우리는 그리하여 통상적으로 – 다시 말해서 순수 경험적 서술들의 경우에 – 논리적 내용 즉, 도출가능성-관계들을 비교하는 것에서와 동일한 결과들에 도달할 것이다. 그리하여 오류판정 가능성의 등급들의 비교를 큰 범위까지 도출가능성 관계들에 근거시키는 것이 가능할 것이다. 두 가지 관계들 모두는, 자기-모순에서 그리고 항진명제(恒眞命題: tautology)에서 완전히 연결된 격자(格子: lattices)들의 형태를 보여준다 (34절 참조). 이것은, 자기-모순은 모든 서술을 수반한다고 그리고 항진명제(恒眞命題: tautology)는 모든 서술에 의하여 수반된다고 말함에 의하여 표현될 것이다. 게다가 경험적 서술들은, 우리가 본 바와 같이, 그 오류판정 가능성의 등급이 한편에서는 자기-모순들의 오류판정 가능성의 등급들에 의하여 제한되고 다른 한편에서는 그 항진명제(恒眞命題: tautologies)들의 오류판정 가능성의 등급들에 의하여 제한되는 개구간(開區間: open interval)에 속하는 경험적 서술들로서 규정될 수 있다. 유사하게, 일반적인 종합명제들은 (비-경험적인 종합명제들을 포함하여) 수반 관계에 의하여 자기-모순과 항진명제(恒眞命題: tautology) 사이의 개구간(開區間: open interval) 안에 위치된다.
모든 비-경험적 (형이상학적) 서술들은 ‘무의미’하다는 실증주의적 주장에, 그리하여 경험적 및 종합적 서술들이나 경험적 및 논리적 내용에 대한 나의 구분이 불필요하다는 주장이 상응할 터이다; 이유인즉 모든 종합명제들은 – 진정한, 다시 말해서, 단순히 사이비-명제들이 아닌 모든 명제들 – 틀림없이 경험적일 터이기 때문이다. 그러나 단어들을 사용하는 이 방식은, 실현가능할지라도, 내가 보기에 문제를 명료하게 하기 보다는 혼란스럽게 할 것 같다.
그리하여 나는 두 가지 서술들이 지닌 경험적 내용의 비교를 그 서술들이 지닌 오류판정 가능성의 등급들의 비교와 대등한 것으로서 간주한다. 이로 인하여, 가장 엄격하게 시험될 수 있는 저 이론들이 선호되어야 한다는 우리의 방법론적 규칙은 (20절의 반[反]-규약주의적 규칙들 참조) 가능한 최고의 경험적 내용을 지닌 이론들을 선호하는 규칙과 대등하게 된다.
36 보편성의 수준들과 정확도들
가능한 최고의 경험적 내용에 대한 요구로 환원될 다른 방법론적 요구들이 있다. 이것들 중 두 가지가 두드러진다: 보편성에 도달될 수 있는 최고 수준에 (혹은 정도) 대한 요구, 그리고 정확성에 도달될 수 있는 최고 정도.
이것을 염두에 두고 우리는 상상이 가능한 다음 자연법칙들을 검토할 것이다:
p: 폐쇄 궤도로 움직이는 모든 천체들은 원들로 움직인다:
혹은 보다 간략하게: 모든 천체들의 궤도들은 원들이다.
q: 모든 행성들의 궤도들은 원들이다.
r: 모든 천체들의 궤도들은 타원형이다.
s: 모든 행성들의 궤도들은 타원형이다.
이 네 가지 서술들 사이에서 유효한 연역가능성 관계들은
도표 안에서 화살표로 밝혀진다. p로부터 모든 다른 것들이 귀결된다; q로부터 s가 귀결되는데 s는 또한 r로부터 귀결된다; 그리하여 s는 모든 다른 것들로부터 귀결된다.
p에서 q로 움직이면서 보편성의 정도가 감소한다; 그리고 행성들의 궤도들이 천체들의 궤도들의 진부분집합을 형성하기 때문에 q는 p보다 이야기하는 바가 더 적다. 결과적으로 p는 q보다 더 쉽게 오류로 판정된다: q가 오류로 판정된다면, p도 오류로 판정되지만 역순은 성립하지 않는다. p에서 r로 움직이면서, 정확성의 (술어의) 정도는 감소한다: 원들은 타원형들의 진부분집합이다; 그래서 r이 오류로 판정된다면, p 또한 오류로 판정되지만 역순은 성립하지 않는다. 상응하는 논평들이 다른 움직임들에도 적용된다: p로부터 s로 움직이면서 보편성과 정확성 모두의 정도가 감소한다; q로부터 s로 움직이면 정확성이 감소한다; 그리고 r로부터 s로 움직이면 보편성이 감소한다. 더 높은 정도의 보편성이나 정확성에 더 큰 (논리적 혹은) 경험적 내용이 상응하고 그리하여 더 높은 정도의 시험가능성이 생긴다.
전칭명제들이나 단칭명제들 모두는 ‘전칭 조건명제’의 (혹은 흔히 지칭되는 바와 같이 ‘일반적 함축’) 형태로 서술될 수 있다. 우리의 네 가지 법칙들을 이런 형태로 우리가 표현한다면, 우리는 아마도 두 가지 명제들과 관련된 보편성의 등급들과 정확성의 등급들이 어떻게 비교될 것인지를 보다 쉽고 정확하게 알 수 있을 있다.
전칭 조건명제는 (14절의 주석 6 참조) 다음 형태로 서술될 것이다: ‘(x) (φx → fx)’ 혹은 말로 표현하면: ‘명제 함수 φx를 만족시키는 x의 모든 값들은 또한 명제 함수 fx를 만족시킨다.’ 우리의 도표 상의 서술 s는 다음 보기를 낳는다: ‘(x) (x는 행성의 궤도이다 → x는 타원형이다)’인데 의미하는 바는: ‘x가 무엇이든지, x가 행성의 궤도라면 x는 타원형이다.’ p와 q를 이런 ‘평범한’ 형태로 서술된 두 가지 서술들로 하라; 그렇다면, p의 전건 명제함수가 ('φpx'에 의하여 표시될) q의 상응하는 명제함수에 (‘φqx’에 의하여 표시될) 의하여
항진명제적(恒眞命題的: tautologically)으로 함축되지만 (혹은 그 q의 상응하는 명제함수로부터 논리적으로 연역될 수 있지만) 그 q의 상응하는 명제 함수와 (‘φqx’에 의하여 표시될) 대등하지 않다면 p가 q보다 더 큰 보편성을 지닌다고 우리는 말할 수 있다; 혹은 언어로 표현하여, ‘(x) (φqx → φpx)’가 항진명제적(恒眞命題的: tautological)이라면 (혹은 논리적으로 참이라면). 유사하게 우리는, (x) (fpx → fqx)가 항진명제적(恒眞命題的: tautological)이라면, 다시 말해서 p의 술어가 q의 술어를 수반한다는 것을 의미하는 p의 술어가 (혹은 후건 명제함수가) q의 술어보다 더 좁다면 p에는 q보다 더 큰 정확성이 있다고 우리는 말할 것이다.*
이 정의(定義: definition)는 한 가지 이상의 변수를 지닌 명제함수들에까지 확대될 것이다. 기초적인 논리적 변환들은 그 정의(定義: definition)로부터 우리가 주장해서 다음 규칙에 의하여 표현될 도출가능성 관계들에 다다른다:1 두 가지 서술들 중에서 그 서술들의 보편성과 동시에 그 서술들의 정확성 모두가 비교될 수 있다면, 덜 보편적이거나 덜 정확한 것이 더 보편적이거나 더 정확한 것으로부터 도출될 수 있다; 물론 전자(前者)가 보다 보편적이지 않고 후자(後者)가 보다 정확하지 않다면 (나의 도표에서 q와 r의 경우에서처럼).2
우리는 이제, 우리의 방법론적 결정이 – 때때로 인과성의 원리로서 형이상학적으로 해석되는 – 어떤 것도 설명되지 않은 채로 남겨서는 안 된다고, 다시 말해서 항상 더 높은 보편성을 지닌 다른 서술들로부터 서술들을 연역하려고 노력해야한다고 말할 수 있다. 이 결정은 도달될 수 있는 최고 정도의 보편성과 정확성에 대한 요구로부터 도출되고, 그 결정은 가장 엄격하게 시험될 수 있는 저 이론들이 선호되어야 한다는 요구나 규칙으로 환원될 수 있다.*2
37 논리적 치역(値域: ranges)들. 측정 이론에 관한 기록들
서술 p가 더 높은 정도의 보편성이나 정확성을 지니고 있기 때문에, 서술 q보다 오류로 판정되기가 더 쉽다면 p에 의하여 허용되는 기초명제들의 집합은 q에 의하여 허용되는 기초명제들의 집합의 진부분집합이다. 허용되는 서술들의 집합들 사이에 유효한 부분집합-관계는 금지된 서술들의 (잠재적 오류판정 증거들) 사이에 유효한 부분집합-관계와 반대의 것이다: 두 가지 관계들은 정반대라고 (또는 아마도 상보적이라고) 언급될 것이다. 한 가지 서술에 의하여 허용되는 기초명제들의 집합은 그 기초명제의 ‘치역(値域: range)’이라고 지칭될 것이다. 서술이 실제에 허용하는 치역(値域: range)은, 말하자면, 서술이 실제에 허용하는 ‘자유 활동’의 (혹은 자유의 정도) 양이다. 치역(値域: range)과 경험적 내용은 (35절 참조) 정반대의 (혹은 상보적) 개념들이다. 따라서 두 가지 서술들의 치역(値域: ranges)들은, 그 서술들의 논리적 확률들이 그러한 것과 똑같은 정도로 서로 관련된다 (34절 및 72절 참조).
나는 치역(値域: range)이라는 개념을 도입했는데 왜냐하면 그 개념은 우리가 측정에서 정확성의 정도와 관련된 특정 문제들을 다루는 데 도움을 주기 때문이다. 두 가지 이론들의 결론들이 적용의 모든 분야들에서 거의 다르지 않아서 계산된 관측 가능한 사건들 사이에서 매우 작은 차이점들도, 우리의 측정행위들에서 도달될 수 있는 정확성의 정도가 충분히 높지 않다는 사실 때문에, 탐지될 수 없다고 상정하라. 그렇다면 실험에 의하여, 두 가지 서술들 중 첫 번째 서술이 우리의 측정 기법을 향상시키지 않고는, 두 가지 서술 중에서 결정하는 것이 불가능할 것이다.*1 이것은, 우세한 측정 기교가 특정 치역(値域: range)을 – 그 안에서 관찰들 사이의 상이점들이 이론에 의하여 허용되는 영역 – 결정한다는 것을 증명한다.
그리하여 이론들에는 틀림없이 최고의 도달 가능한 시험가능성의 정도가 있다는 (그리고 그리하여 가장 좁은 치역[値域: range]만을 허용한다는) 규칙은, 측정에서 정확도가 가능한 한 많이 제고되어야 한다는 요건을 수반한다.
모든 측정들은 점들(points)의 동시발생들에 대한 결정에 놓여있다고 흔히 언급된다. 그러나 여하한 그런 결정도 한계들 안에서 올바를 수 있을 따름이다. 엄격한 의미에서 점들(points)의 동시발생들은 없다.* 두 개의 물리적 점들(points)은 – 가령 측정자 상의 표시와 측정되는 물체 상의 또 다른 표시 – 기껏해야 근접될 수 있다; 그 점들(points)들은 동시에 발생할 수, 다시 말해서, 하나의 점(point)으로 합칠 수 없다. 그러나 이 언급이 또 다른 문맥에서 혹시 진부할지라도, 측정에서의 정확성이라는 문제에 대해서는 중요하다. 왜냐하면 그 언급으로 인하여 측정이란 다음 용어들로 기술되어야 한다는 것을 우리가 상기하기 때문이다. 측정되는 물체의 점(point)이 측정자 위의 두 가지 눈금들이나 표시들 사이에 놓인다는 것을, 혹은 가령 우리가 지닌 측정 도구의 바늘이 저울 위의 두 눈금들 사이에 놓인 것을 우리는 발견한다. 그리하여 우리는 이 두 가지 눈금들이나 표시들을 우리가 저지르는 오류의 최적 한계들로서 간주할 수 있거나, 눈금들의 간격의 안에 있는 (가령) 바늘의 위치를 추산하는 데로 나아가 그리하여 보다 정확한 결과를 얻을 수 있다. 우리는 이 후자(後者) 경우를, 바늘이 두 가지 상상적인 눈금 표시들 사이에 놓여있는 것으로 간주한다고 말을 함에 의하여, 기술할 것이다. 그리하여 치역(値域: range)인 간격은 항상 남는다. 모든 측정에 대하여 이 간격을 추산하는 것은 물리학자들의 습관이다. (그리하여 밀리칸[Millikan]을 좇아 물리학자들은, 예를 들어, 정전단위들[靜電單位: electrostatic units]로 측정된 전자의 전기소량[電氣素量: elementary charge]을 e =
간격의 경계들을 제시하는 것은, 이 두 가지 경계들이 반대로 우리가 원래 측정에 대하여 도달하기를 희망할 수 있는 것을 크게 능가하는 정확성의 정도로써 고정될 수 없다면, 분명히 쓸모가 없다; 고정된, 다시 말해서, 그 경계들이 원래 측정의 값에 대하여 결정하는 간격보다 그리하여 틀림없이 몇 가지 규모의 서열들에 의하여 더 작은 비정확성에 대한 그 경계들의 내부에서, 다시 말해서, 간격의 경계들은 뚜렷한 경계들이 아니지만 실제로 매우 작은 간격들인데, 그 간격들의 경계들은 반대로 훨씬 더 작은 간격들이고 그렇게 계속된다. 이런 방식으로 우리는 소위 간격에 대한 ‘뚜렷하지 않은 경계들’이나 ‘응축 경계들(condensation bounds)’로 지칭될 것이라는 개념에 도달한다.
이 고찰들은 수학적 오류 이론이나 확률론을 전제하지 않는다. 상황은 오히려 반대이다; 간격 측정하기라는 개념을 분석함에 의하여 이 고찰들은, 그 배경이 없으면 통계적 오류 이론이 매우 이해가 되지 않는 배경을 제공한다. 우리가 규모를 여러 번 측정한다면, 우리는 한 간격에 – 일반적인 측정 기교에 의존하는 정확성의 간격 - 걸쳐서 다양하게 밀집되어 배분되는 가치들을 얻는다. 우리가 추구하고 있는 것을 – 즉 이 간격의 응축 경계들 - 우리가 안다는 조건으로만 우리는 이 값들에게 오류 이론을 적용하여 간격의 경계들을 결정할 수 있다.*
이제 이 모든 것은, 순전히 정성적(定性的: qualitative) 방법들에 관한 측정들을 사용하는 방법들의 우월성을 설명한다고 나는 생각한다. 심지어 음향의 수준에 대한 추산과 같은 정성적(定性的: qualitative) 추산들의 경우에도, 그 추산들에 대한 정확성의 간격을 제시하는 것이 때때로 가능할 것임은 사실이다; 그러나 측정들이 없다면 여하한 그런 간격은 매우 모호할 수 있을 따름인데 왜냐하면 그런 경우들에는 응축 경계들이라는 개념이 적용될 수 없기 때문이다. 이 개념은, 우리가 규모의 서열들에 대하여 말할 수 있는 곳에서만 그리고 따라서 측정의 방법들이 정의(定義)되는 곳에서만 적용될 수 있다. 확률론과 관련하여 나는 68절에서 정확성의 간격들에 대한 응축 경계들이라는 개념을 추가적으로 이용하겠다.
38 차원들에 대한 언급에 의하여 비교된 시험가능성의 등급들.
지금까지 우리는, 이론들의 시험가능성 등급들이 부분집합-관계의 도움을 받아서 비교될 수 있는 한에서만 그 등급들과 관련하여 이론들에 대한 비교를 토론하였다. 몇 가지 경우들에서 이 방법은, 이론들에 대한 우리의 선택을 이끄는 데서 완전히 성공적이다. 그리하여 우리는 이제, 20절에서 사례를 통하여 언급된 파울리(Pauli)의 배타 원리가 보조 가설로서 고도로 만족스러운 것으로 정말로 판명된다고 말할 것이다. 이유인즉 그 원리는 더 오래된 양자론의 정확도를, 그리고 그와 동시에 더 오래된 양자론의 시험가능성 등급을 크게 증가시키기 때문이다 (비대칭적 상태들이 전자들에 의하여 실현되면 대칭적 상태들은 충전되지 않은, 그리고 특정 복수로 충전된 입자들에 의하여 실현된다고
주장하는 새로운 양자론의 상응하는 서술처럼).
그러나 많은 목표들과 관련하여 부분집합 관계를 통한 비교는 충분하지 않다. 그리하여 고도의 보편성을 지닌 서술들은 – 플랑크(Planck)의 정식화에서 에너지 보전의 원리와 같이 - 초기조건들이 ‘... 극소수의 측정들에 의하여,... 다시 말해서 이론체계의 상태에 특징적인 작은 숫자의 규모를 통하여’ 결정될 수 없다면, 항진명제적(恒眞命題的: tautological)이어서 자체들의 경험적 내용을 잃기 쉽다고 예를 들어 프랭크(Frank)는 지적했다. 발견되어야 하는 그리고 공식들로 대체되어야 하는 기준척도라는 문제는, 분명히 시험가능성이라는 그리고 오류판정 가능성이라는 문제와 그 가능성들의 등급들과 긴밀하게 관련된다는 사실에도 불구하고 부분집합 관계의 도움을 받아서 설명될 수 없다. 초기조건들을 결정하는 데 필요한 규모들이 적을수록, 이론에 대한 오류판정에 충분한 기초명제들은 덜 합성적일*1 것이다; 이유인즉 오류로 판정하는 기초명제는, 초기조건들을 도출된 예측에 대한 부정과 접속하는 것으로 구성되기 때문이다 (28절 참조). 그리하여 기초명제가 이론을 부정할 수 있게 된다면 기초명제가 지녀야 하는 합성의 최소 등급을 발견함에 의하여 이론들을 그 이론들이 지닌 시험가능성의 등급에 관하여 비교하는 것이 가능할 것이다; 항상 우리가 기초명제들이 더 간략한 종류의 기초명제들의 더 큰 (혹은 더 작은) 숫자로 더 많이 (혹은 더 적게) 합성적인지, 다시 말해서 합성물들인지를 발견하기 위하여, 우리가 기초명제들을 비교하는 방법을 발견할 수 있다면. 모든 기초명제들은, 그 기초명제들의 내용이 어떠하든, 그 기초명제들의 합성도가 필요한 최소한에 미치지 못하는데, 그 명제들의 낮은 합성도 때문에만 이론에 의하여 허용될 터이다.
그러나 여하한 그런 프로그램도 난점들에 직면한다. 이유인즉 일반적으로, 검사함에 의해서만 명제가 합성적인지, 다시 말해서 더 단순한 명제들의 접속과 대등한지를 말하는 것이 쉽지 않기 때문이다. 모든 명제들에는 보편적 명칭들이 발생하고 그 명칭들을 분석함에 의하여 우리는 명제를 접속 요소들로 흔히 세분할 수 있다. (예를 들어, ‘k라는 장소에 물 한잔이 있다’는 서술은 아마도 분석되어, ‘k라는 장소에 액체를 담은 유리잔이 있다’와 ‘k라는 장소에 물이 있다’라는 서술로 세분될 것이다.) 이 방법에 의하여 서술의 분해에 대하여 자연스런 끝을 발견하려는 가망은 없는데, 특히 우리가 추가적 분해를 가능하게 만드는 목적에 대하여 정의(定義)된 새로운 보편자들을 항상 도입할 수 있기 때문이다.
모든 기초명제들의 합성도들을 비교될 수 있게 만들기 위한 목적으로, 우리가 명제들의 특정 집합을 요소명제들이나 원자명제들로서 선택해야 한다고 아마도 제안될 것인데, 그 집합으로부터 그렇다면 모든 다른 서술들이 접속과 다른 논리적 작동들에 의하여 획득될 수 있을 터이다. 성공했다면, 우리는 이런 방식으로 틀림없이 합성의 ‘절대 0’을 정의(定義)했고 그렇다면 명제의 합성은 말하자면 합성의 절대 등급들로 표현될 수 있을 터이다 (이 문장의 원문은 If successful, we should have defined in this way an 'absolute zero' of composition, and the composition of any statement could then be expressed, as it were, in absolute degrees of composition.인데 should have + 과거분사는 과거의 이루지 못한 의무를 표현하는 방식인 반면, 문맥상 의미는 must have + 과거분사로 ‘틀림없이 ~했다’이기 때문에 올바른 표현이 아니다: 역자).*2 위에 제시된 이유가 없다면, 그런 절차는 틀림없이 매우 부적절한 것으로서 간주될 터이다; 이유인즉 그런 절차는 과학적 언어의 자유로운 사용에 엄격한 제한사항들을 부과할 터이기 때문이다.*
그럼에도 불구하고 기초명제들의 합성도들을 비교하는 것이 여전히 가능하고 그리하여 또한 다른 명제들의 합성도들을 비교하는 것도 여전히 가능하다. 이것은, 상대적으로 원자적인 명제들의 집합을 자의적으로 선택함에 의하여 수행될 수 있는데 그 집합을 우리는 비교에 관한 기초로서 간주한다. 상대적으로 원자적인 명제들의 그런 집합은 도식이나 기반(matrix)을 생성함을 (예를 들어, ‘... 장소에 ...에 대한 측정 도구가 있는데, 그 도구의 바늘은 눈금 표시들 ...와 ... 사이에 놓인다’) 통하여 정의(定義)될 수 있다. 그리하여 우리는, 확정된 값들을 대입함에 의하여 이런 종류의 기반(matrix)으로부터 (혹은 명제함수로부터) 획득되는 모든 명제들의 집합을 상대적으로 원자적인 것으로서 또 그리하여 균형-합성적인 것으로서 정의(定義)할 수 있다. 이 명제들의 집합은, 그 명제들로부터 형성될 수 있는 모든 접속들과 함께 ‘장(場: field)’으로서 지칭될 것이다. 한 장(場: field)의 n 가지의 다양한 상대적으로 원자적인 명제들의 접속은 ‘장(場: field)의 n 원소들’로서 지칭될 것이다; 그리하여 우리는, 그 접속의 합성도가 숫자 n과 대등하다고 말할 수 있다.
이론 t에 대하여 단칭(그러나 반드시 기초가 아닌)명제들의 장(場: field)이, 특정 d + 1 원소들에 의하여 오류로 판정될 수 있을지라도, 존재한다면 우리는 d를 저 장(場: field)에 관한 이론의 특징적인 숫자로 부른다. 그 합성도가 d 이하이거나 d인 장(場: field)의 모든 명제들은 그렇다면 이론과 양립할 수 있어서 그 명제들의 내용과 관계없이 이론에 의하여 허용된다.
이제 이론들이 지닌 시험가능성 등급의 비교를 이 특징적인 숫자 d에 근거시키는 것이 가능하다. 그러나 다양한 장(場: field)들의 이용을 통하여 나타날지도 모르는 모순들을 피하기 위하여, 장(場: field)이라는 개념보다 다소 더 협소한 개념, 즉 적용의 장(場: field)이라는 개념을 사용할 필요가 있다. 이론 t가 주어지면, 이 장(場: field)과 관련하여 이론 t의 특징적인 숫자 d가 존재한다는 조건과 추가적으로 그 이론이 특정 추가적인 조건들을 (부록 i에 설명되는) 충족시킨다는 조건으로 장(場: field)은 이론 적용의 장(場: field)이라고 우리는 말한다.
장(場: field)의 적용과 관련된 이론 t의 특징적 숫자 d를 나는 이 적용의 장(場: field)과 관련된 t의 차원(dimension)이라고 부른다. ‘차원(dimension)’이라는 표현은, 우리가 장(場: field)의 모든 가능한 n-원소들을 공간적으로 배열된 것으로서 (무한 차원들의 배열공간에서) 생각할 수 있기 때문에, 스스로 떠오른다. 예를 들어 d = 3이라면, 그 명제들의 합성이 너무 낮은 형태이기 때문에 수용될 수 있는 저 명제들은 이 배열의 3-차원적 하부-공간을 형성한다. d = 3에서 d = 2로의 천이는, 입체로부터 표면으로의 천이에 해당한다. 차원 d가 작아질수록, 그 명제들의 내용과 관계없이 그 명제들이 지닌 낮은 합성도 때문에 이론을 부정할 수 없는 저 허용된 명제들의 집합은 더욱 엄격하게 제한된다; 그리고 이론에 대한 오류판정 가능성의 등급은 더욱 높아질 것이다.
적용의 장(場: field)이라는 개념은 기초명제들에 국한되지 않았고, 모든 종류의 단칭명제들은 적용의 장(場: field)에 속하는 명제들이 되도록 허용되었다. 그러나 초기명제들의 차원들을 장(場: field)의 도움을 받아서 비교함에
의하여, 우리는 기초명제들의 합성도를 추산할 수 있다. (우리는, 고도로 합성적인 기초명제들이 고도로 합성적인 단칭명제들에 상응한다고, 추정한다.) 그리하여 더 높은 차원의 이론에 더 높은 차원의 기초명제들의 집합이 상응하여 이 집합의 모든 명제들은, 그 명제들이 주장하는 것과 관계없이, 이론에 의하여 허용된다고 추정될 수 있다.
이것은 시험가능성 등급을 비교하는 두 가지 방법들이 – 이론의 차원을 통한 방법과 부분집합 관계를 통한 방법 - 어떻게 관련되는지의 문제에 답한다. 두 가지 방법들 중 어느 것도 적용될 수 없거나 오직 한 가지만 적용될 수 있는 경우들이 있을 것이다. 그런 경우들에는 물론 두 가지 방법들 사이에는 갈등의 여지가 없다. 그러나 특정 경우에 두 가지 방법들 모두가 적용될 수 있다면 동등한 차원들의 두 가지 이론들이 부분집합 관계에 근거한 방법에 의하여 평가된다는 조건으로 여전히 다양한 오류판정 가능성의 등급들을 지닐 일이 상상컨대 발생할 것이다. 그런 경우들에서, 후자(後者) 방법의 판결이 수용되어야 하는데 왜냐하면 그 방법이 더 민감한 방법으로 판명될 터이기 때문이다. 두 가지 방법들 모두가 적용될 수 있는 모든 다른 경우들에서 두 가지 방법들은 틀림없이 동일한 결과를 낳는다; 이유인즉 차원론의 단순한 정리(定理)의 도움을 받아서 한 집합의 차원이 그 집합의 부분집합들의 차원보다 틀림없이 크거나 동등하다는 것이 밝혀질 수 있기 때문이다.
39 곡선들의 집합의 차원
때때로 우리는 내가 이론의 ‘적용의 장(場: field)’이라고 지칭한 것을 ‘자체의 도표적 재현의 장(場:field), 다시 말해서 우리가 그래프들에 의하여 이론을 재현하는 그래프-용지의 영역과 전적으로 간단하게 동일시할 수 있다: 도표적 재현으로 된 이 장(場: field)의 각 점은 한 가지 상대적으로 원자적인 명제와 일치하는 것으로 간주될 수 있다. 이 장(場: field)에 관한 이론의 차원은 (부록 1에 정의[定義]된) 그렇다면 이론과 일치하는 곡선들 집합의 차원과 동일하다. 나는 이 관계들을 36절의 두 가지 명제 q와 s의 도움을 받아서 토론하겠다. (우리의 차원들 비교는 다양한 술어들을 지닌 명제들에게 적용된다.) 가설 q는 – 모든 행성들의 궤도들은 원이다 – 3차원적이다: 그 가설에 대한 오류판정에 관해서는, 자체의 도표적 재현 4개점들과 대응하여 적어도 장(場: field)에 관한 네 가지 단칭명제들이 필요하다. 모든 행성 궤도들은 타원형이라는 가설은
5차원적인데 이유인즉 그 가설에 대한 오류판정에 관하여 도표의 6개점들과 대응하여 적어도 6 가지 단칭명제들이 필요하기 때문이다. 36절에서 우리는, q가 s보다 더 쉽게 오류로 판정될 수 있다는 것을 알았다: 모든 원들은 타원들이기 때문에, 비교를 부분집합 관계에 근거시키는 것이 가능했다. 그러나 차원들의 사용으로 인하여 우리는, 이전에 우리가 비교할 수 없었던 이론들을 비교할 수 있게 된다. 예를 들어, 이제 우리는 원-가설을 포물선-가설과 (4차원적인) 비교할 수 있다. ‘원’, ‘타원’, ‘포물선’이라는 단어들 각각은 곡선들의 부류나 집합을 나타낸다; 그리고 이 집합들의 각각에는, d 점들이 집합의 한 가지 특정 곡선을 선택하거나 규정하기에 필요하고 충분하다면, 차원 d가 있다. 대수적 표현으로, 곡선 집합의 차원은 그 값들을 우리가 자유롭게 선택할 한도들의 숫자에 달려있다. 그러므로 우리는, 이론이 재현되는 곡선들 집합에서 자유롭게 결정될 수 있는 한도들의 숫자가 저 이론의 오류판정 가능성 (혹은 시험가능성) 등급에 대한 특징이라고 말할 수 있다. 내가 든 보기에서 명제 q 및 s와 관련하여 나는 케플러(Kepler)가 자신의 법칙들을 발견한 것에 관하여 몇 가지 방법론적 논평들을 하고 싶다.*
완벽에 대한 신뢰가 – 케플러(Kepler)가 발견을 하도록 영향을 준 발견 학습적 원리 - 오류판정 가능성의 등급들에 대한 방법론적 고찰들에 의하여 의식적으로나 무의식적으로 고취되었다고 나는 제안하고 싶지 않다. 그러나 나는, 케플러(Kepler) 자신의 성공은 부분적으로 자신이 시작했던 원-가설이 오류로 판정하기가 상대적으로 쉬웠다는 사실 때문이었다고 정말로 믿는다. 자체의 논리적 형태 때문에 원 가설만큼 쉽게 시험될 수 없었던 가설로써 케플러(Kepler)가 시작했었다면, 그 근거가 ‘불확실’한 – 말하자면 공중에서 표류하고 미지의 방향으로 움직이는 – 계측들의 난점들을 고려하면, 그는 어떤 결과도 얻지 못했을 가능성이 높다 (이 문장의 원문은 Had Kepler started with a hypothesis which owing to its logical form was not so easily testable as the circle hypothesis, he might well have got no result at all, considering the difficulties of calculations whose very basis was 'in the air' — adrift in the skies, as it were, and moving in a way unknown.인데 분사구문 considering the difficulties of calculations whose very basis was 'in the air' — adrift in the skies, as it were, and moving in a way unknown의 주어가 케플러가 아니라 일반인이기
때문에 분사구문을 쓸 게 아니라 주어 one이나 people 혹은 we를 넣어서 if we consider the difficulties ~ 등으로 써야 한다: 역자). 케플러(Kepler)가 자신의 원 가설을 오류로 판정함에 의하여 도달한 분명하게 부정적인 결과는 사실상 그의 최초 성공이었다. 그의 방법은 충분하게 증명되어 그는 더 한층 나아갈 수 있었다; 특히 심지어 이 첫 번째 시도가 특정 근사치들을 낳았기 때문에.
의심의 여지없이, 케플러(Kepler)의 법칙은 아마도 또 다른 방식으로 발견되었을 것이다. 그러나 이것이 성공을 낳았던 방식이었다는 것은 단순히 우연이 결코 아니었다고 나는 생각한다. 그것은, 이론이 오류로 판정되기에 충분히 쉽다는 – 관찰 경험과 충돌할 수 있을 정도로 충분히 정확한 – 조건으로만 적용될 수 있는 제거의 방식에 상응한다.
40 곡선들 집합의 차원들의 숫자를 줄이는 두 가지 방법들
완전히 다른 곡선들의 집합들은 동일한 차원을 지닐 것이다. 예를 들어 모든 원들의 집합은 3차원적이다; 그러나 주어진 점을 통과하는 모든 원들의 집합은 2-차원적 집합이다 (직선들의 집합처럼). 원들은 모두 주어진 두 개의 점들을 통과해야 한다고 우리가 요구한다면 우리는 1-차원적 집합과 기타 등등을 얻는다. 한 집합의 모든 곡선들이 하나 더 주어진 점을 통과해야 한다는 각각의 추가적 요구는 집합의 차원들을 하나씩 줄인다.
0차원적 집합들 |
1차원적 집합들 |
2차원적 집합들 |
3차원적 집합들 |
4차원적 집합들 |
- |
- |
직선 |
원 |
포물선 |
- |
하나의 주어진 점을 통과하는 직선 |
하나의 주어진 점을 통과하는 원 |
하나의 주어진 점을 통과하는 포물선
|
하나의 주어진 점을 통과하는 원추곡선 |
두 개의 주어진 점들을 통과하는 직선 |
두 개의 주어진 점들을 통과하는 원 |
두 개의 주어진 점들을 통과하는 포물선 |
두 개의 주어진 점들을 통과하는 원추곡선 |
- |
세 개의 주어진 점들을 통과하는 원 |
세 개의 주어진 점들을 통과하는 포물선 |
세 개의 주어진 점들을 통과하는 원추곡선 |
- |
- |
차원들의 숫자 또한 주어진 점들의 증가하는 숫자라는 방법을 제외한 다른 방법들에 의하여 감소될 수 있다. 예를 들어, 주어진 축들의 비율을 지닌 타원들의 집합은 4-차원적이고 (포물선들의 집합이 그러한 것처럼) 주어진 숫자적 편심(偏心: eccentricity)을 지닌 타원형들의 집합도 그러하다. 타원형으로부터 원으로의 천이는, 물론, 편심(偏心: eccentricity)이나 (편심 0) 특정 축들의 비율을 (통일성) 규명하는 것과 대등하다.
우리가 이론들의 오류판정 가능성의 등급들을 평가하는 데 흥미를 지니고 있기 때문에 우리는 이제, 차원들의 숫자를 감소시키는 다양한 방법들이 우리의 목표들에 대하여 대등한지 혹은 우리가 그 방법들의 상대적인 장점들을 보다 면밀히 조사해야 하는지를 물을 것이다. 이제 곡선은 특정한 개체적인 점(point)을 (혹은 작은 영역) 통과해야 한다는 조항은 흔히 특정 단칭명제의 다시 말해서 초기조건의 수용과 연결되거나 대응할 것이다. 다른 한편으로 가령타원형-가설로부터 원-가설로의 천이는 분명히 이론 자체의 차원을 감소시키는 것에 대응할 것이다. 그러나 차원들을 줄이는 이 두 가지 방법들은 어떻게 구별될 수 있는가? 우리는, 곡선의 ‘형태’나 ‘모양’에 관하여 규정들로써 작동하지 않는 차원들을 축소하는 저 방법에게 ‘구체적 축소(material reduction)’라는 명칭을 부여할 것이다; 다시 말해서, 예를 들어 한 가지 이상의 점(點)들을 구체화함을 통하거나 어떤 대등한 구체화에 의한 축소들에게. 다른 방법은, 그 방법으로 곡선의 형태나 모양이 예를 들어 우리가 타원으로부터 원으로 또는 원으로부터 직선으로, 기타 등등으로 옮겨갈 때처럼 더 좁게 구체화되는 것인데 나는 차원들 숫자의 ‘형식적 축소’ 방법이라고 나는 지칭하겠다.
그러나 이 구분을 분명하게 하는 것은 그다지 쉽지 않다. 이것은 다음과 같이 밝혀질 것이다. 이론의 차원들을 축소하는 것은, 대수적 용어들로, 상수(常數: constant)에 의하여 한도를 대체하는 것을 의미한다. 이제 우리가 어떻게 상수(常數: constant)에 의하여 한도들을 대체하는 다양한 방법들을 구분할 수 있는지는 완벽하게 분명하지 않다. 형식적 축소는, 타원형의 일반적인 방정식으로부터 원의 방정식으로 이행함에 의하여 한 가지 한도를 0과 등치하고 두 번째 한도를 1로 등치하는 것으로 기술될 수 있다. 그러나 또 다른 한도가 (절대항: absolute term) 0과 같게 되면, 이것은 구체적 축소(material reduction), 즉 타원형의 한 점의 구체화를 의미할 터이다. 그러나 나는, 우리가 보편적 명칭들이라는 문제에 대한 그 축소의 관련성을 안다면 구분을 분명하게 할 수 있다고 생각한다. 왜냐하면 구체적 축소는 개체적 명칭을, 형식적 축소는 보편적 명칭을 관련된 곡선의 집합에 대한 정의(定義)에 도입하기 때문이다 (이 문장의 원문은 For material reduction introduces an individual name, formal reduction a universal name, into the definition of the relevant set of curves.인데 formal reduction 앞에 접속사 and가 누락된 듯하다: 역자).
혹시 ‘실물 지시적 정의(實物 指示的 定義: ostensive definition)’에 의하여 우리에게 특정 개체적 평면이 주어진다고 상상하자. 이 평면 안에 있는 모든 타원형들의 집합은 타원형의 일반적인 방정식으로써 정의(定義)될 수 있다; 원들의 집합은 원의 일반적인 방정식에 의하여 정의(定義)될 수 있다. 이 정의(定義)들은 평면 안에서 그 정의(定義)들이 관련되는 (데카르트적) 좌표들을 우리가 그리는 곳과 독립적이다; 결과적으로 그 정의(定義)들은 좌표들의 기원 선택 및 지향 선택과 독립적이다. 좌표들의 구체적 체계는 개체적 명칭들에 의해서만 결정될 수 있다; 가령, 실물 지시적 정의(實物 指示的)으로 그 체계의 기원과 지향을 구체화함에 의하여. 타원형들의 (원들의) 집합에 대한 정의(定義)는 모든 데카르트적 좌표들에 대해서도 동일하기 때문에, 이 개체적 명칭들의 구체화와 독립적이다: 그 정의(定義)는 유클리드군(群)의 모든 좌표적 변형들과 (변위[變位: displacements]들과 유사성 변형들) 관련하여 불변이다.
다른 한편으로 우리가, 구체적이고 개체적인 평면의 점을 공유하는 타원형들의 (혹은 원들의) 집합을 정의(定義)하고 싶다면 유클리드군(群)의 변형들과 관련하여 불변이지만 단칭적인, 다시 말해서 개체적이거나 실물 지시적으로 구체화한 좌표 체계와 관련되는 방정식을 이용하여 우리는 조작해야 한다. 이것은 개체적 명칭들과 관련된다.
변형들은 위계질서로 배열될 수 있다. 보다 일반적인 변형들의 무리와 관련하여 불변인 정의(定義)는 보다 특별한 변형들에 관해서도 또한 불변이다. 곡선들의 집합에 대한 각각의 정의(定義)에 관하여 그 정의(定義)에 특징적인 한 가지 – 가장 일반적인 – 변형 무리가 있다. 이제 우리는 다음과 같이 말할 수 있다: 곡선들의 집합에 대한 정의(定義) D1은 D2와 동일한 변형 무리와 (혹은 보다 일반적인 변형 무리) 관련하여 불변이라면 곡선들의 집합에 대한 정의(定義) D2에게 ‘동등하게 일반적’이라고 (또는 곡선들의 집합에 대한 정의[定義] D2보다 더 일반적이라고) 지칭된다. 곡선들 집합의 차원 축소는 이제, 그 축소가 정의(定義)의 일반성을 축소하지 않는다면 형식적이라고 지칭될 것이다; 그렇지 않으면 그 축소는 구체적으로 지칭될 것이다.
두 가지 이론들의 차원들을 고려함에 의하여 우리가 두 가지 이론들의 오류판정 가능성의 등급을 비교한다면, 우리는 분명히 그 이론들의 차원들과 함께 그 이론들의 일반성, 다시 말해서 좌표적 변형들과 관련한 그 이론들의 불변성을 고려해야 할 것이다.
이 절차는 물론, 케플러(Kepler)의 이론과 같은 이론이 사실상 세상에 관하여 기하학적 서술을 하는지 혹은 그 이론이 도표에 – 예를 들어, 온도에 대한 압력의 의존을 재현하는 도표와 같은 – 의하여 재현될 것이라는 이유만으로 ‘기하학적’인지에 따라서 틀림없이 달라질 것이다. 이 후자(後者) 종류의 이론에게, 혹은 상응하는 곡선들의 집합에게 자체의 정의(定義)가 가령 좌표 체계의 교체들(rotations)과 관련하여 불변적이어야 한다고 요구하는 것은 부적합할 터이다; 이유인즉 이 경우들에서, 다양한 좌표들이 전혀 다른 것들을 (하나는 압력을 그리고 나머지 하나는 온도를) 재현할 것이기 때문이다.
이로 인하여, 오류판정 가능성의 등급들이 비교될 수 있는 방법들에 대한 나의 설명이 끝난다. 이 방법들은 우리의 다음 관심사가 될 단순성이라는 문제와 같은 인식론적 문제들을 우리가 설명하는 데 도움을 줄 수 있다고 나는 믿는다. 그러나 우리가 알게 될 것처럼, 오류판정 가능성의 등급들에 대한 우리의 검토에 의하여 새롭게 조명되는 위치에 놓일 다른 문제들이 있다; 특히 소위 ‘가설들의 확률’이나 입증에 대한 문제.
추가사항, 1972년
이 저서의 더 중요한 개념들 중 한 가지 개념은 이론이 지닌 (경험적, 즉 정보적) 내용이라는 개념이다. (‘괜히 우리가 자연법칙들을 “법칙들”이라고 부르지 않는다: 자연법칙들은 더 많이 금지할수록 자연법칙들은 더 많이 말한다.’ 위 18-19쪽 및 95쪽 이하와 비교하라.)
두 가지 요점들은 앞 장에서 나에 의하여 강조되었다: (1) 이론이 지닌 내용이나 시험가능성은 (혹은 단순성: vii장 참조) 등급들을 지닐 것인데 그것은 그리하여 오류판정 가능성이라는 (그 논리적 근거는 후건부정식[modus tollens]으로 남는다) 개념을 상대화한다고 언급될 것이다. (2) 과학의 목표는 – 지식의 성장 – 우리의 이론들이 지닌 내용의 성장과 일치될 수 있다. (나의 논문 ‘과학의 목표[The Aim of Science]’, Ratio I권, 1957년, 24-35쪽과 (수정된) 현대철학[Contemporary Philosophy], R. 클리반스키[Klibansky] 편집, 1957년, 129-142쪽 참조; 지금은 나의 저서 객관적 지식: 진화적 접근[Objective Knowledge: An Evolutionary Approach]의 5장을 또한 참고하는데 그 저서는 클래렌든[Clarendon] 출판사에서 곧 출판예정임.)
보다 최근에는 내가 이 개념들을 추가적으로 전개했다; 나의 저서 추측과 논박(Conjectures and Refutations), 1963년의 1장과 후기 판본들을 (새 부록들이 추가된) 특히 참조하라. 새로운 요점들 중 두 가지는: (3) 토론되고 있는 문제나 문제들의 집합과 관련하여 내용이나 시험가능성에 대한 추가적 상대화. (1934년에 이미 나는 적용의 장[場: field]과 관련하여 이 개념들을 상대화했다; 나의 옛 부록 i 참조.) (4) 이론이 지닌 진리 내용이라는 그리고 이론이 지닌 진리에 대한 근사치나 근접이라는 (‘박진성[迫眞性: verisimilitude]) 개념의 도입.
6
DEGREES OF TESTABILITY
Theories may be more, or less, severely testable; that is to say, more, or less, easily falsifiable. The degree of their testability is of significance for the selection of theories.
In this chapter, I shall compare the various degrees of testability or falsifiability of theories through comparing the classes of their potential falsifiers. This investigation is quite independent of the question whether or not it is possible to distinguish in an absolute sense between falsifiable and non-falsifiable theories. Indeed one might say of the present chapter that it 'relativizes' the requirement of
falsifiability by showing falsifiability to be a matter of degree.
31 A PROGRAMME AND AN ILLUSTRATION
A theory is falsifiable, as we saw in section 23 , if there exists at least one
non-empty class of homotypic basic statements which are forbidden by it; that is, if the class of its potential falsifiers is not empty. If, as in section 2 3 , we represent the class of all possible basic statements by a circular area, and the possible events by the radii of the circle, then we can say: At least one radius — or perhaps better, one narrow sector whose width may represent the fact that the event is to be 'observable' — must be incompatible with the theory and ruled out by it. one might then
SOME STRUCTURALCOMPONENTS OF A THEORY OF EXPERIENCE
represent the potential falsifiers of various theories by sectors of various widths. And according to the greater and lesser width of the sectors ruled out by them, theories might then be said to have more, or fewer, potential falsifiers. (The question whether this 'more' or 'fewer' could be made at all precise will be left open for the moment.) It might then be said, further, that if the class of potential falsifiers of one theory is 'larger' than that of another, there will be more
opportunities for the first theory to be refuted by experience; thus compared with the second theory, the first theory may be said to be 'falsifiable in a higher degree'. This also means that the first theory says more about the world of experience than the second theory, for it rules out a larger class of basic statements. Although the class of permitted statements will thereby become smaller, this does not affect our argument; for we have seen that the theory does not assert anything about this class. Thus it can be said that the amount of empirical information conveyed by a theory, or its empirical content, increases with its degree of falsifiability.
Let us now imagine that we are given a theory, and that the sector representing the basic statements which it forbids becomes wider and wider. Ultimately the basic statements not forbidden by the theory will be represented by a narrow remaining sector. (If the theory is to be consistent, then some such sector must remain.) A theory like this would obviously be very easy to falsify, since it allows the empirical world only a narrow range of possibilities; for it rules out almost all conceivable, i.e. logically possible, events. It asserts so much about the world of experience, its empirical content is so great, that there is, as it
were, little chance for it to escape falsification.
Now theoretical science aims, precisely, at obtaining theories which are easily falsifiable in this sense. It aims at restricting the range of permitted events to a minimum; and, if this can be done at all, to such a degree that any further restriction would lead to an actual empirical falsification of the theory. If we could be successful in obtaining a theory such as this, then this theory would describe 'our particular world' as precisely as a theory can; for it would single out the world of 'our experience' from the class of all logically possible worlds of experience with the greatest precision attainable by theoretical science. All the events or classes of occurrences which we
DECREES OF TESTABILITY
actually encounter and observe, and only these, would be characterized
as 'permitted'.* 1
32 HOW ARE CLASSES OF POTENTIAL FALSIFIERS TO BE COMPARED?
The classes of potential falsifiers are infinite classes. The intuitive 'more' and 'fewer' which can be applied without special safeguards to finite classes cannot similarly be applied to infinite classes.
We cannot easily get round this difficulty; not even if, instead of the forbidden basic statements or occurrences, we consider, for the purpose of comparison, classes of forbidden events, in order to ascertain which of them contains 'more' forbidden events. For the number of events forbidden by an empirical theory is also infinite, as may be seen from the fact that the conjunction of a forbidden event with any other event (whether forbidden or not) is again a forbidden event.
I shall consider three ways of giving a precise meaning, even in the case of infinite classes, to the intuitive 'more' or 'fewer,' in order to find out whether any of them may be used for the purpose of comparing classes of forbidden events.
(1) The concept of the cardinality (or power) of a class. This concept cannot help us to solve our problem, since it can easily be shown that the classes of potential falsifiers have the same cardinal number for all theories. 1
(2) The concept of dimension. The vague intuitive idea that a cube in some way contains more points than, say, a straight line can be clearly formulated in logically unexceptionable terms by the set-theoretical concept of dimension. This distinguishes classes or sets of points according to the wealth of the 'neighbourhood relations' between their elements: sets of higher dimension have more abundant neighbourhood relations. The concept of dimension which allows us to compare
*1 For further remarks concerning the aims of science, see appendix *x, and section * 1 5 of the Postscript, and my paper 'The Aim of Science', Ratio 1, 1957, pp. 24—35.
1 Tarski has proved that under certain assumptions every class of statements is denumerable (cf. Monatshefte f. Mathem. u. Physik 40, 1933, p. 100, note 10). *The concept of measure is inapplicable for similar reasons (i.e. because the set of all statements of a language is denumerable) .
SOME STRUCTURALCOMPONENTS OF A THEORY OF EXPERIENCE
classes of 'higher' and 'lower' dimension, will be used here to tackle the problem of comparing degrees of testability. This is possible because basic statements, combined by conjunction with other basic statements, again yield basic statements which, however, are 'more highly composite' than their components; and this degree of com- position of basic statements may be linked with the concept of dimen- sion. However, it is not the compositions of the forbidden events but that of the permitted ones which will have to be used. The reason is that the events forbidden by a theory can be of any degree of composition; on the other hand, some of the permitted statements are permitted merely because of their form or, more precisely, because their degree of composition is too low to enable them to contradict the theory in question; and this fact can be used for comparing dimensions.*1
(3) The subclass relation. Let all elements of a class a be also elements of a class β, so that a is a subclass of β (in symbols: a ⊂ β). Then either all elements of β are in their turn also elements of a — in which case the two classes are said to have the same extension, or to be identical — or there are elements of β which do not belong to a. In the latter case the elements of β which do not belong to a form 'the difference class' or the complement of a with respect to β, and a is a proper subclass of β. The subclass relation corresponds very well to the intuitive 'more' and 'fewer', but it suffers from the disadvantage that this relation can only
be used to compare the two classes if one includes the other. If therefore two classes of potential falsifiers intersect, without one being included in the other, or if they have no common elements, then the degree of falsifiability of the corresponding theories cannot be com-pared with the help of the subclass relation: they are non-comparable with respect to this relation.
*1 The German term 'komplex' has been translated here and in similar passages by 'composite' rather than by 'complex'. The reason is that it does not denote, as does the English 'complex', the opposite of 'simple'. The opposite of 'simple' ('einfach') is denoted, rather, by the German 'kompliziert'. (Cf. the first paragraph of section 41 where 'kompliziert' is translated by 'complex'.) In view of the fact that degree of simplicity is one of the major topics of this book, it would have been misleading to speak here (and in section 38) of degree of complexity. I therefore decided to use the term 'degree of composition' which seems to fit the
context very well.
DECREES OF TESTABILITY
33 DEGREES OF FALSIFIABILITY COMPARED BY MEANS OF THE SUBCLASS RELATION
The following definitions are introduced provisionally, to be improved later in the course of our discussion of the dimensions of theories.*1
(1) A statement x is said to be 'falsifiable in a higher degree' or 'better testable' than a statement y, or in symbols: Fsb(x) > Fsb(y), if and only if the class of potential falsifiers of x includes the class of the potential falsifiers of y as a proper subclass.
(2) If the classes of potential falsifiers of the two statements x and y are identical, then they have the same degree of falsifiability, i.e. Fsb(x) =Fsb(y).
(3) If neither of the classes of potential falsifiers of the two statements includes the other as a proper subclass, then the two statements have non-comparable degrees of falsifiability (Fsb(x) | | Fsb(y)).
If (1) applies, there will always be a non-empty complement class. In the case of universal statements, this complement class must be infinite. It is not possible, therefore, for the two (strictly universal) theories to differ in that one of them forbids a finite number of single occurrences permitted by the other.
The classes of potential falsifiers of all tautological and metaphysical statements are empty. In accordance with (2) they are, therefore, identical. (For empty classes are subclasses of all classes, and hence also of empty classes, so that all empty classes are identical; which may be expressed by saying that there exists only one empty class.) If we denote an empirical statement by ‘e’, and a tautology or a metaphysical statement (e.g. a purely existential statement) by ‘t’ or 'm' respectively, then we may ascribe to tautological and metaphysical statements a zero degree of falsifiability and we can write: Fsb(t) = Fsb(m) = 0, and Fsb(e) > 0.
A self-contradictory statement (which we may denote by ‘c’) may be said to have the class of all logically possible basic statements as its class of potential falsifiers. This means that any statements whatsoever is comparable with a self-contradictory statement as to its degree of
*1 See section 38, and the appendices i, *vii, and *viii.
100 SOME STRUCTURAL COMPONENTS OF A THEORY OF EXPERIENCE
falsifiability. We have Fsb(c) > Fsb(e) > 0.* 2 If we arbitrarily put Fsb(c) = 1, i.e. arbitrarily assign the number 1 to the degree of falsifiability of a self-contradictory statement, then we may even define an empirical statement e by the condition 1 > Fsb(e) > 0. In accordance with this formula, Fsb(e) always falls within the interval between 0 and 1, excluding these limits, i.e. within the 'open interval' bounded by
these numbers. By excluding contradiction and tautology (as well as metaphysical statements) the formula expresses at the same time both the requirement of consistency and that of falsifiability.
34 THE STRUCTURE OF THE SUBCLASS RELATION. LOGICAL PROBABILITY
We have defined the comparison of the degree of falsifiability of two statements with the help of the subclass relation; it therefore shares all the structural properties of the latter. The question of comparability can be elucidated with the help of a diagram (fig. 1), in which certain subclass relations are depicted on the left, and the corresponding
Figure 1
* 2 See however now appendix *vii.
DECREES OF TESTABILITY 1
testability relations on the right. The Arabic numerals on the right correspond to the Roman numerals on the left in such a way that a given Roman numeral denotes the class of the potential falsifiers of that statement which is denoted by the corresponding Arabic numeral. The arrows in the diagram showing the degrees of testability run from the better testable or better falsifiable statements to those which are not so well testable. (They therefore correspond fairly precisely to
derivability-arrows; see section 35.)
It will be seen from the diagram that various sequences of subclasses can be distinguished and traced, for example the sequence I— II— IV or I— III— V, and that these could be made more 'dense' by introducing new intermediate classes. All these sequences begin in this particular case with 1 and end with the empty class, since the latter is included in every class. (The empty class cannot be depicted in our diagram on the left, just because it is a subclass of every class and would therefore have to appear, so to speak, everywhere.) If we choose to identify class 1 with the class of all possible basic statements, then 1 becomes the
contradiction (c) ; and (corresponding to the empty class) may then denote the tautology (t). It is possible to pass from 1 to the empty class, or from (c) to (t) by various paths; some of these, as can be seen from the right hand diagram, may cross one another. We may therefore say that the structure of the relation is that of a lattice (a 'lattice of sequences' ordered by the arrow, or the subclass relation). There are nodal points (e.g. statements 4 and 5) in which the lattice is partially connected. The relation is totally connected only in the universal class and in the empty class, corresponding to the contradiction c and tautology t.
Is it possible to arrange the degrees of falsifiability of various statements on one scale, i.e. to correlate, with the various statements, numbers which order them according to their falsifiability? Clearly, we cannot possibly order all statements in this way;* 1 for if we did, we
*1 I still believe that the attempt to make all statements comparable by introducing a metric must contain an arbitrary, extra-logical element. This is quite obvious in the case of statements such as 'All adult men are more than two feet high' (or 'All adult men are less than nine feet high'); that is to say, statements with predicates stating a measurable property. For it can be shown that the metric of content or falsifiability would have to be a function of the metric of the predicate; and the latter must always contain an arbitrary,
SOME STRUCTURAL COMPONENTS OF A THEORY OF EXPERIENCE
should be arbitrarily making the non-comparable statements comparable. There is, however, nothing to prevent us from picking out one of the sequences from the lattice, and indicating the order of its statements by numbers. In so doing we should have to proceed in such a way that a statement which lies nearer to the contradiction c is always given a higher number than one which lies nearer to the tautology t. Since we have already assigned the numbers and 1 to tautology and
contradiction respectively, we should have to assign proper fractions to the
empirical statements of the selected sequence.
I do not really intend, however, to single out one of the sequences. Also, the assignment of numbers to the statements of the sequence would be entirely arbitrary. Nevertheless, the fact that it is possible to assign such fractions is of great interest, especially because of the light it throws upon the connection between degree of falsifiability and the idea of probability. Whenever we can compare the degrees of falsifiability of two statements, we can say that the one which is the less falsifiable is also the more probable, by virtue of its logical form. This probability I call* 2 'logical probability'; 1 it must not be confused with that numerical probability which is employed in the theory of games of chance, and
in statistics. The logical probability of a statement is complementary to its degree
of falsifiability: it increases with decreasing degree of falsifiability. The logical probability 1 corresponds to the degree 0 of falsifiability, and vice
or at any rate an extra-logical element. Of course, we may construct artificial languages for which we lay down a metric. But the resulting measure will not be purely logical, however 'obvious' the measure may appear as long as only discrete, qualitative yes-or-no predicates (as opposed to quantitative, measurable ones) are admitted. See also appendix *ix, the Second and Third Notes.
*2 1 now (since 1938; cf. appendix *ii) use the term 'absolute logical probability' rather than 'logical probability' in order to distinguish it from 'relative logical probability' (or 'conditional logical probability'). See also appendices *iv, and *vii to *ix. 1 To this idea of logical probability (inverted testability) corresponds Bolzano's idea of validity, especially when he applies it to the comparison of statements. For example, he describes the major propositions in a derivability relation as the statements of lesser validity, the consequents as those of greater validity (Wissenschaftslehre, 1837, Vol. II, § 1 5 7 , No. 1 ). The relation of his concept of validity to that of probability is explained by Bolzano in op. cit. §147. Cf. also Keynes, A Treatise on Probability, 1 921 , p. 224. The examples there given show that my comparison of logical probabilities is identical with Keynes's
'comparison of the probability which we ascribe a priori to a generalization'. See also notes 1 to section 3 6 and 1 to section 8 3 .
DECREES OF TESTABILITY 1
versa. The better testable statement, i.e. the one with the higher degree
of falsifiability, is the one which is logically less probable; and the
statement which is less well testable is the one which is logically more
probable.
As will be shown in section 72, numerical probability can be linked with logical probability, and thus with degree of falsifiability. It is possible to interpret numerical probability as applying to a subsequence (picked out from the logical probability relation) for which a system of measurement can be defined, on the basis of frequency estimates.
These observations on the comparison of degrees of falsifiability do not hold only for universal statements, or for systems of theories; they can be extended so as to apply to singular statements. Thus they hold, for example, for theories in conjunction with initial conditions. In this case the class of potential falsifiers must not be mistaken for a class of events — for a class of homotypic basic statements — since it is a class of occurrences. (This remark has some bearing on the connection between logical and numerical probability which will be analysed in
section 72.)
35 EMPIRICAL CONTENT, ENTAILMENT, AND DEGREES OF FALSIFIABILITY
It was said in section 3 1 that what I call the empirical content of a statement increases with its degree of falsifiability: the more a statement forbids, the more it says about the world of experience. (Cf. section 6.) What I call 'empirical content' is closely related to, but not identical with, the concept 'content' as defined, for instance, by Carnap. 1 For the latter I will use the term 'logical content', to distinguish it from that of empirical content.
I define the empirical content of a statement p as the class of its potential
falsifiers (cf. section 31). The logical content is defined, with the help of the concept of derivability, as the class of all non-tautological statements which are derivable from the statement in question. (It may be called its 'consequence class'.) So the logical content of p is at least equal to (i.e. greater than or equal to) that of a statement q, if q is derivable
1 Carnap, Erkenntnis 2, 1932, p. 458.
SOME STRUCTURALCOMPONENTS OF A THEORY OF EXPERIENCE
from p (or, in symbols, if 'p — > q'* 1 ). If the derivability is mutual (in symbols, 'p <-> q') then p and q are said to be of equal content. 2 If q is derivable from p, but not p from q, then the consequence class of q must be a proper sub-set of the consequence class of p; and p then possesses the larger consequence class, and thereby the greater logical content (or logical force*2 ).
It is a consequence of my definition of empirical content that the comparison of the logical and of the empirical contents of two statements p and q leads to the same result if the statements compared contain no metaphysical elements. We shall therefore require the following: (a) two statements of equal logical content must also have equal empirical content; (b) a statement p whose logical content is greater than that of a statement q must also have greater empirical content, or at least equal empirical content; and finally, (c) if the empirical content of a statement p is greater than that of a statement q, then the logical content must be greater or else non-comparable. The qualification in (b) 'or at least equal empirical content' had to be added because p might be, for example, a conjunction of q with some purely existential statement, or with some other kind of metaphysical statement to which we must ascribe a certain logical content; for in this case the empirical content of p will not be greater than that of q. Corresponding considerations make it necessary to add to (c) the qualification 'or else non-comparable'.*3
In comparing degrees of testability or of empirical content we shall therefore as a rule — i.e. in the case of purely empirical statements — arrive at the same results as in comparing logical content, or derivability-relations. Thus it will be possible to base the comparison
*1 'p — > q' means, according to this explanation, that the conditional statement with the antecedent p and the consequent q is tautological, or logically true. (At the time of writing the text, I was not clear on this point; nor did I understand the significance of the fact that an assertion about deducibility was a meta-linguistic one. See also note *1 to section 18, above.) Thus 'p — > q' may be read here: 'p entails q'.
2 Carnap, op. cit. , says: "The metalogical term "equal in content" is defined as "mutually derivable".' Carnap's Loqische Syntax der Sprache, 1934, and his Die Aufqabe der Wissenschaftslogik, 1934, were published too late to be considered here.
*2 If the logical content of p exceeds that of q, then we say also that p is logically stronger than q, or that its logical force exceeds that of q.
*3 See, again, appendix *vii.
DECREES OF TESTABILITY 1
of degrees of falsifiability to a large extent upon derivability relations. Both relations show the form of lattices which are totally connected in the self-contradiction and in the tautology (cf. section 34). This may be expressed by saying that a self-contradiction entails every statement and that a tautology is entailed by every statement. Moreover, empirical statements, as we have seen, can be characterized as those whose degree of falsifiability falls into the open interval which is bounded by the degrees of falsifiability of self-contradictions on the one side, and of tautologies on the other. Similarly, synthetic statements in general
(including those which are non-empirical) are placed, by the entailment relation, in the open interval between self-contradiction and tautology.
To the positivist thesis that all non-empirical (metaphysical) statements are 'meaningless' there would thus correspond the thesis that my distinction between empirical and synthetic statements, or between empirical and logical content, is superfluous; for all synthetic statements would have to be empirical — all that are genuine, that is, and not mere pseudo-statements. But this way of using words,
though feasible, seems to me more likely to confuse the issue than
to clarify it.
Thus I regard the comparison of the empirical content of two statements as equivalent to the comparison of their degrees of falsifiability. This makes our methodological rule that those theories should be given preference which can be most severely tested (cf. the anti-conventionalist rules in section 20) equivalent to a rule favouring theories with the highest possible empirical content.
36 LEVELS OF UNIVERSALITY AND DEGREES OF PRECISION
There are other methodological demands which may be reduced to the demand for the highest possible empirical content. Two of these are outstanding: the demand for the highest attainable level (or degree) of universality, and the demand for the highest attainable degree of precision.
With this in mind we may examine the following conceivable
natural laws:
p: All heavenly bodies which move in closed
orbits move in circles: or more briefly:
All orbits of heavenly bodies are circles.
q: All orbits of planets are circles.
r: All orbits of heavenly bodies are ellipses.
s: All orbits of planets are ellipses.
The deducibility relations holding between these four statements are shown by the arrows in our diagram. From p all the others follow; from q follows s, which also follows from r; so that s follows from all the others.
Moving from p to q the degree of universality decreases; and q says less than p because the orbits of planets form a proper subclass of the orbits of heavenly bodies. Consequently p is more easily falsified than q: if q is falsified, so is p, but not vice versa. Moving from p to r, the degree of precision (of the predicate) decreases: circles are a proper subclass of ellipses; and if r is falsified, so is p, but not vice versa. Corresponding remarks apply to the other moves: moving from p to s, the degree of both universality and precision decreases; from q to s precision decreases; and from r to s, universality. To a higher degree of universality or precision corresponds a greater (logical or) empirical content, and thus a higher degree of testability.
Both universal and singular statements can be written in the form of a 'universal conditional statement' (or a 'general implication' as it is often called) . If we put our four laws in this form, then we can perhaps see more easily and accurately how the degrees of universality and the degrees of precision of two statements may be compared.
A universal conditional statement (cf. note 6 to section 1 4) may be written in the form: ' (x) (φx — > fx) ' or in words: 'All values of x which satisfy the statement function φx also satisfy the statement function fx.' The statement s from our diagram yields the following example: ' (x) (x is an orbit of a planet — > x is an ellipse) ' which means: 'Whatever x may be, if x is an orbit of a planet then x is an ellipse.' Let p and q be two statements written in this 'normal' form; then we can say that p is of greater universality than q if the antecedent statement function of p (which may be denoted by 'φpx') is tautologically implied by (or logically deducible from), but not equivalent to, the corresponding
DECREES OF TESTABILITY
statement function of q (which may be denoted by 'φqx'); or in other words, if '(x) (φqx — > φpx)' is tautological (or logically true). Similarly we shall say that p has greater precision than q if ' (x) (fpx — > fpx) ' is tautological, that is if the predicate (or the consequent statement function) of p is narrower than that of q, which means that the predicate of p entails that of q.*1
This definition may be extended to statement functions with more than one variable. Elementary logical transformations lead from it to the derivability relations which we have asserted, and which may be expressed by the following rule: 1 If of two statements both their universality and their precision are comparable, then the less universal or less precise is derivable from the more universal or more precise; unless, of course, the one is more universal and the other more precise (as in the case of q and r in my diagram).2
We could now say that our methodological decision — sometimes metaphysically interpreted as the principle of causality — is to leave nothing unexplained, i.e. always to try to deduce statements from others of higher universality. This decision is derived from the demand for the highest attainable degree of universality and precision, and it can be reduced to the demand, or rule, that preference should be given to those theories which can be most severely tested.* 2
*1 It will be seen that in the present section (in contrast to sections 18 and 35), the arrow is used to express a conditional rather than the entailment relation; cf. also note *1 to section 18.
1 We can write: [(^ q x — > tj)^).(jji — > f q x)] — > [(^pX — > f p x) — > (^x) — > f q x)] or for short: [(^ — > ^p)-(f p — > f q J — > (p - > q). *The elementary character of this formula, asserted in the text, becomes clear if we write: '[(a — > b).(c — > d)] — > [(b — > c) — > (a — > d)]\ We then put, in accordance with the text, 'p' for 'b — > c' and 'q' for 'a — > d', etc.
2 What I call higher universality in a statement corresponds roughly to what classical logic might call the greater 'extension of the subject'; and what I call greater precision corresponds to the smaller extension, or the 'restriction of the predicate'. The rule concerning the derivability relation, which we have just discussed, can be regarded as clarifying and combining the classical 'dictum de omni et nullo' and the 'nota-notae' principle, the 'fundamental principle of mediate predication'. Cf. Bolzano, Wissenschaftslehre II, 1837, §263, Nos. 1 and 4; Kiilpe, Voriesungen iiber Logik (edited by Selz, 1923), §34, 5, and 7.
* 2 See now also section *1 5 and chapter *iv of my Postscript, especially section *76, text to note 5.
SOME STRUCTURAL COMPONENTS OF A THEORY OF EXPERIENCE
37 LOGICAL RANGES. NOTES on THE THEORY OF MEASUREMENT
If a statement p is more easy to falsify than a statement q, because it is of a higher level of universality or precision, then the class of the basic statements permitted by p is a proper subclass of the class of the basic statements permitted by q. The subclass-relationship holding between classes of permitted statements is the opposite of that holding between classes of forbidden statements (potential falsifiers) : the two relationships may be said to be inverse (or perhaps complementary). The class of basic statements permitted by a statement may be called its 'range'. 1 The 'range' which a statement allows to reality is, as it were, the amount of 'free play' (or the degree of freedom) which it allows to reality. Range and empirical content (cf. section 35) are converse (or complementary) concepts. Accordingly, the ranges of two statements are related to each other in the same way as are their logical probabilities (cf. sections 34 and 72).
I have introduced the concept of range because it helps us to handle certain questions connected with degree of precision in measurement. Assume that the consequences of two theories differ so little in all fields of application that the very small differences between the calculated observable events cannot be detected, owing to the fact that the degree of precision attainable in our measurements is not sufficiently high. It will then be impossible to decide by experiment between the two theories, without first improving our technique of measurement.*1 This shows that the prevailing technique of measurement determines a certain range — a region within which discrepancies between the
observations are permitted by the theory.
Thus the rule that theories should have the highest attainable degree of testability (and thus allow only the narrowest range) entails the
1 The concept of range (Spielraum) was introduced by von Kries (1886); similar ideas are found in Bolzano. Waismann (Erkenntnis 1, 1930, pp. 228 ff.) attempts to combine the theory of range with the frequency theory; cf. section 72. *Keynes gives (Treatise, p. 88) 'field' as a translation of 'Spielraum', here translated as 'range'; he also uses (p.224) 'scope' for what in my view amounts to precisely the same thing.
*1 This is a point which, I believe, was wrongly interpreted by Duhem. See his Aim and Structure of Physical Theory, pp. 1 3 7 ff.
DECREES OF TESTABILITY
demand that the degree of precision in measurement should be raised as much as possible.
It is often said that all measurement consists in the determination of coincidences of points. But any such determination can only be correct within limits. There are no coincidences of points in a strict sense.*2 Two physical 'points' — a mark, say, on the measuring -rod, and another on a body to be measured — can at best be brought into close proximity; they cannot coincide, that is, coalesce into one point. However trite this remark might be in another context, it is important for the question of precision in measurement. For it reminds us that measurement should be described in the following terms. We find that the point of the body to be measured lies between two gradations or marks on the measuring-rod or, say, that the pointer of our measuring apparatus lies
between two gradations on the scale. We can then either regard these gradations or marks as our two optimal limits of error, or proceed to estimate the position of (say) the pointer within the interval of the gradations, and so obtain a more accurate result. one may describe this latter case by saying that we take the pointer to lie between two imaginary gradation marks. Thus an interval, a range, always remains. It is the custom of physicists to estimate this interval for every
measurement. (Thus following Millikan they give, for example, the elementary charge of the electron, measured in electrostatic units, as e = 4.774.10-10 , adding that the range of imprecision is ± 0.005.10-10 .) But this raises a problem. What can be the purpose of replacing, as it were, one mark on a scale by two — to wit, the two bounds of the interval — when for each of these two bounds there must
again arise the same question: what are the limits of accuracy for the bounds of the interval?
Giving the bounds of the interval is clearly useless unless these two bounds in turn can be fixed with a degree of precision greatly exceeding what we can hope to attain for the original measurement; fixed, that is, within their own intervals of imprecision which should thus be smaller, by several orders of magnitude, than the interval they determine for the value of the original measurement. In other words,
*2 Note that I am speaking here of measuring, not of counting. (The difference between these two is closely related to that between real numbers and rational numbers.)
SOME STRUCTURAL COMPONENTS OF A THEORY OF EXPERIENCE
the bounds of the interval are not sharp bounds but are really very small intervals, the bounds of which are in their turn still much smaller intervals, and so on. In this way we arrive at the idea of what may be called the 'unsharp bounds' or 'condensation bounds' of the interval.
These considerations do not presuppose the mathematical theory of errors, nor the theory of probability. It is rather the other way round; by analysing the idea of a measuring interval they furnish a background without which the statistical theory of errors makes very little sense. If we measure a magnitude many times, we obtain values which are distributed with different densities over an interval — the interval of precision depending upon the prevailing measuring technique. only if we know what we are seeking — namely the condensation bounds of this interval — can we apply to these values the theory of errors, and determine the bounds of the interval.*3
Now all this sheds some light, I think, on the superiority of methods that employ measurements over purely qualitative methods. It is true that even in the case of qualitative estimates, such as an estimate of the pitch of a musical sound, it may sometimes be possible to give an interval of accuracy for the estimates; but in the absence of measurements, any such interval can be only very vague, since in such cases the concept of condensation bounds cannot be applied. This concept is applicable only where we can speak of orders of magnitude, and therefore only
where methods of measurement are defined. I shall make further use of the concept of condensation bounds of intervals of precision in section 68, in connection with the theory of probability.
38 DEGREES OF TESTABILITY COMPARED BY REFERENCE TO DIMENSIONS
Till now we have discussed the comparison of theories with respect to their degrees of testability only in so far as they can be compared with the help of the subclass-relation. In some cases this method is quite
*3 These considerations are closely connected with, and supported by, some of the results discussed under points 8 ff. of my 'Third Note', reprinted in appendix *ix. See also section *15 of the Postscript for the significance of measurement for the 'depth' of theories.
DECREES OF TESTABILITY 1 1 I
successful in guiding our choice between theories. Thus we may now say that Pauli's exclusion principle, mentioned by way of example in section 20, indeed turns out to be highly satisfactory as an auxiliary hypothesis. For it greatly increases the degree of precision and, with it, the degree of testability, of the older quantum theory (like the corresponding statement of the new quantum theory which asserts that anti-symmetrical states are realized by electrons, and symmetrical ones by uncharged, and by certain multiply charged, particles).
For many purposes, however, comparison by means of the subclass relation does not suffice. Thus Frank, for example, has pointed out that statements of a high level of universality — such as the principle of the conservation of energy in Planck's formulation — are apt to become tautological, and to lose their empirical content, unless the initial conditions can be determined '. . . by few measurements, . . . i.e. by means of a small number of magnitudes characteristic of the state of the system'.1 The question of the number of parameters which have to be ascertained, and to be substituted in the formulae, cannot be elucidated with the help of the sub-class relation, in spite of the fact that it is evidently closely connected with the problem of testability and falsifiability, and their degrees. The fewer the magnitudes which are needed for determining the initial conditions, the less composite*1 will be the basic statements which suffice for the falsification of the theory; for a falsifying basic statement consists of the conjunction of the initial conditions with the negation of the derived prediction (cf. section 28). Thus it may be possible to compare theories as to their degree of testability by ascertaining the minimum degree of composition which a basic statement must have if it is to be able to contradict the theory; provided always that we can find a way to compare basic statements in order to ascertain whether they are more (or less) composite, i.e. compounds of a greater (or a smaller) number of basic statements of a simpler kind. All basic statements, whatever their content, whose degree of composition does not reach the requisite minimum, would be permitted by the theory simply because of their low degree of composition.
1 Cf. Frank, Das Kausalgesetz unci seine Grenzen, 1931, e.g. p. 24.
*1 For the term 'composite', see note *1 to section 32.
112 SOME STRUCTURAL COMPONENTS OF A THEORY OF EXPERIENCE
But any such programme is faced with difficulties. For generally it is not easy to tell, merely by inspecting it, whether a statement is composite, i.e. equivalent to a conjunction of simpler statements. In all statements there occur universal names, and by analysing these one can often break down the statement into conjunctive components. (For example, the statement 'There is a glass of water at the place k' might perhaps be analysed, and broken down into the two statements 'There is a glass containing a fluid at the place k' and 'There is water at the place k'.) There is no hope of finding any natural end to the dissection of statements by this method, especially since we can always introduce new universals defined for the purpose of making a further dissection possible.
With a view to rendering comparable the degrees of composition of all basic statements, it might be suggested that we should choose a certain class of statements as the elementary or atomic ones, 2 from which all other statements could then be obtained by conjunction and other logical operations. If successful, we should have defined in this way an 'absolute zero' of composition, and the composition of any statement could then be expressed, as it were, in absolute
degrees of composition.* 2 But for the reason given above, such a procedure would have to be regarded as highly unsuitable; for it
2 'Elementary propositions' in Wittgenstein, Tractatus Logico-Philosophicus, Proposition 5: 'Propositions are truth-functions of elementary propositions'. 'Atomic propositions' (as opposed to the composite 'molecular propositions') in Whitehead and Russell's Principia Mathematica Vol. I. Introduction to 2nd edition, 1925, pp. xv f. C. K. Ogden translated Wittgenstein's term 'Elementarsatz' as 'elementary proposition', (cf. Tractatus 4.21), while Bertrand Russell in his Preface to the Tractatus, 1922, p. 13, translated it as 'atomic proposition' . The latter term has become more popular.
*2 Absolute degrees of composition would determine, of course, absolute degrees of content, and thus of absolute logical improbability. The programme here indicated of introducing improbability, and thus probability, by singling out a certain class of absolutely atomic statements (earlier sketched, for example, by Wittgenstein) has more recently been elaborated by Carnap in his Logical Foundations of Probability, 1950, in order to construct a theory of induction. See also the remarks on model languages in my Preface to the English Edition, 1958, above, where I allude to the fact that the third model language (Carnap's language system) does not admit measurable properties. (Nor does it in its present form allow the introduction of a temporal or spatial order.)
DECREES OF TESTABILITY 1
would impose serious restrictions upon the free use of scientific language.*3
Yet it is still possible to compare the degrees of composition of basic statements, and thereby also those of other statements. This can be done by selecting arbitrarily a class of relatively atomic statements, which we take as a basis for comparison. Such a class of relatively atomic statements can be defined by means of a generating schema or matrix (for example, 'There is a measuring apparatus for . . . at the place . . ., the pointer of which lies between the gradation marks . . . and . . .'). We can then define as relatively atomic, and thus as equi-composite, the class of all statements obtained from this kind of matrix (or statement function) by the substitution of definite values. The class of these statements, together with all the conjunctions which can be formed from them may be called a 'field'. A conjunction of n different relatively atomic statements of a field may be called an 'n-tuple of the field'; and we can say that the degree of its composition is equal to the number n.
If there exists, for a theory t, a field of singular (but not necessarily basic) statements such that, for some number d, the theory t cannot be falsified by any d-tuple of the field, although it can be falsified by certain d + 1 -tuples, then we call d the characteristic number of the theory with respect to that field. All statements of the field whose degree of composition is less than d, or equal to d, are then compatible with the theory, and permitted by it, irrespective of their content.
Now it is possible to base the comparison of the degree of testability of theories upon this characteristic number d. But in order to avoid inconsistencies which might arise through the use of different fields, it is necessary to use a somewhat narrower concept than that of a field, namely that of a field of application. If a theory t is given, we say that a field is a field of application of the theory t if there exists a characteristic number d of the theory t with respect to this field, and if, in
*3 The words 'scientific language' were here used quite naively, and should not be interpreted in the technical sense of what is today called a 'language system'. on the contrary, my main point was that we should remember the fact that scientists cannot use a 'language system' since they have constantly to change their language, with every new step they take. 'Matter', or 'atom', after Rutherford, and 'matter', or 'energy', after Einstein, meant something different from what they meant before: the meaning of these concepts is a function of the — constantly changing — theory.
114 SOME STRUCTURAL COMPONENTS OF A THEORY OF EXPERIENCE
addition, it satisfies certain further conditions (which are explained in appendix i). The characteristic number d of a theory t, with respect to a field of application, I call the dimension of t with respect to this field of application. The expression 'dimension' suggests itself because we can think of all possible n-tuples of the field as spatially arranged (in a configuration space of infinite dimensions) . If, for example, d = 3 , then those statements which are admissible because their composition is too low form a three-dimensional sub-space of this configuration. Transition from d = 3 to d = 2 corresponds to the transition from a solid to a surface. The smaller the dimension d, the more severely restricted is the class of those permitted statements which, regardless of their content, cannot contradict the theory owing to their low degree of composition; and the higher will be the degree of falsifiability of the theory.
The concept of the field of application has not been restricted to basic statements, but singular statements of all kinds have been allowed to be statements belonging to a field of application. But by comparing their dimensions with the help of the field, we can estimate the degree of composition of the basic statements. (We assume that to highly composite singular statements there correspond highly composite basic statements.) It thus can be assumed that to a theory of higher dimension, there corresponds a class of basic statements of higher dimension, such that all statements of this class are permitted by the theory, irrespective of what they assert.
This answers the question of how the two methods of comparing degrees of testability are related — the one by means of the dimension of a theory, and the other by means of the subclass relation. There will be cases in which neither, or only one, of the two methods is applicable. In such cases there is of course no room for conflict between the two methods. But if in a particular case both methods are applicable, then it may conceivably happen that two theories of equal dimensions may yet have different degrees of falsifiability if assessed by the method based upon the subclass relation. In such cases, the verdict of the latter
method should be accepted, since it would prove to be the more sensitive method. In all other cases in which both methods are applicable, they must lead to the same result; for it can be shown, with the help of
DECREES OF TESTABILITY 1
a simple theorem of the theory of dimension, that the dimension of a
class must be greater than, or equal to, that of its subclasses.3
39 THE DIMENSION OF A SET OF CURVES
Sometimes we can identify what I have called the 'field of application' of a theory quite simply with the field of its graphic representation, i.e. the area of a graph-paper on which we represent the theory by graphs: each point of this field of graphic representation can be taken to correspond to one relatively atomic statement. The dimension of the theory with respect to this field (defined in appendix 1 ) is then identical with the dimension of the set of curves corresponding to the theory. I shall discuss these relations with the help of the two statements q and s of section 36. (Our comparison of dimensions applies to statements with different predicates.) The hypothesis q — that all planetary orbits are circles — is three-dimensional: for its falsification at least four singular statements of the field are necessary, corresponding to four points of its graphic representation. The hypothesis s, that all planetary orbits are ellipses, is five-
dimensional, since for its falsification at least six singular statements are necessary, corresponding to six points of the graph. We saw in section 36 that q is more easily falsifiable than s: since all circles are ellipses, it was possible to base the comparison on the subclass relation. But the use of dimensions enables us to compare theories which previously we were unable to compare. For example, we can now compare a circle-hypothesis with a parabola-hypothesis (which is four dimensional). Each of the words 'circle', 'ellipse', 'parabola' denotes a class or set of curves; and each of these sets has the dimension d if d points are necessary
and sufficient to single out, or characterize, one particular curve of the set. In algebraic representation, the dimension of the set of curves depends upon the number of parameters whose values we may freely choose. We can therefore say that the number of freely determinable parameters of a set of curves by which a theory is represented is characteristic for the degree of falsifiability (or testability) of that theory. In connection with the statements q and s in my example I should
3 Cf. Menger, Dimensionstheorie, 1928, p. 81. *The conditions under which this theorem holds can be assumed to be always satisfied by the 'spaces' with which we are concerned here.
116 SOME STRUCTURAL COMPONENTS OF A THEORY OF EXPERIENCE
like to make some methodological comments on Kepler's discovery of
his laws.*1
I do not wish to suggest that the belief in perfection — the heuristic principle that guided Kepler to his discovery — was inspired, consciously or unconsciously, by methodological considerations regarding degrees of falsifiability. But I do believe that Kepler owed his success in part to the fact that the circle-hypothesis with which he started was relatively easy to falsify. Had Kepler started with a hypothesis which owing to its logical form was not so easily testable as the circle hypothesis, he might well have got no result at all, considering the difficulties of calculations whose very basis was 'in the air' — adrift in the skies, as it were, and moving in a way unknown. The unequivocal negative result which Kepler reached by the falsification of his circle hypothesis was in fact his first real success. His method had been vindicated sufficiently for him to proceed further; especially since even this first attempt had already yielded certain approximations.
No doubt, Kepler's laws might have been found in another way. But I think it was no mere accident that this was the way which led to success. It corresponds to the method of elimination which is applicable only if the theory is sufficiently easy to falsify — sufficiently precise to be capable of clashing with observational experience.
40 TWO WAYS OF REDUCING THE NUMBER OF DIMENSIONS OF A SET OF CURVES
Quite different sets of curves may have the same dimension. The set of all circles, for example, is three-dimensional; but the set of all circles passing through a given point is a two-dimensional set (like the set of straight lines). If we demand that the circles should all pass through two given points, then we get a one-dimensional set, and so on. Each additional demand that all curves of a set should pass through one more given point reduces the dimensions of the set by one.
The number of dimensions can also be reduced by methods other than that of increasing the number of given points. For example the set
*1 The views here developed were accepted, with acknowledgments, by W C. Kneale, Probability and Induction, 1949, p. 230, and J. G. Kemeny, 'The Use of Simplicity in Induction', Pliilos. Review 57, 1953; see his footnote on p. 404.
DECREES OF TESTABILITY 1
of ellipses with given ratio of the axes is four-dimensional (as is that of parabolas), and so is the set of ellipses with given numerical eccentricity. The transition from the ellipse to the circle, of course, is equivalent to specifying an eccentricity (the eccentricity 0) or a particular ratio of the axes (unity).
As we are interested in assessing degrees of falsifiability of theories we will now ask whether the various methods of reducing the number of dimensions are equivalent for our purposes, or whether we should examine more closely their relative merits. Now the stipulation that a curve should pass through a certain singular point (or small region) will often be linked up with, or correspond to, the acceptance of a certain singular statement, i.e. of an initial condition. on the other hand, the transition from, say, an ellipse-hypothesis to a circle-hypothesis, will obviously correspond to a reduction of the dimension of the theory itself.
1 We could also, of course, begin with the empty (over-determined) minus-one-
dimensional class.
118 SOME STRUCTURAL COMPONENTS OF A THEORY OF EXPERIENCE
But how are these two methods of reducing the dimensions to be kept apart? We may give the name 'material reduction' to that method of reducing dimensions which does not operate with stipulations as to the 'form' or 'shape' of the curve; that is, to reductions through specifying one or more points, for example, or by some equivalent specification. The other method, in which the form or shape of the curve becomes more narrowly specified as, for example, when we pass from ellipse to circle, or from circle to straight line, etc., I will call the method of 'formal reduction' of the number of dimensions.
It is not very easy, however, to get this distinction sharp. This may be seen as follows. Reducing the dimensions of a theory means, in algebraic terms, replacing a parameter by a constant. Now it is not quite clear how we can distinguish between different methods of replacing a parameter by a constant. The formal reduction, by passing from the general equation of an ellipse to the equation of a circle, can be described as equating one parameter to zero, and a second parameter to one. But if another parameter (the absolute term) is equated to zero, then this would mean a material reduction, namely the specification of a point of the ellipse. I think, however, that it is possible to make the distinction clear, if we see its connection with the problem of universal names. For material reduction introduces an individual name, formal reduction a universal name, into the definition of the relevant set of curves.
Let us imagine that we are given a certain individual plane, perhaps by 'ostensive definition'. The set of all ellipses in this plane can be defined by means of the general equation of the ellipse; the set of circles, by the general equation of the circle. These definitions are independent of where, in the plane, we draw the (Cartesian) co-ordinates to which they relate; consequently they are independent of the choice of the origin, and the orientation, of the co-ordinates. A specific system of coordinates can be determined only by individual names; say, by ostensively specifying its origin and orientation. Since the definition of the set of ellipses (or circles) is the same for all Cartesian co-ordinates, it is independent of the specification of these individual names: it is invariant with respect to all co-ordinate transformations of the Euclidean group (displacements and similarity transformations).
If, on the other hand, one wishes to define a set of ellipses (or circles) which have a specific, an individual point of the plane in
DECREES OF TESTABILITY 1
common, then we must operate with an equation which is not invariant with respect to the transformations of the Euclidean group, but relates to a singular, i.e. an individually or ostensively specified, co-ordinate system. Thus it is connected with individual names.2
The transformations can be arranged in a hierarchy. A definition which is invariant with respect to a more general group of transformations is also invariant with respect to more special ones. For each definition of a set of curves, there is one — the most general —transformation group which is characteristic of it. Now we can say: The definition D1, of a set of curves is called 'equally general' to (or more general than) a definition D2 of a set of curves if it is invariant with respect to the same transformation group as is D2 (or a more general one). A reduction of the dimension of a set of curves may now be called formal if the reduction does not diminish the generality of the definition; otherwise it may be called material.
If we compare the degree of falsifiability of two theories by considering their dimensions, we shall clearly have to take into account their generality, i.e. their invariance with respect to co-ordinate transformations, along with their dimensions.
The procedure will, of course, have to be different according to whether the theory, like Kepler's theory, in fact makes geometrical statements about the world or whether it is 'geometrical' only in that it may be represented by a graph — such as, for example, the graph which represents the dependence of pressure upon temperature. It would be inappropriate to require of this latter kind of theory, or of the corresponding set of curves, that its definition should be invariant with respect to, say, rotations of the co-ordinate system; for in these cases, the different co-ordinates may represent entirely different things (the one pressure and the other temperature).
This concludes my exposition of the methods whereby degrees of falsifiability are to be compared. I believe that these methods can help us to elucidate epistemological questions, such as the problem of simplicity which will be our next concern. But there are other problems which
2 on the relations between transformation groups and 'individualization' cf. Weyl,
Philosophic der Matliematik u. Naturwissenschaft, 1927, p. 59, English edition pp. 73 f., where reference is made to Klein's Erlanger Programm.
SOME STRUCTURAL COMPONENTS OF A THEORY OF EXPERIENCE
are placed in a new light by our examination of degrees of falsifiability, as we shall see; especially the problem of the so-called 'probability of hypotheses' or of corroboration.
Addendum, 1972
One of the more important ideas of this book is that of the (empirical, or informative) content of a theory. ('Not for nothing do we call the laws of nature "laws": the more they prohibit, the more they say.' Cp. pp. 1 8-1 9 above, and pp. 95 f.)
Two points were stressed by me in the preceding chapter: ( 1 ) The content or the testability (or the simplicity: see ch. vii) of a theory may have degrees, which may thus be said to relativize the idea of falsifiability (whose logical basis remains the modus tollens) . (2) The aim of science — the growth of knowledge — can be identified with the growth of the content of our theories. (See my paper 'The Aim of Science', in Ratio I, 1957, pp. 24-35 and (revised) in Contemporary Philosophy, ed. R. Klibansky, 1969, pp. 129-142; now also Chapter 5 of my book Objective Knowledge: An Evolutionary Approach, which is forthcoming at the Clarendon Press.)
More recently I have developed these ideas further; see especially ch. 1 of my Conjectures and Refutations, 1963 and later editions (with the new Addenda). Two of the new points are: (3) A further relativization of the idea of content or testability with respect to the problem, or set of problems, under discussion. (Already in 1934 I relativized these ideas with respect to a field of application; see my old Appendix i.) (4) The introduction of the idea of the truth content of a theory and of its approximation or nearness to truth ('verisimilitude').
'칼포퍼 원전+번역문' 카테고리의 다른 글
과학적 발견의 논리, II부 8장 확률 (0) | 2017.10.08 |
---|---|
과학적 발견의 논리, II부 7장 단순성 (0) | 2017.07.03 |
과학적 발견의 논리, II부 5장 경험적 근거라는 문제 (0) | 2017.06.11 |
과학적 발견의 논리 II부, 3장 및 4장 (0) | 2017.05.06 |
과학적 발견의 논리, I부 과학의 논리에 대한 서론 (2016년 12월 수정본) (0) | 2016.12.29 |